Moderne metoder til informationssøgning. Som et resultat dannes en liste over informationsressourcer. Dette trin giver dig mulighed for at oprette et personligt informationssystem, der har til formål at løse et specifikt søgeproblem. Essensen af denne metode er at anvende

1. Introduktion

Hvert år stiger mængden af internettet mange gange, så sandsynligheden for at finde den nødvendige information stiger dramatisk. Internettet forener millioner af computere, mange forskellige netværk, antallet af brugere stiger med 15-80% årligt. Og ikke desto mindre, oftere og oftere, når du får adgang til internettet, er hovedproblemet ikke manglen på den nødvendige information, men evnen til at finde den. Som regel kan eller ønsker en almindelig person på grund af forskellige omstændigheder ikke at bruge mere end 15-20 minutter på at søge efter det svar, han har brug for. Derfor er det især vigtigt at lære korrekt og kompetent, ser det ud til, en simpel ting - hvor og hvordan man skal kigge for at få de ØNSKEDE svar.

For at finde de oplysninger, du har brug for, skal du finde dens adresse. Til dette er der specialiserede søgeservere (indeksrobotter (søgemaskiner), tematiske internetmapper, meta-søgesystemer, personsøgningstjenester osv.). Denne mesterklasse afslører de vigtigste teknologier til at søge information på internettet, giver fælles funktioner i søgeværktøjer, undersøger strukturen af søgeforespørgsler for de mest populære russisksprogede og engelsksprogede søgemaskiner.

2. Søgeteknologier

Web-teknologi World Wide Web (WWW) betragtes som en særlig teknologi til udarbejdelse og placering af dokumenter på internettet. WWW inkluderer websider, elektroniske biblioteker, kataloger og endda virtuelle museer! Med sådan en overflod af information opstår spørgsmålet skarpt: "Hvordan navigerer man i et så stort og storstilet informationsrum?"
Søgeværktøjer kommer til undsætning ved at løse dette problem.

2.1 Søgeværktøjer

Søgeværktøjer er speciel software, hvis hovedformål er at levere den mest optimale og højkvalitets informationssøgning til internetbrugere. Søgeværktøjer hostes på specielle webservere, som hver især udfører en bestemt funktion:

Analyse af websider og indtastning af resultaterne af analysen til et eller andet niveau af søgeserverdatabasen.
Søg efter information på brugerens anmodning.
Tilvejebringelse af en brugervenlig grænseflade til at søge information og se søgeresultatet af brugeren.

De arbejdsmetoder, der bruges, når man arbejder med disse eller andre søgeværktøjer, er næsten de samme. Inden du fortsætter med at diskutere dem, skal du overveje følgende begreber:

Søgeværktøjets grænseflade er præsenteret som en side med hyperlinks, en forespørgselsstreng (søgestreng) og forespørgselsaktiveringsværktøjer.
Søgemaskineindekset er en informationsbase, der indeholder resultatet af analysen af websider, udarbejdet efter bestemte regler.
En forespørgsel er et søgeord eller en sætning, som brugeren indtaster i søgefeltet. Specialtegn ("", ~), matematiske symboler (*, +, ?) bruges til at danne forskellige forespørgsler.

Ordningen for at søge information på internettet er enkel. Brugeren indtaster en nøglesætning og aktiverer søgningen og modtager derved et udvalg af dokumenter i henhold til den formulerede (givne) anmodning. Denne liste over dokumenter er rangeret efter bestemte kriterier, så øverst på listen er de dokumenter, der bedst matcher brugerens forespørgsel. Hvert af søgeværktøjerne bruger forskellige kriterier til rangering af dokumenter, både i analysen af søgeresultater og i dannelsen af indekset (udfylder indeksdatabasen over websider).

Hvis du angiver en forespørgsel af samme design i søgestrengen for hvert søgeværktøj, kan du således få forskellige søgeresultater. For brugeren er det af stor betydning, hvilke dokumenter der vil optræde i de første to eller tre dusin dokumenter i henhold til søgeresultaterne, og i hvilket omfang disse dokumenter svarer til brugerens forventninger.

De fleste søgeværktøjer tilbyder to måder at søge på − simpel søgning(simpel søgning) og Avanceret søgning(avanceret søgning) med og uden en særlig anmodningsformular. Lad os overveje begge typer søgning på eksemplet med en engelsksproget søgemaskine.

For eksempel er AltaVista nyttig til vilkårlige forespørgsler, "Noget om online grader i informationsteknologi", mens Yahoo-søgeværktøjet giver dig mulighed for at få verdensnyheder, valutakursoplysninger eller vejrudsigter.

tabel 1

En simpel forespørgsel giver en række links til dokumenter, fordi listen omfatter dokumenter, der indeholder et af de ord, der er indtastet på anmodningen, eller en simpel sætning (se tabel 1). Operatoren og giver dig mulighed for at angive, at alle nøgleord skal inkluderes i dokumentindholdet. Antallet af dokumenter kan dog stadig være stort, og det kan tage lang tid at gennemgå dem. Derfor er det i nogle tilfælde meget mere bekvemt at bruge nær kontekst-operatoren, som angiver, at ordene skal være placeret i dokumentet i tilstrækkelig nærhed. Brug af nær reducerer i høj grad antallet af fundne dokumenter. Tilstedeværelsen af symbolet "*" i forespørgselsstrengen betyder, at ordet søges efter dets maske. Lad os f.eks. få en liste over dokumenter, der indeholder ord, der starter med "gov", hvis vi skriver "gov*" i forespørgselsstrengen. Det kan være ordene regering, guvernør osv.

Den lige så populære søgemaskine Rambler vedligeholder statistik over linktrafik fra sin egen database, de samme logiske operatorer OG, ELLER, IKKE, metategn * (svarende til tegnet * i AltaVista, der udvider forespørgselsområdet), koefficientsymboler + og - er understøttet til at øge eller mindske betydningsord indtastet i forespørgslen.

Lad os se på de mest populære informationssøgningsteknologier på internettet.

2.2 Søgemaskiner

Websøgemaskiner er servere med en enorm database af URL'er, der automatisk får adgang til WWW-sider på alle disse adresser, undersøger indholdet af disse sider, danner og skriver nøgleord fra siderne ind i deres database (indekssider).

Desuden følger søgemaskinerobotter de links, de støder på på siderne, og genindekserer dem. Da næsten enhver WWW-side har mange links til andre sider, kan søgemaskinen i slutresultatet teoretisk omgå alle websteder på internettet.

Det er denne type søgeværktøjer, der er den mest berømte og populære blandt alle internetbrugere. Alle kender navnene på velkendte websøgemaskiner (søgemaskiner) - Yandex, Rambler, Aport.

For at bruge denne type søgeværktøj skal du gå til det og skrive i søgefeltet det søgeord, du er interesseret i. Dernæst vil du modtage et output fra de links, der er gemt i søgemaskinedatabasen, der er tættest på din forespørgsel. For at gøre søgningen mest effektiv skal du være opmærksom på følgende punkter på forhånd:

tage stilling til emnet for anmodningen. Hvad ender du med at lede efter?
være opmærksom på sprog, grammatik, brug af forskellige ikke-alfabetiske tegn, morfologi Det er også vigtigt at formulere og indtaste nøgleord korrekt. Hver søgemaskine har sin egen form for anmodning - princippet er det samme, men de anvendte symboler eller operatorer kan være forskellige. De påkrævede anmodningsformularer varierer også afhængigt af kompleksiteten af søgemaskinesoftwaren og de tjenester, de leverer. På den ene eller anden måde har hver søgemaskine et afsnit "Hjælp" ("Hjælp"), hvor alle syntaksreglerne samt anbefalinger og tips til søgning er forklaret på en tilgængelig måde (skærmbillede af søgemaskinesider).
bruge mulighederne i forskellige søgemaskiner. Hvis du ikke kan finde det på Yandex, så prøv Google. Brug avancerede søgetjenester.
for at udelukke dokumenter, der indeholder visse termer, skal du bruge tegnet "-" før hvert sådant ord. For eksempel, hvis du ønsker information om Shakespeares værker, med undtagelse af "Hamlet", så indtast forespørgslen i formen: "Shakespeare-Hamlet". Og for at sikre, at visse links nødvendigvis er inkluderet i søgeresultaterne, skal du bruge "+"-symbolet. Så for at finde links om salg af biler specifikt, skal du bruge forespørgslen "udsalg + bil". For at øge effektiviteten og nøjagtigheden af din søgning, brug kombinationer af disse tegn.
hvert link i listen over søgeresultater indeholder - flere linjer fra det fundne dokument, blandt hvilke der er dine søgeord. Før du klikker på linket, skal du vurdere uddragets relevans for emnet for anmodningen. Når du har klikket på linket til et bestemt websted, skal du omhyggeligt se dig omkring på hovedsiden. Som regel er den første side nok til at forstå, om du er kommet til adressen eller ej. Hvis ja, så foretag yderligere søgninger efter de nødvendige oplysninger på det valgte websted (i sektioner af webstedet), hvis ikke, vend tilbage til søgeresultaterne og prøv det næste link.
husk, at søgemaskiner ikke producerer uafhængig information (bortset fra forklaringer om dem selv). Søgemaskinen er kun et mellemled mellem ejeren af informationen (hjemmesiden) og dig. Databaserne bliver løbende opdateret, nye adresser indtastes i dem, men efterslæbet fra de oplysninger, der reelt findes i verden, er stadig tilbage. Simpelthen fordi søgemaskinerne ikke fungerer med lysets hastighed.

De mest berømte websøgemaskiner omfatter Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Blandt de russisktalende kan man fremhæve Yandex, Rambler, Aport.

Søgemaskiner er de største og mest værdifulde, men langt fra de eneste informationskilder på nettet, fordi der er andre måder at søge på internettet udover dem.

2.3 Mapper

Kataloget over internetressourcer er et konstant opdateret og genopfyldt hierarkisk katalog, der indeholder mange kategorier og individuelle webservere med en kort beskrivelse af deres indhold. Katalogsøgningsmetoden indebærer "at gå ned ad trinene", det vil sige at gå fra mere generelle kategorier til mere specifikke. En af fordelene ved tematiske mapper er, at forklaringerne til linkene er givet af skaberne af mappen og fuldt ud afspejler dets indhold, det vil sige, det giver dig mulighed for mere præcist at bestemme, hvordan indholdet på serveren svarer til formålet af din søgning.

Et eksempel på et tematisk russisk-sproget katalog er ressourcen http://www.ulitka.ru/.

På hovedsiden af dette websted er der en tematisk rubrikator,

ved hjælp af hvilken brugeren indtaster rubrikken med links til de produkter, der interesserer ham.

Derudover giver nogle emnemapper dig mulighed for at søge på nøgleord. Brugeren indtaster det ønskede søgeord i søgefeltet

og modtager en liste over links med beskrivelser af websteder, der bedst matcher hans anmodning. Det skal bemærkes, at denne søgning ikke finder sted i indholdet af WWW-servere, men i deres korte beskrivelse gemt i biblioteket.

I vores eksempel har biblioteket også mulighed for at sortere websteder efter antallet af besøg, alfabetisk, efter dato for indtastning.

Andre eksempler på russisksprogede mapper:
[email protected]
Webliste
Vsego.ru
Blandt de engelsksprogede mapper er:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 Samlinger af links

Linksamlinger er links sorteret efter emne. De er indholdsmæssigt ret forskellige fra hinanden, så for at finde et udvalg, der passer bedst til dine interesser, skal du selv gennemgå dem for at danne dig din egen mening.

Som et eksempel vil vi give et udvalg af links "Treasures of the Internet" JSC "Relcom"

Brugeren ved at klikke på en af de sektioner, der interesserer ham

INDHOLD

For bilister

Astronomi og astrologi
Dit hus
Dine kæledyr
Børn er livets blomster
Fritid
Byer på internettet
Sundhed og medicin
Informationsbureauer og -tjenester
Museum for lokal viden osv.,

Bilelektronik.
Antik Automotive Museum.
Nævnet for Retsbeskyttelse af Bilejere.
sportdrive.

Fordelen ved denne type søgeværktøjer er deres fokus, normalt omfatter udvalget sjældne internetressourcer, udvalgt af en bestemt webmaster eller ejer af en webside.

2.5 Adressedatabaser

Adressedatabaser er specielle søgeservere, der normalt bruger klassifikationer efter type aktivitet, efter leverede produkter og tjenester og efter geografi. Nogle gange suppleres de med en alfabetisk søgning. Databaseposterne gemmer oplysninger om websteder, der giver oplysninger om e-mailadresse, organisation og postadresse mod et gebyr.

Den største engelsksprogede adressedatabase kan kaldes: http://www.lookup.com/ -

Når brugeren kommer ind i disse undermapper, finder han links til websteder, der tilbyder information af interesse for ham.

Bredt tilgængelige og officielle databaser med adresser i Den Russiske Føderation er ukendte for os.

2.6 Søgning i Gopher-arkiver

Gopher er et sammenkoblet system af servere (Gopher space) distribueret over internettet.

Det rigeste litterære bibliotek er samlet i Gopher-rummet, men materialerne er ikke tilgængelige for fjernvisning: Brugeren kan kun se den hierarkisk organiserede indholdsfortegnelse og vælge en fil efter titel. Ved hjælp af et særligt program (Veronica) kan en sådan søgning foretages automatisk ved hjælp af forespørgsler baseret på søgeord.

Indtil 1995 var Gopher den mest dynamiske internetteknologi: vækstraten i antallet af relaterede servere oversteg vækstraten for servere til alle andre typer internet. I EUnet/Relcom-netværket har Gopher-servere ikke fået aktiv udvikling, og i dag er der næsten ingen, der husker dem.

2.7 FTP-filsøgningssystem (FTP-søgning)

En FTP-filsøgemaskine er en speciel type internetsøgemaskine, der giver dig mulighed for at finde filer, der er tilgængelige på "anonyme" FTP-servere. FTP-protokollen er designet til at overføre filer over et netværk, og i denne forstand er den funktionelt en slags analog af Gopher.

Det primære søgekriterium er filnavnet angivet på forskellige måder (eksakt match, understreng, regulært udtryk osv.). Denne type søgning kan naturligvis ikke konkurrere med søgemaskiner med hensyn til muligheder, da indholdet af filer ikke tages i betragtning på nogen måde under søgningen, og filer, som du ved, kan få vilkårlige navne. Men hvis du har brug for at finde et velkendt program eller standardbeskrivelse, så vil filen, der indeholder det, med stor sandsynlighed have det passende navn, og du kan finde den ved at bruge en af FTP-søgeserverne:

FileSearch søger efter filer på FTP-servere efter navnene på selve filerne og mapper. Hvis du leder efter et program eller andet, så finder du på WWW-servere højst sandsynligt deres beskrivelse, og fra FTP-servere kan du downloade dem til dig selv.

2.8 Søgemaskine i Usenet-nyhedskonferencer

USENET NEWS er internetfællesskabets telekonferencesystem. I Vesten kaldes denne tjeneste nyheder. En nær analog af telekonferencer er de såkaldte "ekkoer" i FIDO-netværket.

Fra en telekonferenceabonnents synspunkt er USENET en opslagstavle, der har sektioner, hvor du kan finde artikler om alt fra politik til havearbejde. Denne opslagstavle er tilgængelig via en computer, ligesom e-mail. Uden at forlade din computer kan du læse eller poste artikler til en bestemt konference, finde nyttige råd eller deltage i diskussioner. Naturligvis optager artikler plads på computere, så de opbevares ikke for evigt, men bliver periodisk ødelagt, hvilket giver plads til nye. På verdensplan er den bedste service til at finde information i Usenet-konferencer Google Groups-serveren (Google Inc.).

Google Groups er et gratis online fællesskab og en diskussionsgruppetjeneste, der tilbyder det største arkiv af Usenet-meddelelser på internettet (mere end en milliard meddelelser). For mere information om vilkårene for brug af tjenesten, besøg venligst http://groups. google.com/intl/ru /googlegroups/tour/index.html

Blandt de russisktalende skiller USENET World System-serveren og Relcom-telekonferencer sig ud. Ligesom i andre søgetjenester, skriver brugeren en forespørgselsstreng, og serveren genererer en liste over konferencer, der indeholder nøgleord. Dernæst skal du abonnere på de udvalgte konferencer i nyhedsprogrammet. Der er også en lignende russisk FidoNet Online-server: Fido-konferencer på WWW.

2.9 Meta søgesystemer

For en hurtig søgning i flere søgemaskiners databaser på én gang er det bedre at henvende sig til meta-søgesystemer.

Meta-søgemaskiner er søgemaskiner, der sender din forespørgsel til et stort antal forskellige søgemaskiner, derefter behandler resultaterne, fjerner duplikerede ressourceadresser og præsenterer et bredere udvalg af det, der præsenteres på internettet.

Verdens mest populære meta-søgemaskine er Search.com.

Unified Search.com søgemaskine fra CNET, Inc. omfatter næsten to dusin søgemaskiner, hvortil links er fyldt med hele internettet.

Ved at bruge denne type søgeværktøjer kan brugeren søge efter information i en række forskellige søgemaskiner, men den negative side af disse systemer kan kaldes deres ustabilitet.

2.10 Personsøgningssystemer

Personsøgningssystemer er specielle servere, der giver dig mulighed for at søge efter personer på internettet, brugeren kan angive det fulde navn. person og få deres e-mailadresse og URL. Det skal dog bemærkes, at folks søgemaskiner generelt tager information om e-mail-adresser fra åbne kilder, såsom Usenet-fora. Blandt de mest berømte personsøgningssystemer er:

At finde e-mailadresser

i særlige søgefelter for kontaktoplysninger (Fornavn. By, Efternavn, Telefonnummer), kan du finde de oplysninger, du er interesseret i.

Personsøgemaskiner er virkelig store servere, deres databaser indeholder omkring 6.000.000 adresser.

3. Konklusion

Vi gennemgik de vigtigste teknologier til at søge information på internettet og præsenterede i generelle vendinger de søgeværktøjer, der i øjeblikket findes på internettet, såvel som strukturen af søgeforespørgsler til de mest populære russisksprogede og engelsksprogede søgemaskiner, og, sammenfattende ovenstående, vil vi bemærke, at en enkelt optimal ordning, der søger efter information på internettet, ikke eksisterer. Afhængigt af de specifikke oplysninger, du har brug for, kan du bruge de relevante søgeværktøjer og -tjenester. Og kvaliteten af søgeresultaterne afhænger af, hvor kompetent søgetjenesterne er udvalgt.

Søgeteknologier

Friktionslovene og varme- og masseoverførsel i et turbulent grænselag

Der er flere versioner af repræsentationen af ''friktionsloven'' (for referencetilfældet), hvilket fører til næsten identiske resultater. I overensstemmelse med konceptet om et ''logaritmisk' grænselag (med værdien af den første turbulenskonstant χ = 0,4) friktionsloven for en ekstremt udviklet turbulens med ''forsvindende viskositet'' er godt tilnærmet med en simpel Karman-formel:

Med en power-lov repræsentation af hastighedsprofilen bør formlen foreslås:

hvor: ; n er eksponenten for hastighedsprofilen;

– semi-empirisk koefficient;

MEN– empirisk koefficient;

δ er tykkelsen af grænselaget.

Brug af relationerne for Reynolds-tal bygget på forskellige lineære størrelser:

Det er vigtigt at bemærke, at i tilfælde af udvikling af et turbulent grænselag fra forkanten ( x cr = 0) friktionsloven skal også repræsenteres som:

Værdierne af de parametriske værdier af de præsenterede formler for forskellige hastighedsprofiler er opsummeret i tabellen

Parameter	n
1/7	1/8	1/9	1/10
MEN	8,74	9,71	10,6	11,5
	0,0975	0,089	0,0818	0,0757
	1,28	1,25	1,22	1,20
m	0,250	0,222	0,200	0,182
B	0,0252	0,0206	0,0190	0,0148
m 1	0,200	0,182	0,167	0,154
B1	0,0576	0,0450	0,0362	0,0308

Andre former for repræsentation af friktionsloven er også kendt og brugt, hvilket fører til praktisk talt de samme resultater. Så V.M. Ievlev foreslog en tilnærmelse:

Formlerne for lovene om varme og masseoverførsel er hentet fra ''friktionslovene'' for standardbetingelser (referencetilfælde) ved hjælp af det velkendte princip i Reynolds' tredobbelte analogi.

hvor: S– korrektionsfaktor – Reynolds analogifaktor for manglende overholdelse af betingelserne i standarden(erne), faktor S i den første tilnærmelse er tilfredsstillende tilnærmet af relationen:

Det er vigtigt at bemærke, at i tilfælde af brug af integrale parametre er ''lovene' for varme- og masseoverførsel godt beskrevet af afhængighederne:

Web-teknologi World Wide Web (WWW) betragtes som en særlig teknologi til udarbejdelse og placering af dokumenter på internettet. WWW inkluderer websider, elektroniske biblioteker, kataloger og endda virtuelle museer! Med sådan en overflod af information opstår spørgsmålet skarpt: ''Hvordan navigerer man i et så stort og storstilet informationsrum -'' Søgeværktøjer kommer til undsætning for at løse dette problem.

1. Analyse af websider og indtastning af resultaterne af analysen på et eller andet niveau af søgeserverens database.

2. Søg efter information efter anmodning fra brugeren.

3. Tilvejebringelse af en brugervenlig grænseflade til at søge efter information og se søgeresultatet af brugeren.

De arbejdsmetoder, der bruges, når man arbejder med disse eller andre søgeværktøjer, er næsten de samme. Inden du fortsætter med at diskutere dem, skal du overveje følgende begreber:

1. Søgeværktøjets grænseflade er præsenteret som en side med hyperlinks, en forespørgselsstreng (søgestreng) og forespørgselsaktiveringsværktøjer.

2. Søgemaskineindeks - ϶ᴛᴏ informationsbase, der indeholder resultatet af analysen af websider, kompileret efter visse regler.

3. Forespørgsel - ϶ᴛᴏ søgeord eller sætning, som brugeren indtaster i søgefeltet. Specialtegn ("", ~), matematiske symboler (*, +, -) bruges til at danne forskellige forespørgsler.

Informationssøgningsordningen er enkel. Brugeren indtaster en nøglesætning og aktiverer søgningen og modtager derved et udvalg af dokumenter i henhold til den formulerede (givne) anmodning. Denne liste over dokumenter er rangeret efter bestemte kriterier, så øverst på listen er de dokumenter, der bedst matcher brugerens forespørgsel. Hvert af søgeværktøjerne bruger forskellige kriterier til rangering af dokumenter, både i analysen af søgeresultater og i dannelsen af indekset (udfylder indeksdatabasen over websider).

Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, hvis du angiver den samme forespørgsel i søgestrengen for hvert søgeværktøj, kan du få forskellige søgeresultater. For brugeren er det af stor betydning, hvilke dokumenter der vil optræde i de første to eller tre dusin dokumenter i henhold til søgeresultaterne, og i hvilket omfang disse dokumenter svarer til brugerens forventninger.

For eksempel er AltaVista nyttig til vilkårlige forespørgsler, ''Noget om online grader i informationsteknologi'', mens Yahoos søgeværktøj giver dig mulighed for at få verdensnyheder, valutakursoplysninger eller vejrudsigten.

At mestre kriterierne for at forfine forespørgslen og avancerede søgeteknikker giver dig mulighed for at øge effektiviteten af søgningen og hurtigt finde den nødvendige information. Først og fremmest kan du øge søgeeffektiviteten ved at bruge logiske operatorer (operationer) eller, og, tæt på, ikke, matematiske og specielle symboler i forespørgsler. Ved hjælp af operatorer og/eller symboler linker brugeren nøgleordene i den ønskede rækkefølge for at få det mest passende søgeresultat til forespørgslen. En simpel forespørgsel returnerer et lille antal links til dokumenter, fordi listen omfatter dokumenter, der indeholder et af de ord, der er indtastet på anmodningen, eller en simpel sætning (se tabel 1). Operatoren og giver dig mulighed for at angive, at alle nøgleord skal inkluderes i dokumentindholdet. Antallet af dokumenter bør dog stadig være stort, og det vil tage en del tid at gennemgå dem. Af denne grund er det i nogle tilfælde meget mere praktisk at bruge nær kontekst-operatoren, som angiver, at ordene skal være placeret i tilstrækkelig nærhed i dokumentet. Brug af nær reducerer i høj grad antallet af fundne dokumenter. Tilstedeværelsen af symbolet "*" i forespørgselsstrengen betyder, at ordet søges efter dets maske. Lad os f.eks. få en liste over dokumenter, der indeholder ord, der starter med "gov", hvis vi skriver "gov*" i forespørgselsstrengen. Det er ordene regering, guvernør osv.

Den mest udviklede søgetjeneste til russisksproget information leveres af Yandex-søgeserveren. I Yandex kan du simpelthen skrive på russisk en sætning, der beskriver, hvad du vil finde, og systemet vil analysere og behandle din anmodning og derefter prøve at finde alt, der vedrører et givet emne. Du kan ved hjælp af specielle operatorer sammensætte en streng, der forklarer søgemaskinen, hvad dine krav skal være til den information, du er interesseret i. Nogle af Yandex-forespørgselssprogoperatørerne kan findes her: http://help.yandex.ru/search/ -id=481939

Den lige så populære søgemaskine Rambler vedligeholder statistik over linktrafik fra sin egen database, de samme logiske operatorer OG, ELLER, IKKE, meta-tegnet * (svarende til tegnet * i AltaVista, der udvider forespørgselsområdet), koefficientsymboler + og -, at øge eller reducere betydningen af de ord, der indtastes i forespørgslen.

Lad os se på de mest populære informationssøgningsteknologier på internettet.

Emne 3 Arbejde med internetsøgemaskiner

Efter at have studeret dette emne, vil du lære og gentage:

Hvad er søgeservere til?
- udnævnelse af hoveddelene af søgeservere;
- hvilke typer informationssøgning findes på internettet;
- de grundlæggende regler for generering af en anmodning i Yandex-søgemaskinen.

Søg efter URL'er

Den hurtigste og mest pålidelige måde at finde information på internettet på er at søge efter URL'er. Mange af dem er givet i trykte publikationer, særlige opslagsværker, høres i luften på populære radiostationer og fra tv-skærme.

♦ Zenit fodboldklubfans kender adressen www.fc-zenit.ru udenad.
♦ Fans af gruppen "Korol i Shut" er godt klar over den officielle side for denne gruppe www.korol.spb.ru.
♦ Fans af NTV-kanalen kan nemt finde dens hjemmeside på www.ntv.ru. For hurtig adgang til ovenstående ressourcer skal du blot starte et browserprogram, såsom Internet Explorer, og indtaste en velkendt URL i adresselinjen.

Søgemaskiner

Der er en enorm mængde dokumenter på internettet. For at lette søgningen efter den nødvendige information oprettes specielle søgemaskiner.

søgemaskiner- Det er automatiske systemer, der poller servere, der er tilsluttet det globale netværk, og gemmer information om de data, der er tilgængelige på serverne, i deres database. Ifølge en særligt formuleret anmodning giver søgemaskiner information om, hvor du kan få de nødvendige data.

Som regel består søgemaskiner af tre dele: robot-, indeks- og anmodningsbehandlingsprogram.

♦ Robot (edderkop, robot eller bot) er et program, der besøger websider og læser (helt eller delvist) deres indhold. Søgemaskinerobotter adskiller sig i deres individuelle skema til at analysere indholdet af en webside.
♦ Søgemaskineindeks- dette er et lager af søgebilleder besøgt af robotsider. Søgebilledet af et dokument (inklusive en webside) er en beskrivelse af dokumentets indhold på et særligt informationssøgningssprog. Denne beskrivelse indeholder koder for dokumentets nøgleord, som afspejler dets betydning og indhold. Indeksene i hver søgemaskine er forskellige i mængden og måden, hvorpå information opbevares. De førende søgemaskiners databaser gemmer information om titusinder af dokumenter, og deres indeksvolumener er hundredvis af gigabyte. Indekser opdateres og suppleres med jævne mellemrum, så resultaterne af arbejdet i én søgemaskine med den samme forespørgsel kan variere, hvis søgningen blev udført på forskellige tidspunkter.

♦ Request handler er et program, der i overensstemmelse med brugerens anmodning "søger" indekset for tilstedeværelsen af de nødvendige oplysninger og returnerer links til de fundne dokumenter. Sættet af links ved systemets output fordeles af programmet i faldende rækkefølge efter relevans y, det vil sige fra den højeste grad af matchning af linket til anmodningen til den laveste.

I øjeblikket er de mest populære for russiske internetbrugere tre store søgemaskiner af indekstype:

Disse systemer tager højde for de grammatiske træk ved det russiske sprog, så resultaterne af deres søgning i russisksprogede ressourcer er af højere kvalitet end i vestlige systemer.

Søgemaskiner er forskellige i dækningen af informationsressourcer:

♦ generelle søgemaskiner har en database inden for alle vidensområder og er kendetegnet ved et omfattende indeks og en stor mængde akkumuleret information;
♦ Særlige søgemaskiner søger kun efter websteder med specifikke emner, såsom musik- eller museumssider.

De vigtigste egenskaber ved søgemaskiner er:

♦ mængden af dokumenter i indekset;
♦ hyppigheden af opdatering af information;
♦ det informationsrum, som søgemaskinerobotten dækker, og de mange forskellige typer dokumenter, som oplysningerne indsamles om;
♦ anmodningsbehandlingshastighed;
♦ kriterium for bestemmelse af relevans (korrespondance mellem det fundne dokument og søgeforespørgslen);
♦ muligheden for at uddybe og præcisere anmodningen.

Søg efter rubricator af søgemaskinen

Søgemapper er en systematisk samling (udvalg) af links til andre internetressourcer. Links er organiseret i form af en tematisk rubrikator, som er en hierarkisk struktur, der bevæger sig langs, som du kan finde den information, du har brug for.

Lad os som et eksempel give strukturen af Yandex-søgningsinternetkataloget. Dette er et bibliotek til generelle formål, da det indeholder links til internetressourcer i næsten alle mulige retninger. Dette katalog indeholder følgende emner:

♦ Erhverv og økonomi;
♦ Referencer og links;
♦ Samfund og politik;
♦ Hjem og familie;
♦ Videnskab og uddannelse;
♦ Underholdning og rekreation;
♦ Computere og kommunikation;
♦ Kultur og kunst.

Hvert emne indeholder mange underafsnit, og disse indeholder igen rubrikker og så videre.

Antag, at du forbereder en begivenhed til Victory Day og vil søge på internettet efter ordene fra Bulat Okudzhavas berømte militærsang "Du hører støvlerne rumle." Søgningen kan organiseres som følger: Yandex Catalog Kultur og kunst Musikforfatterens sang.

Denne søgemetode er ret hurtig og effektiv. I slutningen tilbydes du kun 5 links, blandt hvilke der er links til websteder med sange fra berømte barder. Det er kun at finde på webstedet et arkiv med tekster af B. Okudzhava og vælge den ønskede tekst i den.

Et andet eksempel. Antag, at du skal købe en mobiltelefon og vil sammenligne egenskaberne for enheder fra forskellige virksomheder. Søgningen kan udføres under følgende katalogoverskrifter: Yandex Katalog Computere og kommunikation Mobilkommunikation Mobiltelefoner.

Efter at have modtaget et begrænset antal referencer, kan du hurtigt se dem og vælge en telefon ved at undersøge firmaets egenskaber og modifikationer af enhederne.

Søgeordssøgning

De fleste søgemaskiner har mulighed for at søge efter nøgleord. Dette er en af de mest almindelige søgetyper. For at søge efter nøgleord skal du indtaste et eller flere ord, der skal søges i, i et særligt vindue og klikke på knappen Søg. Søgemaskinen vil finde i sin database og vise dokumenter, der indeholder disse ord. Der kan være mange sådanne dokumenter, men meget i dette tilfælde betyder ikke nødvendigvis godt.

Lad os udføre nogle eksperimenter med nogen af søgemaskinerne. Antag, at vi beslutter os for at starte et akvarium, og vi er interesserede i enhver information om dette emne.

Ved første øjekast er det enkleste at søge efter ordet "akvarium". Lad os tjekke dette, for eksempel i Yandex-søgemaskinen. Søgeresultatet bliver over 460.000 sider fordelt på 3.500 sider - et enormt antal links. Desuden, hvis du ser nærmere efter, vil blandt dem være steder, der nævner B. Grebenshchikovs akvariegruppe, indkøbscentre og uformelle foreninger med samme navn, og meget mere, der ikke har noget at gøre med akvariefisk.

Det er let at gætte, at en sådan søgning ikke kan tilfredsstille selv den uhøjtidelige bruger. Der skal bruges for meget tid på at udvælge blandt alle de foreslåede dokumenter dem, der vedrører det emne, vi har brug for, og endnu mere på at lære deres indhold at kende.

Vi kan med det samme konkludere, at det normalt ikke er tilrådeligt at søge med ét ord, fordi det er meget svært at bestemme emnet for et dokument, en webside eller et websted med ét ord. Undtagelsen er sjældne ord og udtryk, der næsten aldrig bruges uden for deres fagområde.

Lad os prøve at afklare søgebetingelserne og indtaste sætningen "akvariefisk". Søgeresultatet bliver lidt over 20.000 sider og omkring 650 sider. Som du kan se, er antallet af links faldet mere end 20 gange. Dette resultat passer os mere, men alligevel kan du blandt de foreslåede links finde for eksempel russiske souvenirsæt med tændstiketiketter med billeder af fisk og samlinger af computerskærmskånere og kataloger over akvariefisk med fotos og akvarie tilbehørsbutikker.

Det er indlysende, at vi fortsat bør bevæge os i retning af at forfine søgeforholdene.

For at gøre søgningen mere produktiv har alle søgemaskiner et særligt søgesprog med sin egen syntaks. Disse sprog ligner på mange måder. Det er ret svært at lære dem alle, men enhver søgemaskine har et hjælpesystem, der giver dig mulighed for at mestre det ønskede sprog.

Her er ti enkle regler for generering af en anmodning i Yandex-søgemaskinen.

1. Nøgleord i forespørgslen skal skrives med små (små) bogstaver. Dette vil sikre, at alle søgeord bliver søgt, ikke kun dem, der starter med et stort bogstav.

2. Søgningen tager højde for alle former for ordet i henhold til reglerne for det russiske sprog, uanset formen af ordet i forespørgslen. For eksempel, hvis ordet "kend" blev angivet i forespørgslen, så vil ordene "kend", "kend" osv. også opfylde søgebetingelsen.

3. For at søge efter en stabil sætning skal du sætte ordene i anførselstegn, for eksempel "porcelænsfade".

4. For at søge på den nøjagtige ordform skal du sætte et udråbstegn foran ordet. For f.eks. at søge efter ordet "september" i genitiv kasus, ville du skrive "!September".

5. For at søge inden for en enkelt sætning er ordene i forespørgslen adskilt af et mellemrum eller tegn &: "eventyrroman" eller "eventyr og roman". Flere ord indtastet i forespørgslen, adskilt af mellemrum, betyder, at de alle skal indgå i én sætning i det dokument, der søges efter.

6. Hvis du kun vil vælge de dokumenter, hvor hvert ord angivet i forespørgslen forekommer, skal du sætte et plustegn "+" foran hvert af dem. Hvis du tværtimod vil udelukke nogle ord fra søgeresultatet, skal du sætte et minus "-" foran dette ord. Tegnene "+" og "-" skal skrives med et mellemrum fra det foregående og flettes sammen med det næste ord. Forespørgslen "Volga-bil" vil f.eks. finde dokumenter, der indeholder ordet "Volga" og ikke ordet "bil".

7. Når du søger efter synonymer eller ord, der er tæt på betydningen, kan du sætte en lodret streg "|" mellem ordene. For eksempel for forespørgslen "barn | barn | baby" vil finde dokumenter med et hvilket som helst af disse ord.

8. I stedet for et enkelt ord i en forespørgsel kan du erstatte et helt udtryk. For at gøre dette skal det stå i parentes, for eksempel "(barn | baby | børn | baby) + (omsorg | opdragelse)".

9. Tegnet *~" (tilde) giver dig mulighed for at finde dokumenter med en sætning, der indeholder det første ord, men ikke indeholder det andet. For eksempel vil søgningen "bøger ~ butik" finde alle dokumenter, der indeholder ordet "bøger", som ikke har ordet "butik" ved siden af sig (inden for sætningen).

10. Hvis operatoren gentages én gang (for eksempel & eller ~), udføres søgningen inden for sætningen. Dobbeltoperatoren (&&, -) søger i dokumentet. Forespørgslen "kræft - astrologi" vil f.eks. finde dokumenter med ordet "kræft", som ikke er relateret til astrologi.

Når du har et bestemt sæt af de mest almindelige udtryk i det ønskede område, kan du bruge avanceret søgning. På fig. 3.3 viser det avancerede søgevindue i Yandex-søgemaskinen. I denne tilstand implementeres forespørgselssprogets muligheder som en formular. En lignende tjeneste, inklusive ordbogsfiltre, tilbydes af næsten alle søgemaskiner.

Ris. 3.3. Et eksempel på en avanceret søgning i Yandex-systemet

Givet det korrekte valg af ønskelige og påkrævede ord og udelukkelse af uønskede termer, kan en sådan søgning give gode resultater.

Lad os gå tilbage til eksemplet med akvariefisk. Efter at have læst flere dokumenter, der tilbydes af søgemaskinen, bliver det klart, at søgningen efter information på internettet ikke bør begynde med valget af akvariefisk. Et akvarium er et komplekst biologisk system, hvis oprettelse og vedligeholdelse kræver særlig viden, tid og seriøse investeringer.

Baseret på de modtagne oplysninger kan en person, der udfører en søgning på internettet, radikalt ændre strategien for yderligere søgning og beslutte at studere den særlige litteratur relateret til det undersøgte spørgsmål.

For at søge efter litteratur eller fuldtekstdokumenter er følgende forespørgsel mulig:

Efter at have behandlet anmodningen af søgemaskinen, blev følgende resultat opnået: sider - 195, websteder - mindst 43.

Som det fremgår af søgestatistikken, var resultatet meget vellykket. Allerede de første links fører til de nødvendige dokumenter:

Akvarieopsætning > Tips til begyndere akvarister >
Artikler > Aq uascope. da
http://aquascope.ru/modules/wfsection/article.php?page=l&articleid=49 (32KB) - streng overholdelse.
RÅD TIL NYBEGYNDERNE AKVARIEMESTER. Sådan vælger og installerer du et akvarium, hvordan...
http://www.aquariums.ru/sovna.htm (2KB) 07/23/2002 - ikke-streng korrespondance.

Nu kan du opsummere resultaterne af søgningen, drage visse konklusioner og beslutte dig for mulige handlinger:

♦ Stop yderligere søgning, for af forskellige årsager er vedligeholdelsen af akvariet uden for din magt.
♦ Læs de foreslåede artikler og begynd at sætte et akvarium op.
♦ Søg efter materialer om hamstere eller undulater.

Professionel søgning

Forskere og specialister bliver nødt til at tage en mere gennemtænkt tilgang til tilrettelæggelsen af søgningen. Når du professionelt søger information på internettet, skal følgende krav være opfyldt:

♦ høj søgehastighed;
♦ pålideligheden af den modtagne information;
♦ fuldstændighed af dækning af ressourcer under søgningen.

Hastighed. Søgningens hastighed afhænger hovedsageligt af to faktorer: af kompetent søgeplanlægning (udvælgelse af søgetjenester og værktøjer) og færdigheder i at arbejde med en allerede udvalgt ressource (evnen til hurtigt at forstå dens struktur og navigationsmetoder). Søgeindekser er ikke nok til at sikre søgehastighed. Ud over dem er der en række søgeressourcer på internettet, hvis brug sikrer udførelsen af en professionel søgning.

Pålidelighed. Spørgsmålet om pålideligheden af information modtaget fra internettet er meget relevant, da enhver kan placere enhver information der uden nogen kontrol over dens overensstemmelse med virkeligheden. Dette fører til gengæld til en lang række upålidelige kilder, såsom abstracts og semesteropgaver, der har oversvømmet internettet.

Der er specielle søgetjenester, der giver dig mulighed for at evaluere pålideligheden af en informationskilde på internettet.

Fuldstændighed. En nødvendig forudsætning for en vellykket fuldskala-indsamling af information er viden om de vigtigste typer af ressourcer, der findes i dag, og brugen af forskellige søgetjenester. Ingen søgemaskine kan dække alle internettets ressourcer.

For at opnå et positivt resultat skal brugeren som regel ty til tjenester fra flere søgemaskiner. Du kan gøre det selv, flytte fra system til system, eller du kan overlade dette arbejde til en af metasøgemaskinerne (meta er den første komponent af sammensatte ord, der betegner systemer til at beskrive og undersøge andre systemer).

Ris. 3.4. Metasearch vinduer

Metasøgemaskiner har ikke deres egne søgedatabaser og bruger ressourcerne fra mange andre søgemaskiner, når de søger. På grund af dette er sandsynligheden for at finde den nødvendige information meget høj. Arbejde i metasøgningssystemer udføres efter samme regler som arbejde i søgemaskiner. Det skyldes, at metasøgemaskiner er en slags add-on til søgemaskiner og bruger deres indeksdatabaser i deres arbejde. Udseendet af metasøgemaskiner ligner udseendet af velkendte søgemaskiner. På fig. 3.4 viser vinduerne i metasøgemaskinerne myweb.ru og metabot.ru.

Erfaringen viser, at der i de fleste tilfælde opnås et bedre resultat ved at bruge flere uafhængige søgeindekser end ved at bruge én metasøgemaskine.

Styr spørgsmål og opgaver

1. Hvad er formålet med et browserprogram?

2. Hvilke browserprogrammer kender du?

3. Hvor kan en bruger, der planlægger en internetsøgning, finde URL'er?

4. Hvad er søgeteknologien for søgemaskinens rubricator?

5. Hvad er søgeordssøgningsteknologien?

6. Hvilke krav skal overholdes ved den professionelle informationssøgning på internettet?

7. Hvornår skal du angive tegnene "+" eller "-" i søgekriterierne?

8. Hvilke søgekriterier i Yandex er fastsat af følgende sætning:

(barnepige | lærer | guvernante) ++ (pleje | opdragelse | supervision).

9. Hvad betyder fordobling af tegnet (∼∼ eller ++), når der dannes en kompleks forespørgsel?

10. Hvad er søgerelevans?

11. Hvad er formålet med metasøgemaskiner?

Foredrag 4. Informationssøgningsværktøjer

Den konstante opdatering af informationsarrayet kombineret med stigningen i mængden af data gør det ekstremt vanskeligt at tage hensyn til de tilgængelige dokumenter og følgelig søgningen, som kan opdeles betinget i:

faktuel søgning:i encyklopædier, opslagsværker, ordbøger,
bibliografisk søgning:biblioteker, mapper, programmer.
dokumentsøgning:elektroniske dokumenter, elektroniske biblioteker, elektroniske tidsskrifter.

Vigtigheden af problemet med informationssøgning har ført til dannelsen af en hel industri, hvis opgave netop er at assistere brugeren med at navigere i cyberspace. Gør denne branche specielsøgetjenester eller tjenester. De er traditionelt opdelt i:

mapper eller kataloger
søgemaskiner

Disse sorter er visuelt meget ens, fordi"hver mappe har sin egen søgemaskine, og hver søgemaskine har sin egen mappe". Men principperne for deres arbejde er baseret på helt andre tilgange og teknologier. Derudover bruges hver type søgetjenester til at løse en bestemt type problem. Informationssøgning involverer brugen af bestemte strategier, metoder, mekanismer og værktøjer. Brugerens adfærd, der styrer søgeprocessen, bestemmes ikke kun af informationsbehovet, men også af systemets instrumentelle mangfoldighed - de teknologier og værktøjer, som systemet leverer. Valget af instrument afgør i høj gradsøgestrategi og søgeteknologier.

Søgeteknologier- forenede (optimeret inden for et specifikt informationssøgningssystem) sekvenser til effektiv brug af individuelle søgeværktøjer i processen med brugerinteraktion med systemet.

Brugte søgeteknologierinformationssystemer kan opdeles i 3 kategorier:

tematiske kataloger og specialiserede kataloger (onlinefortegnelser);
søgemaskiner (fuldtekstsøgning);
meta søgeværktøjer.

Tematiske katalogersørge for behandling af dokumenter og deres tildeling til en af flere kategorier, hvis liste er forudbestemt. Faktisk er dette bekendt for alle bibliotekarer.klassifikationsbaseret indeksering. Specialiserede kataloger eller guider oprettes på separate grene og temaer.søgemaskiner(den mest avancerede søgefacilitet på internettet) implementere fuldtekst søgeteknologi. Tekster placeret på de anmodede servere indekseres.Ved brug af midler metasøgning Anmodningen udføres samtidigt af flere søgemaskiner. Søgeresultatet kombineres til en generel, sorteret efter relevans, liste.

Søgeværktøjer - et indbyrdes afhængigt kompleks af informationssøgningssprog og datadefinitions-/styringssprog, der giver strukturelle og semantiske transformationer af behandlingsobjekter (dokumenter, ordbøger, samlinger af søgeresultater).

1. Opslagsbøger

Søgeværktøjer i den første gruppe er elektroniske mapper, der har en klar hierarkisk systematisk eller logisk-tematisk struktur,meget som strukturen i et systematisk bibliotekskatalog. At arbejde med mapper giver dig mulighed for at navigere på internetressourcerne inden for individuelle vidensgrene, dykke fra det generelle til det særlige, ændre hierarkiske grene, gå et par trin tilbage osv.

Blandt de russiske udviklinger på dette område er:

Aport (adresse: www.aport.ru),
List.ru (adresse: list.mail.ru ),
Webliste (adresse: www.weblist.ru),
Ivan Susanin (adresse: www.susanin.net
Snegl (adresse: www.ulitka.ru).

Det vigtigste kendetegn ved opslagsbøger er, at de er lavet i hånden. Redaktionerne for hver af opslagsbøgerne, deri kraft af deres arbejde ligner de store bibliotekers katalogiserings- og systematiseringsafdelinger, gennemgår regelmæssigt indholdet af nyligt dukkede servere og spor ændringer på eksisterende. De afslørede data analyseres og indtastes i sektionerne af opslagsbogen i overensstemmelse med den accepterede klassifikation. Beskrivelsen af serveren som helhed (eller sektion, hvis den ser ud til at være en fuldstændig uafhængig blok) er forsynet med en kort anmærkning, der indeholder generel information om arten af den tilgængelige information. I nogle tilfælde indtastes yderligere oplysninger om sproget i dokumenter, deltagelse af ressourcen, dens fysiske placering osv.

De vigtigste parametre, der karakteriserer fordelene ved mapper, er:

bind;
effektiviteten af at afspejle nye eller ændrede ressourcer;
konsistens og sammenhæng i det hierarkiske klassifikationsskema;
struktur crossover.

Mappens volumen bestemmer graden af dens pålidelighed eller "informationsstyrke". I nogle systemer er der en særlig mekanisme, der med jævne mellemrum kontrollerer tilgængeligheden af webstedet og udelukker det fra listen i tilfælde af et langt "fravær" på nettet. Logikken (videnskabelig) af det anvendte klassifikationsskema bestemmer graden af lethed, hvormed brugerne finder den nødvendige information. Systemkrydsreferencergiver dig mulighed for at identificere information ved hjælp af forskellige tilgange (f.eks. territoriale eller sektorbestemte). I dette tilfælde skal klassifikationsskemaet automatisk føre brugeren til det ønskede objekt, uanset hvilken søgesti der er valgt.

Muligheden for at kompilere en forespørgsel til denne type søgeværktøjer spiller ikke en særlig rolle. Komplicerede søgninger, der kræver detaljering af anmodningen, udføres ikke ved hjælp af kataloger.

Mapper er designet til at løsetre typer opgaver:

orientering i en ukendt gren af viden;
søge efter store objekter, som for eksempel er servere for organisationer eller væsentlige projekter;
opnåelse af en færdig liste over ressourcer, der har et sløret søgebillede (biblioteker af en bestemt type, transportplaner eller websteder for politiske partier osv.)

Et andet eksempel er at sammenligne et ressourcekatalog med et biblioteks systematiske katalog, hvor en bog (i dette tilfælde en hel hjemmeside) kun efterlades med en beskrivelse og anmærkning.

2. Søgemaskiner

Søgemaskinernes (søgemaskinernes) arbejde er baseret på helt andre teknologiske principper. Søgemaskinernes opgave er at give en detaljeret søgning efter information, som kun kan opnås gennem regnskabsføring ( indeksering ) indhold på så mange websider som muligt. I modsætning til mapper fungerer søgemaskiner i en automatiseret tilstand og har et ensartet funktionsprincip.

Søgemaskiner består af to grundlæggende komponenter. Den første komponent er robot program , hvis opgave er at flytte fra server til server og finde nye (eller ændrede) dokumenter der, downloade dem til systemets hovedcomputer. Robotten scanner indholdet af dokumentet, finder nye links – både til andre dokumenter på serveren og til eksterne sider. Derefter går programmet selvstændigt til de angivne links, finder nye dokumenter, hvorefter processen gentages igen,minde om den velkendte "sneboldmetode" i litteraturlisten. De identificerede dokumenter behandles (indekseres) af den anden komponent i søgemaskinen. I dette tilfælde tages der som regel hensyn til alt indholdet på siden, herunder tekst, illustrationer, lyd- og videofiler. Alle ord i dokumentet er indekseret, hvilket gør det muligt at bruge søgemaskiner til detaljerede søgninger på de snævreste emner. Dannet indeksfiler , der gemmer information om hvilket nøgleord, hvor mange gange, i hvilket dokument og på hvilken server det bruges, udgør den database, som bibliotekaren får adgang til, når de indtaster kombinationer af nøgleord i forespørgselsstrengen.

Outputtet af resultaterne udføres ved hjælp af et specielt modul, der producererintelligent rangordning af resultater . Dette tager højde for:

placeringen af udtrykket i dokumentet (titel, titel, brødtekst), hyppigheden af dets gentagelse,
procentforhold mellem søgetermen og teksten på siden,
antallet og autoriteten af eksterne links til denne side fra andre websteder.

Til grundlæggende parametre for søgemaskiner forholde sig:

antal indekserede servere og individuelle dokumenter (volumen af indeksfiler);
graden af effektivitet ved at opdatere databasen ved at inkludere oplysninger om nye materialer og slette forældede materialer;
muligheder for at fremsætte en anmodning;
intelligens af søgeresultaternes rangeringssystem;
tilstedeværelsen af yderligere servicefunktioner, der letter brugerens arbejde.

En søgemaskines evne til at udtrykke en forespørgsel så præcist som muligt bestemmer i høj grad kvaliteten af de opnåede resultater. Hver maskine har sit eget ordforråd, som giver dig mulighed for at detaljere på forskellige mådersøg recept.

Alle søgemaskiner harsøgeresultatrangeringsmodul. Det er den anden grundlæggende komponent i alle systemer. Listen over faktorer, der tages i betragtning ved bestemmelse af et dokuments plads på listen over links, er usædvanligt bred: fra placeringen af ordet på siden til vurderingen (autoriteten) af sider, der linker til det fundne dokument.

Google (adresse: www.google.com ),
AlltheWeb (adresse: www.alltheweb.com ),
Alta Vista (adresse: www.altavista.com).

Lignende søgeværktøjer findes i Rusland. Alle af dem er designet til at arbejde med russisksprogede dokumenter og har en kraftfuld http://www.metabot.ru).

Konklusioner om emnet for forelæsningsblokken

Søgemaskinen foretager et udvalg af sider fra databasen i overensstemmelse med anmodningen, derefter sorteres siderne efter graden af faldende match (bemærk A.A.)

I dette tilfælde er der en direkte analogi med principperne for driften af bibliotekets distribuerede resumékataloger. Nøglemulighed metasøgning er muligheden for at sende brugeranmodninger samtidigt til forskellige søgemaskiner - med efterfølgende summering af resultaterne. (note af A.A.)

Når det drejer sig om mapper, kan bibliotekaren forvente kun at modtage meget generel information om emnet, og aldrig - detaljerede data: fra serveren til et stort selskab, der indeholder tusindvis af sider, vil biblioteket kun præsentere navnet og nogle få linjers annotering.