Moderne metoder til informationssøgning. Induktiv metode til informationssøgning. Erkendelsesprocessen med brug af induktion udføres fra enkelte domme og fakta til generelle regler og generaliseringer, hvor det generelle mønster kommer til udtryk. Søg

Video tutorial: Sådan opretter du forespørgsler i Microsoft Access på 10 minutter

Foredrag: Brug af søgemaskineværktøjer (generering af forespørgsler)

De vigtigste funktioner ved arbejde med databaser er informationsfilter, søgning og forespørgsel.


Sortering er processen med at bestille information i henhold til en eller anden egenskab. Der er stigende og faldende sorter. Hvis databasen har numerisk information, så bruges rangering som sortering, og hvis det er tekstinformation, så bruges alfabetisk sortering.


Når man overvejer at sortere efter databasestyringssystemer i MS Access, udføres sorteringen inden for et enkelt felt. Hvis en ny sortering bruges, går dens tidligere resultater tabt. Hvis sorteringen er indlejret, kan det gøres ved hjælp af en forespørgsel.


Filter er valget af oplysninger, som brugeren kræver. Du kan indstille komplekse valgbetingelser.

For at finde nogle data kan du bruge specialtegn kaldet maske:


* – betyder, at et hvilket som helst antal tegn kan vælges.

? - i stedet for dette tegn kan der være et hvilket som helst tegn, der må bruges.

# - et hvilket som helst tal kan bruges i stedet for dette symbol.

- eventuelle tegn i parentes.

- – ethvert tegn, der svarer til det valgte område.

! – ethvert tegn, undtagen dem, der er omgivet af firkantede parenteser.

Dette filter efter tegn kan bruges til hele tabellen eller for en del af de data, der allerede er valgt i henhold til nogle kriterier.

Anmodning- denne funktion er storstilet og kan omfatte både sortering og filtrering. Denne funktion giver dig mulighed for at vælge data i flere felter og tabeller. Du kan oprette et forespørgselsbibliotek, der gemmes til fremtidig brug. Der er et særligt SQL-forespørgselssprog - struktureret.


Efter at have studeret dette emne, vil du lære og gentage:

Hvad er søgeservere til?
- udnævnelse af hoveddelene af søgeservere;
- hvilke typer informationssøgning findes på internettet;
- de grundlæggende regler for generering af en anmodning i Yandex-søgemaskinen.

Søg efter URL'er

Den hurtigste og mest pålidelige måde at finde information på internettet på er at søge efter URL'er. Mange af dem er givet i trykte publikationer, særlige opslagsværker, høres i luften på populære radiostationer og fra tv-skærme.

♦ Zenit fodboldklubfans kender adressen www.fc-zenit.ru udenad.
♦ Fans af gruppen "Korol i Shut" er godt klar over den officielle side for denne gruppe www.korol.spb.ru.
♦ Fans af NTV-kanalen kan nemt finde dens hjemmeside på www.ntv.ru. For hurtig adgang til ovenstående ressourcer skal du blot starte et browserprogram, såsom Internet Explorer, og indtaste en velkendt URL i adresselinjen.

Søgemaskiner

Der er en enorm mængde dokumenter på internettet. For at lette søgningen efter den nødvendige information oprettes specielle søgemaskiner.

søgemaskiner- Det er automatiske systemer, der poller servere, der er tilsluttet det globale netværk, og gemmer information om de data, der er tilgængelige på serverne, i deres database. Ifølge en særligt formuleret anmodning giver søgemaskiner information om, hvor du kan få de nødvendige data.

Som regel består søgemaskiner af tre dele: robot-, indeks- og anmodningsbehandlingsprogram.

Robot (edderkop, robot eller bot) er et program, der besøger websider og læser (helt eller delvist) deres indhold. Søgemaskinerobotter adskiller sig i deres individuelle skema til at analysere indholdet af en webside.
Søgemaskineindeks- dette er et lager af søgebilleder besøgt af robotsider. Søgebilledet af et dokument (inklusive en webside) er en beskrivelse af dokumentets indhold på et særligt informationssøgningssprog. Denne beskrivelse indeholder koder for dokumentets nøgleord, som afspejler dets betydning og indhold. Indeksene i hver søgemaskine er forskellige i mængden og måden, hvorpå information opbevares. De førende søgemaskiners databaser gemmer information om titusinder af dokumenter, og deres indeksvolumener er hundredvis af gigabyte. Indekser opdateres og suppleres med jævne mellemrum, så resultaterne af arbejdet i én søgemaskine med den samme forespørgsel kan variere, hvis søgningen blev udført på forskellige tidspunkter.

Request handler er et program, der i overensstemmelse med brugerens anmodning "søger" indekset for tilstedeværelsen af ​​de nødvendige oplysninger og returnerer links til de fundne dokumenter. Sættet af links ved systemets output fordeles af programmet i faldende rækkefølge efter relevans y, det vil sige fra den højeste grad af matchning af linket til anmodningen til den laveste.

I øjeblikket er de mest populære for russiske internetbrugere tre store søgemaskiner af indekstype:

Disse systemer tager højde for de grammatiske træk ved det russiske sprog, så resultaterne af deres søgning i russisksprogede ressourcer er af højere kvalitet end i vestlige systemer.

Søgemaskiner er forskellige i dækningen af ​​informationsressourcer:

♦ generelle søgemaskiner har en database inden for alle vidensområder og er kendetegnet ved et omfattende indeks og en stor mængde akkumuleret information;
♦ Særlige søgemaskiner søger kun efter websteder med specifikke emner, såsom musik- eller museumssider.

De vigtigste egenskaber ved søgemaskiner er:

♦ mængden af ​​dokumenter i indekset;
♦ hyppigheden af ​​opdatering af information;
♦ det informationsrum, som søgemaskinerobotten dækker, og de mange forskellige typer dokumenter, som oplysningerne indsamles om;
♦ anmodningsbehandlingshastighed;
♦ kriterium for bestemmelse af relevans (det fundne dokuments overensstemmelse med søgeforespørgslen);
♦ muligheden for at uddybe og præcisere anmodningen.

Søg efter rubricator af søgemaskinen

Søgemapper er en systematisk samling (udvalg) af links til andre internetressourcer. Links er organiseret i form af en tematisk rubrikator, som er en hierarkisk struktur, der bevæger sig langs, som du kan finde den information, du har brug for.

Lad os som et eksempel give strukturen af ​​Yandex-søgningsinternetkataloget. Dette er et bibliotek til generelle formål, da det indeholder links til internetressourcer i næsten alle mulige retninger. Dette katalog indeholder følgende emner:

♦ Erhverv og økonomi;
♦ Referencer og links;
♦ Samfund og politik;
♦ Hjem og familie;
♦ Videnskab og uddannelse;
♦ Underholdning og rekreation;
♦ Computere og kommunikation;
♦ Kultur og kunst.

Hvert emne indeholder mange underafsnit, og disse indeholder igen rubrikker og så videre.

Antag, at du forbereder en begivenhed til Victory Day og vil søge på internettet efter ordene fra Bulat Okudzhavas berømte militærsang "Du hører støvlerne rumle." Søgningen kan organiseres som følger: Yandex Catalog Kultur og kunst Musikforfatterens sang.

Denne søgemetode er ret hurtig og effektiv. I slutningen tilbydes du kun 5 links, blandt hvilke der er links til websteder med sange fra berømte barder. Det er kun at finde på webstedet et arkiv med tekster af B. Okudzhava og vælge den ønskede tekst i den.

Et andet eksempel. Antag, at du skal købe en mobiltelefon og vil sammenligne egenskaberne for enheder fra forskellige virksomheder. Søgningen kan udføres under følgende katalogoverskrifter: Yandex Katalog Computere og kommunikation Mobilkommunikation Mobiltelefoner.

Efter at have modtaget et begrænset antal links, kan du hurtigt se dem og vælge en telefon ved at undersøge firmaets egenskaber og modifikationer af enhederne.

Søgeordssøgning

De fleste søgemaskiner har mulighed for at søge efter nøgleord. Dette er en af ​​de mest almindelige søgetyper. For at søge på nøgleord skal du indtaste et eller flere ord, der skal søges i, i et særligt vindue og klikke på knappen Søg. Søgemaskinen vil finde i sin database og vise dokumenter, der indeholder disse ord. Der kan være mange sådanne dokumenter, men meget i dette tilfælde betyder ikke nødvendigvis godt.

Lad os udføre nogle eksperimenter med nogen af ​​søgemaskinerne. Antag, at vi beslutter at starte et akvarium, og vi er interesserede i enhver information om dette emne.

Ved første øjekast er det enkleste at søge efter ordet "akvarium". Lad os kontrollere dette, for eksempel i Yandex-søgemaskinen. Søgeresultatet bliver over 460.000 sider fordelt på 3.500 sider - et enormt antal links. Desuden, hvis du ser nærmere efter, vil blandt dem være steder, der nævner B. Grebenshchikovs akvariegruppe, indkøbscentre og uformelle foreninger med samme navn og meget mere, der ikke har noget at gøre med akvariefisk.

Det er let at gætte, at en sådan søgning ikke kan tilfredsstille selv den uhøjtidelige bruger. Der skal bruges for meget tid på at udvælge blandt alle de foreslåede dokumenter dem, der vedrører det emne, vi har brug for, og endnu mere på at lære deres indhold at kende.

Vi kan med det samme konkludere, at det normalt ikke er tilrådeligt at søge med ét ord, fordi det er meget svært at bestemme emnet for et dokument, en webside eller et websted med ét ord. Undtagelsen er sjældne ord og udtryk, der næsten aldrig bruges uden for deres fagområde.

Lad os prøve at præcisere søgetermerne og indtaste sætningen "akvariefisk". Søgeresultatet bliver lidt over 20.000 sider og omkring 650 sider. Som du kan se, er antallet af links faldet med mere end 20 gange. Dette resultat passer os mere, men alligevel kan du blandt de foreslåede links finde for eksempel russiske souvenirsæt med tændstiketiketter med billeder af fisk og samlinger af computerskærmskånere og kataloger over akvariefisk med fotos og akvarie tilbehørsbutikker.

Det er indlysende, at vi fortsat bør bevæge os i retning af at forfine søgeforholdene.

For at gøre søgningen mere produktiv har alle søgemaskiner et særligt søgesprog med sin egen syntaks. Disse sprog ligner på mange måder. Det er ret svært at lære dem alle, men enhver søgemaskine har et hjælpesystem, der giver dig mulighed for at mestre det ønskede sprog.

Her er ti enkle regler for generering af en anmodning i Yandex-søgemaskinen.

1. Nøgleord i forespørgslen skal skrives med små (små) bogstaver. Dette vil sikre, at alle søgeord bliver søgt, ikke kun dem, der starter med et stort bogstav.

2. Søgningen tager højde for alle former for ordet i henhold til reglerne for det russiske sprog, uanset formen af ​​ordet i forespørgslen. For eksempel, hvis ordet "kend" blev angivet i forespørgslen, så vil ordene "kend", "kend" osv. også opfylde søgebetingelsen.

3. For at søge efter en stabil sætning skal du sætte ordene i anførselstegn, for eksempel "porcelænsfade".

4. For at søge på den nøjagtige ordform skal du sætte et udråbstegn foran ordet. Hvis du f.eks. vil søge efter ordet "september" i genitivkasus, skriver du "!September".

5. For at søge inden for en enkelt sætning er ordene i forespørgslen adskilt af et mellemrum eller tegn &: "eventyrroman" eller "eventyr og roman". Flere ord indtastet i forespørgslen, adskilt af mellemrum, betyder, at de alle skal indgå i én sætning i det dokument, der søges efter.

6. Hvis du kun vil vælge de dokumenter, hvor hvert ord angivet i forespørgslen forekommer, skal du sætte et plustegn "+" foran hvert af dem. Hvis du derimod vil udelukke nogle ord fra søgeresultatet, skal du sætte et minus "-" foran dette ord. Tegnene "+" og "-" skal skrives med et mellemrum fra det foregående og flettes sammen med det næste ord. Forespørgslen "Volga-bil" vil f.eks. finde dokumenter, der indeholder ordet "Volga" og ikke ordet "bil".

7. Når du søger efter synonymer eller ord, der er tæt på betydningen, kan du sætte en lodret streg "|" mellem ordene. For eksempel for forespørgslen "barn | barn | baby" vil finde dokumenter med et hvilket som helst af disse ord.

8. I stedet for et enkelt ord i en forespørgsel kan du erstatte et helt udtryk. For at gøre dette skal det stå i parentes, for eksempel "(barn | baby | børn | baby) + (omsorg | opdragelse)".

9. Tegnet *~" (tilde) giver dig mulighed for at finde dokumenter med en sætning, der indeholder det første ord, men ikke indeholder det andet. For eksempel vil søgningen "bøger ~ butik" finde alle dokumenter, der indeholder ordet "bøger", som ikke har ordet "butik" ved siden af ​​sig (inden for sætningen).

10. Hvis operatoren gentages én gang (for eksempel & eller ~), udføres søgningen inden for sætningen. Dobbeltoperatoren (&&, -) søger i dokumentet. Forespørgslen "kræft - astrologi" vil f.eks. finde dokumenter med ordet "kræft", som ikke er relateret til astrologi.

Når du har et bestemt sæt af de mest almindelige udtryk i det ønskede område, kan du bruge avanceret søgning. På fig. 3.3 viser det avancerede søgevindue i Yandex-søgemaskinen. I denne tilstand implementeres forespørgselssprogets muligheder som en formular. En lignende tjeneste, inklusive ordbogsfiltre, tilbydes af næsten alle søgemaskiner.

Ris. 3.3. Et eksempel på en avanceret søgning i Yandex-systemet

Givet det korrekte valg af ønskelige og påkrævede ord og udelukkelse af uønskede termer, kan en sådan søgning give gode resultater.

Lad os gå tilbage til eksemplet med akvariefisk. Efter at have læst flere dokumenter, der tilbydes af søgemaskinen, bliver det klart, at søgningen efter information på internettet ikke bør begynde med valget af akvariefisk. Et akvarium er et komplekst biologisk system, hvis oprettelse og vedligeholdelse kræver særlig viden, tid og seriøse investeringer.

Baseret på de modtagne oplysninger kan en person, der udfører en søgning på internettet, radikalt ændre strategien for yderligere søgning og beslutte at studere den særlige litteratur relateret til det undersøgte spørgsmål.

For at søge efter litteratur eller fuldtekstdokumenter er følgende forespørgsel mulig:

"+ (akvarie | akvarist | akvarist) + for begyndere + (rådgivning | litteratur) + (artikel | speciale | fuldtekst) - (pris | butik | levering | katalog)".

Efter at have behandlet anmodningen af ​​søgemaskinen, blev følgende resultat opnået: sider - 195, websteder - mindst 43.

Som det fremgår af søgestatistikken, var resultatet meget vellykket. Allerede de første links fører til de nødvendige dokumenter:

Akvarieopsætning > Tips til begyndere akvarister >
Artikler > Aq uascope. da
http://aquascope.ru/modules/wfsection/article.php?page=l&articleid=49 (32KB) - streng overholdelse.
RÅD TIL NYBEGYNDERNE AKVARIEMESTER. Sådan vælger og installerer du et akvarium, hvordan...
http://www.aquariums.ru/sovna.htm (2KB) 07/23/2002 - ikke-streng korrespondance.

Nu kan du opsummere resultaterne af søgningen, drage visse konklusioner og beslutte om mulige handlinger:

♦ Stop yderligere søgning, for af forskellige årsager er vedligeholdelsen af ​​akvariet uden for din magt.
♦ Læs de foreslåede artikler og begynd at sætte et akvarium op.
♦ Søg efter materialer om hamstere eller undulater.

Professionel søgning

Forskere og specialister bliver nødt til at tage en mere gennemtænkt tilgang til tilrettelæggelsen af ​​søgningen. Når du professionelt søger information på internettet, skal følgende krav være opfyldt:

♦ høj søgehastighed;
♦ pålideligheden af ​​den modtagne information;
♦ fuldstændighed af dækning af ressourcer under søgningen.

Hastighed. Søgningens hastighed afhænger hovedsageligt af to faktorer: af kompetent søgeplanlægning (udvælgelse af søgetjenester og værktøjer) og færdigheder i at arbejde med en allerede udvalgt ressource (evnen til hurtigt at forstå dens struktur og navigationsmetoder). Søgeindekser er ikke nok til at sikre søgehastighed. Ud over dem er der en række søgeressourcer på internettet, hvis brug sikrer udførelsen af ​​en professionel søgning.

Pålidelighed. Spørgsmålet om pålideligheden af ​​information modtaget fra internettet er meget relevant, da enhver kan placere enhver information der uden nogen kontrol over dens overensstemmelse med virkeligheden. Dette fører igen til en lang række upålidelige kilder, såsom abstracts og semesteropgaver, der har oversvømmet internettet.

Der er specielle søgetjenester, der giver dig mulighed for at vurdere pålideligheden af ​​en informationskilde på internettet.

Fuldstændighed. En nødvendig forudsætning for en vellykket fuldskala-indsamling af information er viden om de vigtigste typer af ressourcer, der findes i dag, og brugen af ​​forskellige søgetjenester. Ingen søgemaskine kan dække alle internettets ressourcer.

For at opnå et positivt resultat skal brugeren som regel ty til tjenester fra flere søgemaskiner. Du kan gøre det selv, flytte fra system til system, eller du kan overlade dette arbejde til en af ​​metasøgemaskinerne (meta er den første komponent af sammensatte ord, der betegner systemer til at beskrive og undersøge andre systemer).

Ris. 3.4. Metasearch vinduer

Metasøgemaskiner har ikke deres egne søgedatabaser og bruger ressourcerne fra mange andre søgemaskiner, når de søger. På grund af dette er sandsynligheden for at finde den nødvendige information meget stor. Arbejde i metasøgesystemer udføres efter samme regler som arbejde i søgemaskiner. Det skyldes, at metasøgemaskiner er en slags add-on til søgemaskiner og bruger deres indeksdatabaser i deres arbejde. Udseendet af metasøgemaskiner ligner udseendet af velkendte søgemaskiner. På fig. 3.4 viser vinduerne i metasøgemaskinerne myweb.ru og metabot.ru.

Erfaringen viser, at der i de fleste tilfælde opnås et bedre resultat ved at bruge flere uafhængige søgeindekser end ved at bruge én metasøgemaskine.

Styr spørgsmål og opgaver

1. Hvad er formålet med et browserprogram?

2. Hvilke browserprogrammer kender du?

3. Hvor kan en bruger, der planlægger en internetsøgning, finde URL'er?

4. Hvad er søgeteknologien for søgemaskinens rubricator?

5. Hvad er søgeordssøgningsteknologien?

6. Hvilke krav skal overholdes ved den professionelle informationssøgning på internettet?

7. Hvornår skal du angive tegnene "+" eller "-" i søgekriterierne?

8. Hvilke søgekriterier i Yandex er fastsat af følgende sætning:

(barnepige | lærer | guvernante) ++ (pleje | opdragelse | tilsyn).

9. Hvad betyder fordobling af tegnet (∼∼ eller ++), når der dannes en kompleks forespørgsel?

10. Hvad er søgerelevans?

11. Hvad er formålet med metasøgemaskiner?

Klassificering af søgeværktøjer (deres typer og typer) Søgeværktøjer kan opdeles i: - kataloger eller kataloger - kataloger - søgemaskiner - søgemaskiner. Denne klassifikation er baseret på princippet om at udvælge og behandle information til søgeværktøjsdatabasen, nemlig: hvor automatiseret denne proces er, hvem der opretter søgeværktøjsdatabasen: personer eller computere.


Klassificering af søgeværktøjer (deres typer og typer) For nylig er forskellen mellem søgemaskiner og mapper blevet "udvisket", da deres skabere forsøger ikke at fokusere brugerne på principperne for informationsudvælgelse, men præsentere så mange lignende servicemuligheder som muligt , der fungerer som universelle portaler. Men forskellen i udvælgelsen og behandlingen af ​​information er stadig væsentlig og afgørende: - søgemaskiner bruger robotter til at søge, indeksere information - dvs. Processen er fuldautomatiseret; - mapper er bygget på det faktum, at webstedet "venter" på at blive accepteret, behandlet og beskrevet af en bestemt katalogiseringsspecialist.


Klassificering af søgeværktøjer (deres typer og typer) Sådanne forskellige funktionsprincipper for søgemaskiner og biblioteker påvirker deres volumen og indhold i væsentlig grad, og dermed søgestrategien: dens fulde tekst. Kataloger repræsenterer dette eller hint websted i generelle vendinger - katalogisereren annoterer og systematiserer webstedet i overensstemmelse med dets generelle indhold, og de fulde tekster er ikke indekseret. Søgemaskiner indekserer et stort antal websteder, fordi de robotter, der "surger" indholdet på internettet, opererer efter "snebold"-princippet og rejser fra link til link. Biblioteker er på den anden side kendetegnet ved meningsfuldheden og orden i udvælgelsen af ​​websteder i deres databaser (normalt er disse informationsrige og/eller websteder med store fysiske objekter).


Klassificering af søgeværktøjer (deres typer og typer) Så nogle søgemaskiner: Altavista (Yandex (Google (Rambler (FastSearch)


Klassificering af søgeværktøjer (deres typer og typer) Og mapper (eller mapper): Yahoo (Librarians Index to the Internet (lii.org) List.ru (


Klassificering af søgeværktøjer (deres typer og typer) Blandt de nævnte, som du har bemærket, er der både universelle globale søgeværktøjer og universelle regionale (i dette tilfælde russiske). Her er nogle andre: EuroFerret (Voila (Altavista France (fr.altavista.com) UKPlus (ukplus.co.uk)


Klassificering af søgeværktøjer (deres typer og typer) Opdelingen af ​​søgeværktøjer i globale og regionale er intet andet end en klassificering efter det geografiske princip om udvælgelse af ressourcer til indeksering. Andre søgeværktøjer begrænser også deres databaser med hensyn til indhold, men efter emne: FindLaw (Whowhere (MusicSearch (HumorSearch (FindBook)


Klassificering af søgemaskiner (deres typer og arter) Bemærk, at sådanne specialiserede eller tematiske søgemaskiner kan bruge: enten deres egne databaser til at søge efter din forespørgsel, eller de søger på hele internettet ved hjælp af andre søgemaskiner.


Klassificering af søgeværktøjer (deres typer og typer) Derudover er der metasøgemaskiner, der tilbyder at søge i flere søgemaskiner på samme tid. For eksempel: Mamma (Fordelen er, at i dette tilfælde returneres det maksimale antal resultater, ulempen er, at ikke alle søgemaskiner har den samme forespørgselssprogsyntaks (f.eks. understøttes citater ikke af alle søgemaskiner).


Hovedelementerne i søgemaskinens forespørgselssprog Lad os liste de almindelige elementer og funktioner i søgemaskinens forespørgselssprog: De fleste bruger: + eller - (inkluder eller ekskluder udtrykket fra søgereceptet); "anførselstegn" (for at betegne en sætning, en stabil sætning). Nogle bruger fagforeningerne AND, AND NOT i stedet for + eller - tegn.


Grundlæggende elementer i søgemaskineforespørgselssprog De fleste tillader ordafkortningstegn til venstre * (for eksempel: wish* - vil blive fundet: wish, wishes, wishful, wishbone og wishy-washy) Nogle søgemaskiner er følsomme over for store og små bogstaver (hvis du f.eks. søger efter materialer om personer med efternavnet Sten ved hjælp af Altavista, skal du sørge for at bruge et stort bogstav, for ellers vil alle steder, hvor ordet sten forekommer, blive fundet).


Hovedelementerne i søgemaskinens forespørgselssprog (med Yandex som eksempel) ElementHvad betyder det Prøveforespørgselsrum eller & eller + logisk OG (inden for en sætning) familieret && logisk OG (i et dokument) opskrifter && (smeltet ost) | logisk ORfoto | fotografering | øjebliksbillede | fotografisk billede


Hovedelementerne i søgemaskinens søgesprog (med Yandex som eksempel) () ordgruppering (teknologi | fremstilling) (smør | hytteost) ~ eller - forening OG IKKE (inden for sætningen) tanke ~ lov ~ ~ forening OG IKKE (i dokumentet) guide i paris ~~ (bureau | tur) "" søg efter udtrykket "poesi antologi"


Hovedelementerne i søgemaskinens forespørgselssprog (i eksemplet med Yandex) ! før ordet, den nøjagtige form af ordet! virkelige øjeblik - Denne lov træder i kraft to uger efter dens offentliggørelse. $title("") Udtrykket findes i feltet Titel i HTML-dokumentet. $title ("flora og fauna") - sider med titler svarende til "Flora og fauna i Sibirien"


Og som konklusion: 1) For at opbygge en søgestrategi korrekt, skal du først selv bestemme, hvilken slags information du vil modtage - nogle generelle oplysninger, der beskriver et objekt eller et fænomen som helhed, eller nogle detaljer, detaljer der kan optræde i den fulde tekst af et dokument. I det første tilfælde er det tilrådeligt at bruge en mappe, i det andet - en søgemaskine. 2) Hvis du, når du starter søgningen, stadig ikke ved præcis, hvad og hvor meget du ønsker at få i søgeresultaterne, anbefales det at bruge forskellige søgeværktøjer i kombination.

Søgeværktøjer

Søgeværktøjer er speciel software, hvis hovedformål er at give internetbrugere den mest optimale og højkvalitets informationssøgning. Søgeværktøjer hostes på specielle webservere, som hver især udfører en bestemt funktion:

1. Analyse af websider og indtastning af resultaterne af analysen på et eller andet niveau af søgeserverens database.

2. Søg efter information efter anmodning fra brugeren.

3. Tilvejebringelse af en brugervenlig grænseflade til at søge efter information og se søgeresultatet af brugeren.

De arbejdsmetoder, der bruges, når man arbejder med disse eller andre søgeværktøjer, er næsten de samme. Inden du fortsætter med at diskutere dem, skal du overveje følgende begreber:

1. Søgeværktøjets grænseflade er præsenteret som en side med hyperlinks, en forespørgselsstreng (søgestreng) og forespørgselsaktiveringsværktøjer.

2. Søgemaskineindeks er en informationsbase, der indeholder resultatet af analysen af ​​websider, udarbejdet efter bestemte regler.

3. Forespørgsel er et søgeord eller en sætning, som brugeren indtaster i søgefeltet. Specialtegn ("", ~), matematiske symboler (*, +, ?) bruges til at danne forskellige forespørgsler.

Informationssøgningsordningen er enkel. Brugeren indtaster en nøglesætning og aktiverer søgningen og modtager derved et udvalg af dokumenter i henhold til den formulerede (givne) anmodning. Denne liste over dokumenter er rangeret efter bestemte kriterier, så øverst på listen er de dokumenter, der bedst matcher brugerens forespørgsel. Hvert af søgeværktøjerne bruger forskellige kriterier til rangering af dokumenter, både i analysen af ​​søgeresultater og i dannelsen af ​​indekset (fylder indeksdatabasen over websider).

Hvis du angiver en forespørgsel af samme design i søgestrengen for hvert søgeværktøj, kan du således få forskellige søgeresultater. For brugeren er det af stor betydning, hvilke dokumenter der vil optræde i de første to eller tre dusin dokumenter i henhold til søgeresultaterne, og i hvilket omfang disse dokumenter svarer til brugerens forventninger.

De fleste søgeværktøjer tilbyder to måder at søge på − simpel søgning(simpel søgning) og Avanceret søgning(avanceret søgning) med og uden en særlig anmodningsformular. Lad os overveje begge typer søgning på eksemplet med en engelsksproget søgemaskine.

For eksempel er AltaVista nyttig til vilkårlige forespørgsler, "Noget om online grader i informationsteknologi", mens Yahoo-søgeværktøjet giver dig mulighed for at få verdensnyheder, valutakursoplysninger eller vejrudsigt.

At mestre kriterierne for at forfine forespørgslen og avancerede søgeteknikker giver dig mulighed for at øge effektiviteten af ​​søgningen og hurtigt finde den nødvendige information. Først og fremmest kan du øge søgeeffektiviteten ved at bruge logiske operatorer (operationer) eller, og, tæt på, ikke, matematiske og specielle symboler i forespørgsler. Ved hjælp af operatorer og/eller symboler linker brugeren nøgleordene i den ønskede rækkefølge for at få det mest passende søgeresultat til forespørgslen. Anmodningsformularer er vist i tabel 1.

tabel 1

En simpel forespørgsel giver en række links til dokumenter, fordi listen omfatter dokumenter, der indeholder et af de ord, der er indtastet på anmodningen, eller en simpel sætning (se tabel 1). Operatoren og giver dig mulighed for at angive, at alle nøgleord skal inkluderes i dokumentindholdet. Antallet af dokumenter kan dog stadig være stort, og det kan tage lang tid at gennemgå dem. Derfor er det i nogle tilfælde meget mere praktisk at bruge nær kontekst-operatoren, som angiver, at ordene skal være placeret i tilstrækkelig nærhed i dokumentet. Brug af nær reducerer i høj grad antallet af fundne dokumenter. Tilstedeværelsen af ​​symbolet "*" i forespørgselsstrengen betyder, at ordet søges efter dets maske. Lad os f.eks. få en liste over dokumenter, der indeholder ord, der starter med "gov", hvis vi skriver "gov*" i forespørgselsstrengen. Det kan være ordene regering, guvernør osv.

Den mest udviklede søgetjeneste til russisksproget information leveres af Yandex-søgeserveren. I Yandex kan du simpelthen skrive på russisk en sætning, der beskriver, hvad du vil finde, og systemet vil analysere og behandle din anmodning og derefter prøve at finde alt, der vedrører et givet emne. Du kan ved hjælp af specielle operatorer sammensætte en streng, der forklarer søgemaskinen, hvad dine krav skal være til den information, du er interesseret i.

Den lige så populære Rambler-søgemaskine vedligeholder statistik over linktrafik fra sin egen database, de samme logiske operatorer OG, ELLER, IKKE, meta-tegnet * (svarende til tegnet * i AltaVista, der udvider forespørgselsområdet), koefficientsymboler + og - er understøttet til at øge eller mindske betydningsord indtastet i forespørgslen.

Lad os se på de mest populære informationssøgningsteknologier på internettet.

Foredrag 4. Informationssøgningsværktøjer

Den konstante opdatering af informationsarrayet kombineret med stigningen i mængden af ​​data gør det ekstremt vanskeligt at tage hensyn til de tilgængelige dokumenter og følgelig søgningen, som kan opdeles betinget i:

  • faktuel søgning:i encyklopædier, opslagsværker, ordbøger,
  • bibliografisk søgning:biblioteker, mapper, programmer.
  • dokumentsøgning:elektroniske dokumenter, elektroniske biblioteker, elektroniske tidsskrifter.

Vigtigheden af ​​problemet med informationssøgning har ført til dannelsen af ​​en hel industri, hvis opgave netop er at assistere brugeren med at navigere i cyberspace. Gør denne branche specielsøgetjenester eller tjenester. De er traditionelt opdelt i:

  • mapper eller kataloger
  • søgemaskiner

Disse sorter er visuelt meget ens, fordi"hver mappe har sin egen søgemaskine, og hver søgemaskine har sin egen mappe". Men principperne for deres arbejde er baseret på helt andre tilgange og teknologier. Derudover bruges hver type søgetjenester til at løse en bestemt type problem. Informationssøgning involverer brugen af ​​bestemte strategier, metoder, mekanismer og værktøjer. Brugerens adfærd, der styrer søgeprocessen, bestemmes ikke kun af informationsbehovet, men også af systemets instrumentelle mangfoldighed - de teknologier og værktøjer, som systemet leverer. Valget af instrument afgør i høj gradsøgestrategi og søgeteknologier.

Søgeteknologier- forenede (optimeret inden for et specifikt informationssøgningssystem) sekvenser til effektiv brug af individuelle søgeværktøjer i processen med brugerinteraktion med systemet.

Brugte søgeteknologierinformationssystemer kan opdeles i 3 kategorier:

  • tematiske kataloger og specialiserede kataloger (onlinefortegnelser);
  • søgemaskiner (fuldtekstsøgning);
  • meta søgeværktøjer.

Tematiske katalogersørge for behandling af dokumenter og deres tildeling til en af ​​flere kategorier, hvis liste er forudbestemt. Faktisk er dette bekendt for alle bibliotekarer.klassifikationsbaseret indeksering. Specialiserede kataloger eller guider oprettes på separate grene og temaer.søgemaskiner(den mest avancerede søgefacilitet på internettet) implementere fuldtekst søgeteknologi. Tekster placeret på de anmodede servere indekseres.Ved brug af midler metasøgning Forespørgslen udføres samtidigt af flere søgemaskiner. Søgeresultatet kombineres til en generel, sorteret efter relevans, liste.

Søgeværktøjer - et indbyrdes afhængigt sæt af informationssøgningssprog og datadefinitions-/styringssprog, der giver strukturelle og semantiske transformationer af behandlingsobjekter (dokumenter, ordbøger, samlinger af søgeresultater).

1. Opslagsbøger

Søgeværktøjer i den første gruppe er elektroniske mapper, der har en klar hierarkisk systematisk eller logisk-tematisk struktur,meget som strukturen i et systematisk bibliotekskatalog. At arbejde med mapper giver dig mulighed for at navigere på internetressourcerne inden for individuelle vidensgrene, dykke fra det generelle til det særlige, ændre hierarkiske grene, gå et par trin tilbage osv.

Blandt de russiske udviklinger på dette område er:

  • Aport (adresse: www.aport.ru),
  • List.ru (adresse: list.mail.ru ),
  • Webliste (adresse: www.weblist.ru),
  • Ivan Susanin (adresse: www.susanin.net)
  • Snegl (adresse: www.ulitka.ru).

Det vigtigste kendetegn ved opslagsbøger er, at de er lavet i hånden. Redaktionerne for hver af opslagsbøgerne, deri kraft af deres arbejde ligner de store bibliotekers katalogiserings- og systematiseringsafdelinger, gennemgår regelmæssigt indholdet af nyligt dukkede servere og spor ændringer på eksisterende. De afslørede data analyseres og indtastes i sektionerne af opslagsbogen i overensstemmelse med den accepterede klassifikation. Beskrivelsen af ​​serveren som helhed (eller sektion, hvis det ser ud til at være en fuldstændig uafhængig blok) er forsynet med en kort anmærkning, der indeholder generel information om arten af ​​den tilgængelige information. I nogle tilfælde indtastes yderligere oplysninger om dokumenternes sprog, deltagelse af ressourcen, dens fysiske placering osv.

De vigtigste parametre, der karakteriserer fordelene ved mapper, er:

  • bind;
  • effektiviteten af ​​at afspejle nye eller ændrede ressourcer;
  • konsistens og sammenhæng i det hierarkiske klassifikationsskema;
  • struktur crossover.

Mappens volumen bestemmer graden af ​​dens pålidelighed eller "informationsstyrke". I nogle systemer er der en særlig mekanisme, der med jævne mellemrum kontrollerer tilgængeligheden af ​​webstedet og udelukker det fra listen i tilfælde af et langt "fravær" på nettet. Logikken (videnskabelig) af det anvendte klassifikationsskema bestemmer graden af ​​lethed, hvormed brugerne finder den nødvendige information. Systemkrydsreferencergiver dig mulighed for at identificere information ved hjælp af forskellige tilgange (f.eks. territoriale eller sektorbestemte). I dette tilfælde skal klassifikationsskemaet automatisk føre brugeren til det ønskede objekt, uanset hvilken søgesti der er valgt.

Muligheden for at kompilere en forespørgsel til denne type søgeværktøjer spiller ikke en særlig rolle. Komplicerede søgninger, der kræver detaljering af anmodningen, udføres ikke ved hjælp af kataloger.

Mapper er designet til at løsetre typer opgaver:

  • orientering i en ukendt gren af ​​viden;
  • søge efter store objekter, som for eksempel er servere for organisationer eller væsentlige projekter;
  • opnåelse af en færdig liste over ressourcer, der har et sløret søgebillede (biblioteker af en bestemt type, transportplaner eller websteder for politiske partier osv.)

Et andet eksempel er sammenligningen af ​​en ressourcevejledning med et biblioteks systematiske katalog, hvor en bog (i dette tilfælde en hel hjemmeside) kun efterlades med en beskrivelse og anmærkning.

2. Søgemaskiner

Søgemaskinernes (søgemaskinernes) arbejde er baseret på helt andre teknologiske principper. Søgemaskinernes opgave er at give en detaljeret søgning efter information, som kun kan opnås gennem regnskabsføring ( indeksering ) indhold på så mange websider som muligt. I modsætning til mapper fungerer søgemaskiner i en automatiseret tilstand og har et ensartet driftsprincip.

Søgemaskiner består af to grundlæggende komponenter. Den første komponent er robot program , hvis opgave er at flytte fra server til server og finde nye (eller ændrede) dokumenter der, downloade dem til systemets hovedcomputer. Robotten kigger dokumentets indhold igennem, finder nye links, både til andre dokumenter på serveren og til eksterne sider. Derefter går programmet selvstændigt til de angivne links, finder nye dokumenter, hvorefter processen gentages igen,minde om den velkendte "sneboldmetode" i bibliografien. De identificerede dokumenter behandles (indekseres) af den anden komponent i søgemaskinen. I dette tilfælde tages der som regel hensyn til alt indholdet på siden, herunder tekst, illustrationer, lyd- og videofiler. Alle ord i dokumentet er indekseret, hvilket gør det muligt at bruge søgemaskiner til detaljerede søgninger på de snævreste emner. Dannet indeksfiler , der gemmer information om hvilket nøgleord, hvor mange gange, i hvilket dokument og på hvilken server det bruges, udgør den database, som bibliotekaren får adgang til, når de indtaster kombinationer af nøgleord i forespørgselsstrengen.

Outputtet af resultaterne udføres ved hjælp af et specielt modul, der producererintelligent rangordning af resultater . Dette tager højde for:

  • placeringen af ​​udtrykket i dokumentet (titel, titel, brødtekst), hyppigheden af ​​dets gentagelse,
  • procentforhold mellem søgetermen og teksten på siden,
  • antallet og autoriteten af ​​eksterne links til denne side fra andre websteder.

Til grundlæggende parametre for søgemaskiner forholde sig:

  • antal indekserede servere og individuelle dokumenter (volumen af ​​indeksfiler);
  • graden af ​​effektivitet ved at opdatere databasen ved at inkludere oplysninger om nye materialer og slette forældede materialer;
  • muligheder for at fremsætte en anmodning;
  • intelligens af søgeresultaternes rangeringssystem;
  • tilstedeværelsen af ​​yderligere servicefunktioner, der letter brugerens arbejde.

En søgemaskines evne til at udtrykke en forespørgsel så præcist som muligt bestemmer i høj grad kvaliteten af ​​de opnåede resultater. Hver maskine har sit eget ordforråd, som giver dig mulighed for at detaljere på forskellige mådersøgerækkefølge.

Alle søgemaskiner harsøgeresultatrangeringsmodul. Det er den anden grundlæggende komponent i alle systemer. Listen over faktorer, der tages i betragtning ved bestemmelse af et dokuments plads på listen over links, er usædvanligt bred: fra placeringen af ​​ordet på siden til vurderingen (autoriteten) af sider, der linker til det fundne dokument.

  • Google (adresse: www.google.com ),
  • AlltheWeb (adresse: www.alltheweb.com ),
  • Alta Vista (adresse: www.altavista.com).

Lignende søgeværktøjer findes i Rusland. Alle af dem er designet til at arbejde med russisksprogede dokumenter og har en kraftfuld http://www.metabot.ru).

Konklusioner om emnet for forelæsningsblokken

Søgemaskinen foretager et udvalg af sider fra databasen i overensstemmelse med forespørgslen, derefter sorteres siderne efter graden af ​​faldende match (bemærk A.A.)

I dette tilfælde er der en direkte analogi med principperne for driften af ​​bibliotekets distribuerede resumékataloger. Nøglemulighed metasøgning er muligheden for at sende brugeranmodninger samtidigt til forskellige søgemaskiner - med efterfølgende summering af resultaterne. (note af A.A.)

Med henvisning til mapper kan bibliotekaren forvente kun at modtage meget generel information om emnet, og aldrig - detaljerede data: fra serveren til en stor virksomhed, der indeholder tusindvis af sider, vil biblioteket kun præsentere navnet og nogle få linjers annotering.

Indlæser...
Top