Kaasaegsed teabeotsingu meetodid. Induktiivne teabeotsingu meetod. Tunnetusprotsess induktsiooni kasutamisega on tehtud üksikutest hinnangutest ja faktidest üldiste reeglite ja üldistusteni, milles väljendub üldine muster. otsing

Videoõpetus: Kuidas luua Microsoft Accessis päringuid 10 minutiga

Loeng: Otsingumootori tööriistade kasutamine (päringu genereerimine)

Kõige olulisemad funktsioonid andmebaasidega töötamisel on infofilter, otsing ja päring.


Sorteerimine on teabe järjestamise protsess mõne atribuudi järgi. On tõusvaid ja kahanevaid sorte. Kui andmebaasis on numbriline info, siis kasutatakse järjestamiseks järjestamist ja kui tegemist on tekstilise informatsiooniga, siis tähestikulist sorteerimist.


Kui kaalute sortimist MS Accessi andmebaasihaldussüsteemide järgi, toimub sortimine ühe välja piires. Kui kasutatakse uut sorti, lähevad selle varasemad tulemused kaotsi. Kui sortimine on pesastatud, saab seda teha päringu abil.


Filter on kasutaja poolt nõutava teabe valik. Saate määrata keerukaid valikutingimusi.

Teatud andmete leidmiseks võite kasutada erimärke nimega mask:


* – tähendab, et valida saab suvalise arvu märke.

? - selle märgi asemel võib olla mis tahes märk, mida on lubatud kasutada.

# - selle märgi asemel võib kasutada mis tahes numbrit.

- sulgudes olevad märgid.

- – mis tahes märk, mis vastab valitud vahemikule.

! – mis tahes tähemärki, välja arvatud nurksulgudes olevad märgid.

Seda märkide järgi filtrit saab kasutada kogu tabeli või mõne kriteeriumi järgi juba valitud andmete osa jaoks.

Taotlus- see funktsioon on suuremahuline ja võib hõlmata nii sorteerimist kui ka filtreerimist. See funktsioon võimaldab teil valida andmeid mitmes väljas ja tabelis. Saate luua päringuteegi, mis salvestatakse edaspidiseks kasutamiseks. On olemas spetsiaalne SQL päringukeel – struktureeritud.


Pärast selle teema uurimist õpite ja kordate:

Mille jaoks on otsinguserverid mõeldud?
- otsinguserverite põhiosade määramine;
- mis tüüpi teabeotsing Internetis eksisteerib;
- Yandexi otsingumootoris päringu genereerimise põhireeglid.

Otsige URL-ide järgi

Kiireim ja usaldusväärseim viis Internetist teabe leidmiseks on otsida URL-e. Paljud neist on avaldatud trükiväljaannetes, spetsiaalsetes teatmeteostes, kõlavad populaarsete raadiojaamade eetris ja teleriekraanidelt.

♦ Jalgpalliklubi Zenit fännid teavad aadressi www.fc-zenit.ru peast.
♦ Grupi "Korol i Shut" fännid on hästi teadlikud selle grupi ametlikust saidist www.korol.spb.ru.
♦ NTV kanali fännid leiavad hõlpsasti selle veebisaidi aadressil www.ntv.ru. Ülaltoodud ressurssidele kiireks juurdepääsuks käivitage lihtsalt brauseriprogramm, näiteks Internet Explorer, ja tippige aadressiribale tuttav URL.

Otsingumootorid

Internetis on tohutult palju dokumente. Vajaliku teabe otsimise hõlbustamiseks luuakse spetsiaalsed otsingumootorid.

otsingumootorid- Need on automaatsed süsteemid, mis küsitlevad globaalsesse võrku ühendatud servereid ja salvestavad oma andmebaasi infot serverites saadaolevate andmete kohta. Vastavalt spetsiaalselt koostatud päringule annavad otsingumootorid teavet selle kohta, kust saab vajalikke andmeid.

Reeglina koosnevad otsingumootorid kolmest osast: robot, indeks ja päringu töötlemise programm.

Robot (ämblik, robot või robot) on programm, mis külastab veebilehti ja loeb (täielikult või osaliselt) nende sisu. Otsingumootori robotid erinevad oma individuaalse veebilehe sisu analüüsimise skeemi poolest.
Otsingumootori register- see on robotite lehtede külastatud otsingupiltide hoidla. Dokumendi (sh veebilehe) otsingupilt on dokumendi sisu kirjeldus spetsiaalses teabeotsingu keeles. See kirjeldus sisaldab koodid dokumendi märksõnadele, mis kajastavad selle tähendust ja sisu. Iga otsingumootori indeksid erinevad teabe salvestamise mahu ja viisi poolest. Juhtivate otsingumootorite andmebaasid salvestavad infot kümnete miljonite dokumentide kohta ning nende registrimahud on sadu gigabaite. Indekseid uuendatakse ja täiendatakse perioodiliselt, mistõttu võivad ühe otsingumootori sama päringuga tehtud töö tulemused erineda, kui otsing tehti erinevatel aegadel.

Päringu menetleja on programm, mis vastavalt kasutaja soovile "otsib" indeksist vajaliku info olemasolu ja tagastab leitud dokumentidele lingid. Süsteemi väljundis olevate linkide komplekti jagab programm kahanevas tähtsuse y järjekorras, st lingi ja päringu vastavuse kõrgeimast astmest madalaima.

Praegu on Venemaa Interneti-kasutajate seas kõige populaarsemad kolm peamist indeksitüüpi otsingumootorit:

Need süsteemid võtavad arvesse vene keele grammatilisi iseärasusi, mistõttu on nende otsingutulemused venekeelsetes ressurssides kvaliteetsemad kui lääne süsteemides.

Otsingumootorid erinevad teaberessursside ulatuse poolest:

♦ üldotsingumootoritel on andmebaas kõigis teadmiste valdkondades ning neid eristab ulatuslik indeks ja suur hulk akumuleeritud teavet;
♦ Eriotstarbelised otsingumootorid otsivad ainult kindlateemalisi saite, näiteks muusika- või muuseumisaite.

Otsingumootorite peamised omadused on järgmised:

♦ registris olevate dokumentide maht;
♦ teabe uuendamise sagedus;
♦ inforuum, mida otsingumootori robot katab, ja mitmesugused dokumenditüübid, mille kohta teavet kogutakse;
♦ taotleda taotluste töötlemise kiirust;
♦ asjakohasuse määramise kriteerium (leitud dokumendi vastavus otsingupäringule);
♦ taotluse täpsustamise ja täpsustamise võimalus.

Otsi otsingumootori rubrikaatori järgi

Otsingukataloogid on muude Interneti-ressursside linkide süstemaatiline kogumine (valik). Lingid on korraldatud temaatilise rubrikaatorina, mis kujutab endast hierarhilist struktuuri, mida mööda liikudes leiate vajaliku teabe.

Toome näitena Yandexi otsingu Interneti-kataloogi struktuuri. See on üldotstarbeline kataloog, kuna see sisaldab peaaegu kõigis võimalikes suundades linke Interneti-ressurssidele. See kataloog sisaldab järgmisi teemasid:

♦ Äri ja majandus;
♦ Viited ja lingid;
♦ Ühiskond ja poliitika;
♦ Kodu ja perekond;
♦ Teadus ja haridus;
♦ meelelahutus ja vaba aeg;
♦ Arvutid ja side;
♦ Kultuur ja kunst.

Iga teema sisaldab palju alajaotisi ja need omakorda sisaldavad rubriike jne.

Oletame, et valmistate ette võidupüha üritust ja soovite otsida Internetist Bulat Okudzhava kuulsa väelaulu "Sa kuuled, kuidas saapad müristavad" sõnu. Otsingut saab korraldada järgmiselt: Yandexi kataloog Kultuur ja kunst Muusika Autorilaul.

See otsingumeetod on üsna kiire ja tõhus. Lõpus pakutakse teile ainult 5 linki, mille hulgas on linke kuulsate bardide lauludega saitidele. Jääb vaid leida saidilt arhiiv B. Okudzhava laulusõnadega ja valida selles soovitud tekst.

Veel üks näide. Oletame, et kavatsete osta mobiiltelefoni ja soovite võrrelda erinevate ettevõtete seadmete omadusi. Otsingut saab teha järgmiste kataloogipealkirjade all: Yandexi kataloog Arvutid ja side Mobiilside Mobiiltelefonid.

Olles saanud piiratud arvu viiteid, saate neid kiiresti vaadata ja valida telefoni, uurides ettevõtete omadusi ja seadmete modifikatsioone.

Võtmesõna otsing

Enamikul otsingumootoritel on võimalus otsida märksõnade järgi. See on üks levinumaid otsingutüüpe. Märksõnade järgi otsimiseks peate spetsiaalsesse aknasse sisestama otsitava sõna või mitu sõna ja klõpsama nuppu Otsi. Otsingumootor leiab oma andmebaasist üles ja näitab neid sõnu sisaldavaid dokumente. Selliseid dokumente võib olla palju, kuid palju ei pruugi sel juhul tähendada head.

Teeme mõne otsingumootoriga katsed. Oletame, et otsustame asutada akvaariumi ja oleme huvitatud selle teema kohta igasugusest teabest.

Esmapilgul on kõige lihtsam otsida sõna "akvaarium". Kontrollime seda näiteks Yandexi otsingumootoris. Otsingu tulemuseks on üle 460 000 lehekülje 3500 saidil – tohutul hulgal linke. Veelgi enam, kui vaatate lähemalt, on nende hulgas saite, mis mainivad B. Grebenštšikovi Akvaariumi gruppi, kaubanduskeskusi ja samanimelisi mitteametlikke ühendusi ning palju muud, millel pole akvaariumikaladega mingit pistmist.

On lihtne arvata, et selline otsing ei suuda rahuldada isegi tagasihoidlikku kasutajat. Liiga palju aega tuleb kulutada kõigi pakutud dokumentide hulgast nende väljavalimisele, mis on seotud meile vajaliku teemaga, ja veelgi enam nende sisuga tutvumiseks.

Võime kohe järeldada, et enamasti ei tasu otsida ühe sõna järgi, sest ühe sõna järgi on dokumendi, veebilehe või saidi teemat väga raske määrata. Erandiks on haruldased sõnad ja terminid, mida väljaspool nende teemavaldkonda peaaegu kunagi ei kasutata.

Proovime täpsustada otsingutingimusi ja sisestada fraas "akvaariumi kalad". Otsingu tulemuseks on veidi üle 20 000 lehekülje ja umbes 650 saiti. Nagu näha, on linkide arv vähenenud üle 20 korra. See tulemus sobib meile rohkem, kuid siiski, pakutud linkide hulgast leiate näiteks venekeelseid kalapiltidega tikusiltide suveniiride komplekte ja arvuti töölaua ekraanisäästjate kogusid ning fotodega akvaariumi kalade katalooge ja akvaariumi. tarvikute kauplustes.

On ilmne, et peaksime jätkama liikumist otsingutingimuste täpsustamise suunas.

Otsingu produktiivsemaks muutmiseks on kõigil otsingumootoritel spetsiaalne päringukeel oma süntaksiga. Need keeled on paljuski sarnased. Nende kõigi õppimine on üsna keeruline, kuid igal otsingumootoril on abisüsteem, mis võimaldab teil soovitud keelt omandada.

Siin on kümme lihtsat reeglit päringu genereerimiseks Yandexi otsingumootoris.

1. Märksõnad päringus tuleb kirjutada väiketähtedega (väiketähtedega). See tagab, et otsitakse kõiki märksõnu, mitte ainult neid, mis algavad suure tähega.

2. Otsing võtab arvesse kõiki sõna vorme vastavalt vene keele reeglitele, olenemata päringus oleva sõna vormist. Näiteks kui päringus oli märgitud sõna “tea”, siis vastavad otsingutingimusele ka sõnad “tean”, “tean” jne.

3. Stabiilse fraasi otsimiseks tuleks sõnad lisada jutumärkidesse, näiteks “portselannõud”.

4. Täpse sõnavormi järgi otsimiseks tuleb sõna ette panna hüüumärk. Näiteks sõna "september" otsimiseks genitiivis kirjutage "!September".

5. Ühe lause piires otsimiseks eraldatakse päringus olevad sõnad tühiku või märgiga &: "seiklusromaan" või "seiklus ja romaan". Kui päringus on sisestatud mitu sõna, mis on eraldatud tühikutega, tähendab see, et need kõik peavad sisalduma otsitava dokumendi ühes lauses.

6. Kui soovite valida ainult need dokumendid, milles esineb iga päringus määratud sõna, pange nende ette plussmärk "+". Kui soovite vastupidiselt mõne sõna otsingutulemustest välja jätta, pange selle sõna ette miinus "-". Märgid "+" ja "-" tuleb kirjutada tühikuga eelmisest ja ühendada järgmise sõnaga. Näiteks päring "Volga-auto" leiab dokumendid, mis sisaldavad sõna "Volga", mitte sõna "auto".

7. Kui otsite sünonüüme või sõnu, mis on tähenduselt lähedased, võite sõnade vahele panna vertikaalse riba "|". Näiteks päringu "laps | laps | beebi" leiab dokumendid mis tahes nende sõnadega.

8. Päringu üksiku sõna asemel saate asendada terve väljendi. Selleks tuleb see võtta sulgudes, näiteks "(laps | beebi | lapsed | beebi) + (hooldus | kasvatus)".

9. Märk *~" (tilde) võimaldab leida dokumente, mille lause sisaldab esimest sõna, kuid ei sisalda teist. Näiteks otsing "raamatud ~ pood" leiab kõik dokumendid, mis sisaldavad sõna "raamatud", mille kõrval pole (lause sees) sõna "pood".

10. Kui operaatorit korratakse üks kord (näiteks & või ~), sooritatakse otsing lause sees. Topeltoperaator (&&, -) otsib dokumendist. Näiteks otsinguga "vähk – astroloogia" leiate dokumendid sõnaga "vähk", mis ei ole astroloogiaga seotud.

Kui soovitud piirkonnas on teatud komplekt enamlevinud termineid, saate kasutada täpsemat otsingut. Joonisel fig. 3.3 näitab Yandexi otsingumootoris täpsema otsingu akent. Selles režiimis rakendatakse päringukeele võimalusi vormina. Sarnast teenust, sealhulgas sõnastikufiltreid, pakuvad peaaegu kõik otsingumootorid.

Riis. 3.3. Täpsema otsingu näide Yandexi süsteemis

Arvestades soovitavate ja nõutavate sõnade õiget valikut ning ebasoovitavate terminite välistamist, võib selline otsing anda häid tulemusi.

Läheme tagasi akvaariumi kalade näite juurde. Pärast mitme otsingumootori pakutava dokumendi lugemist saab selgeks, et Internetist teabe otsimine ei tohiks alata akvaariumi kalade valikuga. Akvaarium on kompleksne bioloogiline süsteem, mille loomine ja hooldamine nõuab eriteadmisi, aega ja tõsiseid investeeringuid.

Saadud teabe põhjal saab Internetis otsingut tegev isik edasise otsingu strateegiat kardinaalselt muuta, otsustades uurida uuritava teemaga seotud erialakirjandust.

Kirjanduse või täisteksti dokumentide otsimiseks on võimalik teha järgmine päring:

"+ (akvaarium | akvaarist | akvaarist) + algajatele + (nõuanded | kirjandus) + (artikkel | lõputöö | täistekst) - (hind | pood | kohaletoimetamine | kataloog)".

Pärast päringu töötlemist otsingumootoris saadi järgmine tulemus: lehekülgi - 195, saite - vähemalt 43.

Nagu otsingustatistikast näha, oli tulemus väga edukas. Juba esimesed lingid viivad vajalike dokumentide juurde:

Akvaariumi seadistamine > Näpunäiteid algajale akvaaristile >
Artiklid > Aq uascope. et
http://aquascope.ru/modules/wfsection/article.php?page=l&articleid=49 (32KB) – range järgimine.
NÕUANDED ALGAJATELE AKVAARIUMISTELE. Kuidas valida ja paigaldada akvaariumi, kuidas...
http://www.aquariums.ru/sovna.htm (2KB) 23.07.2002 - mitterange kirjavahetus.

Nüüd saate kokku võtta otsingu tulemused, teha teatud järeldused ja otsustada võimalike toimingute üle:

♦ Lõpetage edasine otsimine, sest erinevatel põhjustel ei käi akvaariumi hooldamine teie jõust üle.
♦ Lugege soovitatud artikleid ja alustage akvaariumi seadistamist.
♦ Otsige materjale hamstrite või viirpapagoide kohta.

Professionaalne otsing

Teadlastel ja spetsialistidel tuleb otsingute korraldamisel läbimõeldumalt läheneda. Professionaalsel Internetist teabe otsimisel peavad olema täidetud järgmised nõuded:

♦ suur otsingukiirus;
♦ saadud teabe usaldusväärsus;
♦ ressursside täielikkus otsingu ajal.

Kiirus. Otsingu kiirus sõltub peamiselt kahest tegurist: pädevast otsingu planeerimisest (otsinguteenuste ja -tööriistade valik) ning oskustest töötada juba valitud ressursiga (oskus kiiresti mõista selle struktuuri ja navigeerimismeetodeid). Otsinguindeksitest ei piisa otsingukiiruse tagamiseks. Lisaks neile on Internetis hulk otsinguressursse, mille kasutamine tagab professionaalse otsingu sooritamise.

Töökindlus. Internetist saadava teabe usaldusväärsuse küsimus on väga asjakohane, kuna igaüks võib sinna paigutada mis tahes teavet, ilma et oleks kontrollitud selle vastavust tegelikkusele. See omakorda toob kaasa suure hulga ebausaldusväärseid allikaid, nagu kokkuvõtted ja kursusetööd, mis on internetti üle ujutanud.

On olemas spetsiaalsed otsinguteenused, mis võimaldavad teil hinnata Interneti-teabeallika usaldusväärsust.

Täielikkus. Eduka täiemahulise teabe kogumise vajalik tingimus on tänapäeval olemasolevate peamiste ressursside tüüpide tundmine ja erinevate otsinguteenuste kasutamine. Ükski otsingumootor ei suuda katta kõiki Interneti ressursse.

Reeglina peab kasutaja positiivse tulemuse saavutamiseks kasutama mitme otsingumootori teenuseid. Saate seda teha ise, liikudes süsteemist süsteemi või usaldada selle töö mõnele metaotsingumootorile (meta on süsteeme tähistavate liitsõnade esimene komponent teiste süsteemide kirjeldamiseks ja uurimiseks).

Riis. 3.4. Metaotsingu aknad

Metaotsingumootoritel ei ole oma otsinguandmebaase ja nad kasutavad otsimisel paljude teiste otsingumootorite ressursse. Tänu sellele on tõenäosus vajaliku info leidmiseks väga suur. Töö metaotsingusüsteemides toimub samade reeglite järgi nagu töö otsingumootorites. Selle põhjuseks on asjaolu, et metaotsingumootorid on omamoodi lisand otsingumootoritele ja kasutavad oma töös oma indeksite andmebaase. Metaotsingumootorite välimus meenutab tuntud otsingumootorite välimust. Joonisel fig. 3.4 näitab metaotsingumootorite myweb.ru ja metabot.ru aknaid.

Kogemused näitavad, et enamikul juhtudel saavutatakse parem tulemus mitme sõltumatu otsinguindeksi kasutamisel kui ühe metaotsingumootori kasutamisel.

Kontrollküsimused ja ülesanded

1. Mis on brauseriprogrammi eesmärk?

2. Milliseid brauseriprogramme teate?

3. Kust leiab Interneti-otsingut kavandav kasutaja URL-e?

4. Mis on otsingumootori rubrikaatori otsingutehnoloogia?

5. Mis on märksõnaotsingu tehnoloogia?

6. Milliseid nõudeid tuleb järgida professionaalsel Internetist teabe otsimisel?

7. Millal tuleb otsingukriteeriumides määrata märgid "+" või "-"?

8. Millised otsingukriteeriumid Yandexis määratakse järgmise fraasiga:

(lapsehoidja | õpetaja | guvernant) ++ (hooldus | kasvatus | juhendamine).

9. Mida tähendab märgi kahekordistamine (∼∼ või ++) komplekspäringu moodustamisel?

10. Mis on otsingu asjakohasus?

11. Mis on metaotsingumootorite eesmärk?

Otsinguvahendite klassifikatsioon (nende liigid ja tüübid) Otsingutööriistad võib jagada: - kataloogideks ehk kataloogideks - kataloogideks - otsingumootoriteks - otsingumootoriteks. See klassifikatsioon põhineb otsingutööriistade andmebaasi teabe valimise ja töötlemise põhimõttel, nimelt: kui automatiseeritud see protsess on, kes loob otsingutööriistade andmebaasi: inimesed või arvutid.


Otsingutööriistade klassifikatsioon (nende tüübid ja tüübid) Viimasel ajal on "kustutatud" erinevus otsingumootorite ja kataloogide vahel, kuna nende loojad püüavad kasutajaid mitte keskenduda teabe valiku põhimõtetele, vaid pakkuda võimalikult palju sarnaseid teenusevõimalusi. , mis töötavad universaalsete portaalidena. Kuid siiski jääb oluliseks ja määravaks erinevus teabe valikul ja töötlemisel: - otsingumootorid kasutavad otsimiseks, teabe indekseerimiseks roboteid - s.t. Protsess on täielikult automatiseeritud; - kataloogid on üles ehitatud sellele, et sait "ootab" teatud kataloogispetsialisti poolt vastuvõtmist, töötlemist ja kirjeldamist.


Otsingutööriistade klassifikatsioon (nende tüübid ja tüübid) Sellised erinevad otsingumootorite ja kataloogide tööpõhimõtted mõjutavad oluliselt nende mahtu ja sisu ning vastavalt sellele ka otsingustrateegiat: selle täisteksti. Kataloogid esindavad seda või teist saiti üldiselt – kataloogi koostaja märgib ja süstematiseerib saiti vastavalt selle üldisele sisule ning täistekste ei indekseerita. Otsingumootorid indekseerivad suure hulga saite, kuna veebisisu "sirvivad" robotid töötavad "lumepalli" põhimõttel, liikudes lingilt lingile. Kataloogid seevastu eristuvad nende andmebaasides olevate saitide valiku mõttekuse ja korrastatuse poolest (tavaliselt on need teaberikkad ja/või suurte füüsiliste objektide saidid).


Otsingutööriistade klassifikatsioon (nende tüübid ja tüübid) Niisiis, mõned otsingumootorid: Altavista (Yandex (Google (Rambler (FastSearch ()


Otsingutööriistade klassifikatsioon (nende tüübid ja tüübid) ja kataloogid (või kataloogid): Yahoo (Librarians Index to the Internet (lii.org) List.ru ()


Otsingutööriistade klassifikatsioon (nende tüübid ja tüübid) Loetletud hulgas, nagu märkasite, on nii universaalseid globaalseid otsingutööriistu kui ka universaalseid piirkondlikke (antud juhul venekeelseid). Siin on mõned teised: EuroFerret (Voila (Altavista Prantsusmaa (fr.altavista.com)) UKPlus (ukplus.co.uk)


Otsingutööriistade klassifikatsioon (nende tüübid ja tüübid) Otsingutööriistade jagamine globaalseteks ja piirkondlikeks pole midagi muud kui liigitamine indekseerimiseks ressursside valimise geograafilise põhimõtte järgi. Ka teised otsingutööriistad piiravad oma andmebaase sisu osas, kuid teemade kaupa: FindLaw (Whowhere (MusicSearch (HumorSearch (FindBook ()


Otsingumootorite klassifikatsioon (nende tüübid ja liigid) Pange tähele, et sellised spetsialiseeritud või temaatilised otsingumootorid võivad teie päringu otsimiseks kasutada: kas oma andmebaase või otsivad teisi otsingumootoreid kasutades kogu veebist.


Otsingutööriistade klassifikatsioon (nende liigid ja tüübid) Lisaks on olemas metaotsingumootorid, mis pakuvad otsingut mitmes otsingumootoris korraga. Näiteks: Mamma (Eeliseks on see, et sel juhul tagastatakse maksimaalne arv tulemusi, miinuseks on see, et kõikidel otsingumootoritel ei ole sama päringukeele süntaks (nt iga otsingumootor ei toeta jutumärke).


Otsingumootori päringukeele põhielemendid Loetleme otsingumootori päringukeele levinumad elemendid ja tunnused: Enimkasutatakse: + või - (kaasa või jäta termin otsingu ettekirjutusse); "jutumärgid" (fraasi, stabiilse fraasi tähistamiseks). Mõned kasutavad märkide + või - asemel liite JA, JA EI.


Otsingumootori päringukeele põhielemendid Enamik lubab sõna kärpimise märke vasakul * (näiteks: wish* – leitakse: soov, soovid, soovija, soovihari ja soovi-pesu) Mõned otsingumootorid on tundlikud suur- ja väiketähtede suhtes (näiteks kui otsite Altavista abil materjale perekonnanimega Stone inimeste kohta, kasutage kindlasti suurt algustähte, sest muidu leitakse kõik saidid, kus sõna kivi esineb).


Otsingumootori päringukeele põhielemendid (näitena Yandex) ElementMida see tähendab Päringu näide tühik või & või + loogiline JA (lause sees) perekonnaseadus && loogiline JA (dokumendi sees) retseptid && (sulatatud juust) | loogiline VÕIfoto | fotograafia | hetktõmmis | fotograafiline pilt


Otsingumootori päringukeele põhielemendid (näitena Yandex) () sõnade rühmitamine (tehnoloogia | tootmine) (või | kodujuust) ~ või - liit JA MITTE (lause sees) mõte ~ seadus ~ ~ liit JA MITTE (dokumendi sees) juhend pariis ~~ (agentuur | ringkäik) "" ​​otsi fraasi "luuleantoloogia"


Otsingumootori päringukeele põhielemendid (Yandexi näitel) ! sõna ees sõna täpne vorm!tõeline!moment – ​​Seadus jõustub kaks nädalat pärast avaldamist. $title("") Avaldis on HTML-dokumendi väljal Pealkiri. $title ("taimestik ja loomastik") – leheküljed, mille pealkirjad on sarnased "Siberi taimestiku ja loomastikuga"


Ja kokkuvõtteks: 1) Otsingustrateegia õigeks ülesehitamiseks peate esmalt ise otsustama, millist teavet soovite saada - mõnda üldist teavet, mis kirjeldab objekti või nähtust tervikuna või mõnda detaili, üksikasju, mida soovite saada. võib esineda dokumendi täistekstis. Esimesel juhul on soovitatav kasutada kataloogi, teisel - otsingumootorit. 2) Kui otsingut alustades ei tea veel täpselt, mida ja kui palju päringutulemustes saada tahad, on soovitatav kasutada erinevaid otsingutööriistu kombineeritult.

Otsingutööriistad

Otsingutööriistad on spetsiaalne tarkvara, mille põhieesmärk on pakkuda internetikasutajatele kõige optimaalsemat ja kvaliteetsemat infootsingut. Otsingutööriistu majutatakse spetsiaalsetes veebiserverites, millest igaüks täidab teatud funktsiooni:

1. Veebilehtede analüüs ja analüüsi tulemuste sisestamine otsinguserveri andmebaasi ühel või teisel tasemel.

2. Otsige teavet kasutaja soovil.

3. Kasutajasõbraliku liidese pakkumine teabe otsimiseks ja kasutajapoolseks otsingutulemuste vaatamiseks.

Nende või muude otsingutööriistadega töötamisel kasutatavad töömeetodid on peaaegu samad. Enne nende üle arutlemist kaaluge järgmisi mõisteid:

1. Otsingutööriista liides on esitatud hüperlinkide, päringustringi (otsingustringi) ja päringu aktiveerimise tööriistadega leheküljena.

2. Otsingumootori register on teatud reeglite järgi koostatud teabebaas, mis sisaldab veebilehtede analüüsi tulemusi.

3. Päring on märksõna või fraas, mille kasutaja sisestab otsinguribale. Erinevate päringute moodustamiseks kasutatakse erimärke ("", ~), matemaatilisi sümboleid (*, +, ?).

Infootsingu skeem on lihtne. Kasutaja sisestab võtmefraasi ja aktiveerib otsingu, saades seeläbi vastu vormistatud (antud) päringule vastava dokumendivaliku. See dokumentide loend on järjestatud teatud kriteeriumide alusel, nii et loendi ülaosas on need dokumendid, mis vastavad kõige rohkem kasutaja päringule. Iga otsingutööriist kasutab dokumentide järjestamisel erinevaid kriteeriume nii otsingutulemuste analüüsil kui ka indeksi moodustamisel (veebilehtede registriandmebaasi täitmisel).

Seega, kui määrate iga otsingutööriista otsingustringis sama kujundusega päringu, saate erinevaid otsingutulemusi. Kasutaja jaoks on suur tähtsus, millised dokumendid ilmuvad otsingutulemuste järgi kahe-kolmekümne esimese dokumendi hulka ja kuivõrd vastavad need dokumendid kasutaja ootustele.

Enamik otsingutööriistu pakub otsimiseks kahte võimalust − lihtne otsing(lihtotsing) ja Täpsem otsing(täpsem otsing) koos eritaotluse vormiga ja ilma. Vaatleme mõlemat tüüpi otsinguid ingliskeelse otsingumootori näitel.

Näiteks on AltaVista kasulik suvaliste päringute puhul "Midagi infotehnoloogia veebikraadide kohta", Yahoo otsingutööriist aga võimaldab hankida maailmauudiseid, valuutakursside infot või ilmaennustust.

Päringu täpsustamise kriteeriumide ja täpsemate otsingutehnikate valdamine võimaldab suurendada otsingu efektiivsust ja kiiresti leida vajalikku teavet. Esiteks saate otsingu tõhusust suurendada, kasutades päringutes loogilisi operaatoreid (operatsioone) Or, And, Near, Not, matemaatilisi ja erisümboleid. Kasutaja seob operaatorite ja/või sümbolite abil märksõnad soovitud järjestuses, et saada päringule sobivaim otsingutulemus. Taotluste vormid on näidatud tabelis 1.

Tabel 1

Lihtne päring annab hulga linke dokumentidele, sest loend sisaldab dokumente, mis sisaldavad ühte päringule sisestatud sõnadest või lihtsat fraasi (vt tabel 1). Operaator and võimaldab määrata, et kõik märksõnad peavad sisalduma dokumendi sisus. Dokumentide hulk võib siiski olla suur ja nende läbivaatamine võib võtta kaua aega. Seetõttu on mõnel juhul palju mugavam kasutada lähikonteksti operaatorit, mis näitab, et sõnad peaksid asuma dokumendis piisavalt lähedal. Läheduse kasutamine vähendab oluliselt leitud dokumentide arvu. Sümboli "*" olemasolu päringustringis tähendab, et sõna otsitakse selle maski järgi. Näiteks saame loendi dokumentidest, mis sisaldavad sõnaga "gov" algavaid sõnu, kui kirjutame päringu stringi "gov*". Need võivad olla sõnad valitsus, kuberner jne.

Kõige arenenumat venekeelse teabe otsinguteenust pakub Yandexi otsinguserver. Yandexis saate lihtsalt kirjutada vene keeles fraasi, mis kirjeldab seda, mida soovite leida, ning süsteem analüüsib ja töötleb teie päringut ning proovib seejärel leida kõike, mis on antud teemaga seotud. Saate spetsiaalsete operaatorite abil koostada stringi, mis selgitab otsingumootorile, millised peaksid olema teie nõuded teid huvitava teabe jaoks.

Sama populaarne otsingumootor Rambler säilitab lingiliikluse statistikat oma andmebaasist, samad loogilised operaatorid JA, VÕI, EI, metamärk * (sarnane AltaVista märgiga *, mis laiendab päringuvahemikku), koefitsientide sümbolid + ja - on päringus sisestatud olulisuse suurendamiseks või vähendamiseks.

Vaatame Internetis kõige populaarsemaid teabeotsingu tehnoloogiaid.

Loeng 4. Infootsingu vahendid

Teabemassiivi pidev värskendamine koos andmemahu suurenemisega muudab äärmiselt keeruliseks olemasolevate dokumentide arvestamise ja vastavalt ka otsingu, mille võib tinglikult jagada:

  • faktiline otsing:entsüklopeediates, teatmeteostes, sõnaraamatutes,
  • bibliograafiline otsing:raamatukogud, kataloogid, programmid.
  • dokumendi otsing:elektroonilised dokumendid, elektroonilised raamatukogud, elektroonilised ajakirjad.

Infootsingu probleemi olulisus on viinud terve tööstuse kujunemiseni, mille ülesandeks on just abistada kasutajat küberruumis navigeerimisel. Muutke see tööstus eriliseksotsinguteenused või teenuseid. Traditsiooniliselt jagunevad need järgmisteks osadeks:

  • kataloogid või kataloogid
  • otsingumootorid

Need sordid on visuaalselt väga sarnased, sest"igal kataloogil on oma otsingumootor ja igal otsingumootoril oma kataloog". Nende tööpõhimõtted põhinevad aga täiesti erinevatel lähenemistel ja tehnoloogiatel. Lisaks kasutatakse igat tüüpi otsinguteenuseid teatud tüüpi probleemide lahendamisel. Infootsing hõlmab teatud strateegiate, meetodite, mehhanismide ja vahendite kasutamist. Otsinguprotsessi haldava kasutaja käitumist ei määra mitte ainult infovajadus, vaid ka süsteemi instrumentaalne mitmekesisus – süsteemi pakutavad tehnoloogiad ja tööriistad. Instrumendi valik määrab suurestiotsingustrateegia ja otsingutehnoloogiad.

Otsingutehnoloogiad- ühtsed (optimeeritud konkreetse teabeotsingusüsteemi raames) jadad üksikute otsingutööriistade tõhusaks kasutamiseks kasutaja suhtlemise protsessis süsteemiga.

Kasutatud otsingutehnoloogiadInfosüsteemid võib jagada kolme kategooriasse:

  • temaatilised kataloogid ja erikataloogid (veebikataloogid);
  • otsingumootorid (täistekstiotsing);
  • metaotsingu tööriistad.

Temaatilised kataloogidnäha ette dokumentide menetlemine ja nende määramine ühte mitmest kategooriast, mille loetelu on eelnevalt kindlaks määratud. Tegelikult on see kõigile raamatukoguhoidjatele tuttav.klassifikatsioonipõhine indekseerimine. Spetsialiseeritud kataloogid või juhendid luuakse eraldi harude ja teemade järgi.otsingumootorid(Interneti kõige arenenum otsinguvõimalus) rakendavad täistekstiotsingu tehnoloogiat. Taotletud serverites asuvad tekstid indekseeritakse.Rahaliste vahendite kasutamisel metaotsing Päringut täidavad korraga mitu otsingumootorit. Otsingutulemused on kombineeritud üldiseks, asjakohasuse järgi sorteeritud loendiks.

Otsingutööriistad – vastastikku sõltuv teabeotsingu keelte ja andmete määratlemise/halduskeelte kompleks, mis pakub töötlemisobjektide (dokumendid, sõnastikud, otsingutulemuste kogud) struktuurseid ja semantilisi teisendusi.

1. Teatmeteosed

Esimese rühma otsingutööriistad on elektroonilised kataloogid, millel on selge hierarhiline süstemaatiline või loogilis-temaatiline struktuur,umbes nagu süstemaatilise raamatukogukataloogi struktuur. Kataloogidega töötamine võimaldab teil navigeerida Interneti-ressurssides üksikute teadmiste harude piires, süvenedes üldisest konkreetsesse, muutes hierarhilisi harusid, liikudes mõne sammu võrra tagasi jne.

Venemaa arengute hulgas selles valdkonnas on järgmised:

  • Aport (aadress: www.aport.ru),
  • List.ru (aadress: list.mail.ru),
  • Veebiloend (aadress: www.weblist.ru),
  • Ivan Susanin (aadress: www.susanin.net
  • Tigu (aadress: www.ulitka.ru).

Teatmeteoste peamine eripära on see, et need on valmistatud käsitsi. Iga teatmeteose toimetuskolleegiumid, misoma töö iseloomult meenutavad nad suurte raamatukogude kataloogimis- ja süstematiseerimisosakondi, vaadake regulaarselt üle äsja ilmunud serverite sisu ja jälgige olemasolevate serverite muudatusi. Ilmunud andmeid analüüsitakse ja kantakse teatmeteose osadesse vastavalt aktsepteeritud klassifikatsioonile. Serveri kui terviku kirjeldus (või jaotis, kui see näib olevat täiesti sõltumatu plokk) on varustatud lühikese märkusega, mis sisaldab üldist teavet saadaoleva teabe olemuse kohta. Mõnel juhul sisestatakse lisateavet dokumentide keele, ressursi külastatavuse, selle füüsilise asukoha jms kohta.

Kataloogide eeliseid iseloomustavad peamised parameetrid on järgmised:

  • maht;
  • uute või muutunud ressursside kajastamise tõhusus;
  • hierarhilise liigitusskeemi järjepidevus ja järjepidevus;
  • struktuuri crossover.

Kataloogi maht määrab selle usaldusväärsuse või "teabe tugevus". Mõnes süsteemis on spetsiaalne mehhanism, mis kontrollib perioodiliselt saidi saadavust ja jätab selle loendist välja, kui veebis on pikaajaline "puudumine". Rakendatud klassifitseerimisskeemi loogika (teaduslik) määrab, kui kergesti kasutajad vajaliku teabe leiavad. Süsteemristviitedvõimaldab teil tuvastada teavet erinevate lähenemisviiside abil (näiteks territoriaalne või valdkondlik). Sel juhul peaks klassifitseerimisskeem kasutaja automaatselt juhtima soovitud objektini, olenemata sellest, milline otsingutee on valitud.

Seda tüüpi otsingutööriistade jaoks päringu koostamise võimalus ei mängi erilist rolli. Keerulisi otsinguid, mis nõuavad päringu täpsustamist, kataloogide abil ei teostata.

Kataloogid on mõeldud lahendamisekskolme tüüpi ülesandeid:

  • orienteerumine võõras teadmiste harus;
  • otsida suuri objekte, mis on näiteks organisatsioonide serverid või olulised projektid;
  • valmis loendi hankimine häguse otsingupildiga ressurssidest (teatud tüüpi raamatukogud, transpordigraafikud või erakondade veebisaidid jne)

Teine näide on ressursijuhendi võrdlus raamatukogu süstemaatilise kataloogiga, kus raamatule (antud juhul tervele veebisaidile) jäetakse ainult kirjeldus ja annotatsioon.

2. Otsingumootorid

Otsingumootorite (otsingumootorite) töö põhineb täiesti erinevatel tehnoloogilistel põhimõtetel. Otsingumootorite ülesanne on pakkuda üksikasjalikku teabeotsingut, mida saab saavutada ainult raamatupidamise kaudu ( indekseerimine ) võimalikult paljude veebilehtede sisu. Erinevalt kataloogidest töötavad otsingumootorid automatiseeritud režiimis ja neil on ühtne tööpõhimõte.

Otsingumootorid koosnevad kahest põhikomponendist. Esimene komponent on roboti programm , mille ülesanne on liikuda serverist serverisse ja leida sealt uusi (või muudetud) dokumente, laadides need alla süsteemi põhiarvutisse. Robot vaatab läbi dokumendi sisu, leiab uusi linke, nii teistele serveris olevatele dokumentidele kui ka välistele saitidele. Seejärel läheb programm iseseisvalt määratud linkidele, leiab uued dokumendid, mille järel korratakse protsessi uuesti,meenutades bibliograafias tuntud "lumepallimeetodit".. Tuvastatud dokumente töötleb (indekseerib) otsingumootori teine ​​komponent. Sel juhul võetakse reeglina arvesse kogu lehe sisu, sealhulgas tekst, illustratsioonid, heli- ja videofailid. Kõik dokumendis olevad sõnad on indekseeritud, mis võimaldab kasutada otsingumootoreid üksikasjalike otsingute tegemiseks kõige kitsamatel teemadel. Moodustatud indeksfailid , salvestades teavet selle kohta, mis märksõna, mitu korda, millises dokumendis ja millises serveris seda kasutatakse, moodustavad andmebaasi, millele raamatukoguhoidja pöördub märksõnakombinatsioonide sisestamisel päringustringi.

Tulemuste väljastamine toimub spetsiaalse mooduli abil, mis toodabintelligentne tulemuste järjestamine . See võtab arvesse:

  • termini asukoht dokumendis (pealkiri, pealkiri, põhitekst), selle kordumise sagedus,
  • otsingutermini ja lehe teksti protsentuaalne suhe,
  • muudelt saitidelt sellele lehele viivate välislinkide arv ja autoriteet.

To otsingumootorite põhiparameetrid seotud:

  • indekseeritud serverite ja üksikute dokumentide arv (indeksifailide maht);
  • andmebaasi uuendamise tõhusus uute materjalide kohta teabe lisamise ja vananenud materjalide kustutamise kaudu;
  • päringu tegemise võimalused;
  • otsingutulemuste järjestussüsteemi intelligentsus;
  • täiendavate teenusefunktsioonide olemasolu, mis hõlbustavad kasutaja tööd.

Otsingumootori võime päringut võimalikult täpselt väljendada määrab suuresti saadud tulemuste kvaliteedi. Igal masinal on oma sõnavara, mis võimaldab erinevatel viisidel detaile kirjeldadaläbiotsimisluba.

Kõik otsingumootorid onotsingutulemuste järjestamise moodul. See on kõigi süsteemide teine ​​põhikomponent. Dokumendi koha määramisel linkide loendis arvesse võetavate tegurite loetelu on ebatavaliselt lai: alates sõna asukohast lehel kuni leitud dokumendile viitavate lehtede reitingu (autoriteedi)ni.

  • Google (aadress: www.google.com ),
  • AlltheWeb (aadress: www.alltheweb.com),
  • Alta Vista (aadress: www.altavista.com).

Sarnased otsingutööriistad on ka Venemaal. Kõik need on loodud töötama venekeelsete dokumentidega ja neil on võimas http://www.metabot.ru).

Järeldused loenguploki teemal

Otsingumootor teeb andmebaasist lehekülgede valiku vastavalt päringule, seejärel järjestatakse lehed kahanevate vastete järgi (märkus A.A.)

Sel juhul on otsene analoogia raamatukogu hajutatud koondkataloogide toimimispõhimõtetega. Võtmevõimalus metaotsing on võimalus saata kasutajate päringuid samaaegselt erinevatele otsingumootoritele – koos tulemuste hilisema summeerimisega. (A.A. märkus)

Kataloogide poole pöördudes võib raamatukoguhoidja eeldada, et ta saab selle teema kohta ainult väga üldist teavet ja mitte kunagi - üksikasjalikke andmeid: tuhandeid lehekülgi sisaldava suurettevõtte serverist esitab kataloog ainult nime ja paar rida annotatsiooni.

Laadimine...
Üles