Kaasaegsed teabeotsingu meetodid. Selle tulemusena moodustub teaberessursside loend. See samm võimaldab luua isikliku teabesüsteemi, mis on suunatud konkreetse otsinguprobleemi lahendamisele. Selle meetodi põhiolemus on kohaldamine

1. Sissejuhatus

Igal aastal suureneb Interneti maht mitu korda, seega suureneb hüppeliselt tõenäosus vajaliku teabe leidmiseks. Internet ühendab miljoneid arvuteid, palju erinevaid võrke, kasutajate arv kasvab aastas 15-80%. Ja sellegipoolest ei ole Internetti sisenemisel üha sagedamini peamine probleem vajaliku teabe puudumine, vaid selle leidmise võimalus. Tavainimene erinevate asjaolude tõttu ei saa või ei taha reeglina kulutada vajaliku vastuse otsimisele rohkem kui 15-20 minutit. Seetõttu on eriti oluline õigesti ja asjatundlikult õppida, näib, lihtne asi - kust ja kuidas otsida, et saada SOOVITUD vastused.

Vajaliku teabe leidmiseks peate leidma selle aadressi. Selleks on spetsiaalsed otsinguserverid (indeksirobotid (otsingumootorid), temaatilised Interneti-kataloogid, metaotsingusüsteemid, inimeste otsinguteenused jne). See meistriklass paljastab Internetist teabe otsimise peamised tehnoloogiad, pakub otsingutööriistade ühiseid funktsioone, uurib populaarsemate vene- ja ingliskeelsete otsingumootorite otsingupäringute struktuuri.

2. Otsingutehnoloogiad

Veebitehnoloogia World Wide Web (WWW) peetakse spetsiaalseks tehnoloogiaks dokumentide koostamiseks ja Internetis paigutamiseks. WWW sisaldab veebilehti, elektroonilisi raamatukogusid, katalooge ja isegi virtuaalseid muuseume! Sellise infokülluse juures tekib teravalt küsimus: "Kuidas nii tohutus ja mastaapses inforuumis navigeerida?"
Selle probleemi lahendamisel tulevad appi otsingutööriistad.

2.1 Otsingutööriistad

Otsingutööriistad on spetsiaalne tarkvara, mille põhieesmärk on pakkuda internetikasutajatele kõige optimaalsemat ja kvaliteetsemat infootsingut. Otsingutööriistu majutatakse spetsiaalsetes veebiserverites, millest igaüks täidab teatud funktsiooni:

  1. Veebilehtede analüüs ja analüüsi tulemuste sisestamine otsinguserveri andmebaasi ühele või teisele tasemele.
  2. Otsige teavet kasutaja soovil.
  3. Kasutajasõbraliku liidese pakkumine teabe otsimiseks ja kasutajapoolseks otsingutulemuste vaatamiseks.

Nende või muude otsingutööriistadega töötamisel kasutatavad töömeetodid on peaaegu samad. Enne nende üle arutlemist kaaluge järgmisi mõisteid:

  1. Otsingutööriista liides on esitatud hüperlinkide, päringustringi (otsingustringi) ja päringu aktiveerimise tööriistadega leheküljena.
  2. Otsingumootori register on teabebaas, mis sisaldab teatud reeglite järgi koostatud veebilehtede analüüsi tulemusi.
  3. Päring on märksõna või fraas, mille kasutaja sisestab otsinguribale. Erinevate päringute moodustamiseks kasutatakse erimärke ("", ~), matemaatilisi sümboleid (*, +, ?).

Internetist teabe otsimise skeem on lihtne. Kasutaja sisestab võtmefraasi ja aktiveerib otsingu, saades seeläbi vastu vormistatud (antud) päringule vastava dokumendivaliku. See dokumentide loend on järjestatud teatud kriteeriumide alusel, nii et loendi ülaosas on need dokumendid, mis vastavad kõige rohkem kasutaja päringule. Iga otsingutööriist kasutab dokumentide järjestamisel erinevaid kriteeriume nii otsingutulemuste analüüsil kui ka indeksi moodustamisel (veebilehtede registriandmebaasi täitmisel).

Seega, kui määrate iga otsingutööriista otsingustringis sama kujundusega päringu, saate erinevaid otsingutulemusi. Kasutaja jaoks on suur tähtsus, millised dokumendid ilmuvad otsingutulemuste järgi kahe-kolmekümne esimese dokumendi hulka ja kuivõrd vastavad need dokumendid kasutaja ootustele.

Enamik otsingutööriistu pakub otsimiseks kahte võimalust − lihtne otsing(lihtotsing) ja Täpsem otsing(täpsem otsing) koos eritaotluse vormiga ja ilma. Vaatleme mõlemat tüüpi otsinguid ingliskeelse otsingumootori näitel.

Näiteks on AltaVista kasulik suvaliste päringute puhul "Midagi infotehnoloogia veebikraadide kohta", Yahoo otsingutööriist aga võimaldab hankida maailmauudiseid, valuutakursside infot või ilmaennustust.

Päringu täpsustamise kriteeriumide ja täpsemate otsingutehnikate valdamine võimaldab suurendada otsingu efektiivsust ja kiiresti leida vajalikku teavet. Esiteks saate otsingu tõhusust suurendada, kasutades päringutes loogilisi operaatoreid (operatsioone) Or, And, Near, Not, matemaatilisi ja erisümboleid. Kasutaja seob operaatorite ja/või sümbolite abil märksõnad soovitud järjestuses, et saada päringule sobivaim otsingutulemus. Taotluste vormid on näidatud tabelis 1.

Tabel 1

Lihtne päring annab hulga linke dokumentidele, sest loend sisaldab dokumente, mis sisaldavad ühte päringule sisestatud sõnadest või lihtsat fraasi (vt tabel 1). Operaator and võimaldab määrata, et kõik märksõnad peavad sisalduma dokumendi sisus. Dokumentide hulk võib siiski olla suur ja nende läbivaatamine võib võtta kaua aega. Seetõttu on mõnel juhul palju mugavam kasutada lähikonteksti operaatorit, mis näitab, et sõnad peaksid asuma dokumendis piisavalt lähedal. Läheduse kasutamine vähendab oluliselt leitud dokumentide arvu. Sümboli "*" olemasolu päringustringis tähendab, et sõna otsitakse selle maski järgi. Näiteks saame loendi dokumentidest, mis sisaldavad sõnaga "gov" algavaid sõnu, kui kirjutame päringu stringi "gov*". Need võivad olla sõnad valitsus, kuberner jne.

Sama populaarne otsingumootor Rambler säilitab lingiliikluse statistikat oma andmebaasist, samad loogilised operaatorid JA, VÕI, EI, metamärk * (sarnane AltaVista märgiga *, mis laiendab päringuvahemikku), koefitsientide sümbolid + ja - on päringus sisestatud olulisuse suurendamiseks või vähendamiseks.

Vaatame Internetis kõige populaarsemaid teabeotsingu tehnoloogiaid.

2.2 Otsingumootorid

Veebiotsingumootorid on tohutul hulgal URL-ide andmebaasiga serverid, mis pääsevad kõikidel nendel aadressidel automaatselt WWW-lehtedele, uurivad nende lehtede sisu, vormivad ja kirjutavad lehtedelt märksõnu oma andmebaasi (indeksilehed).

Lisaks järgivad otsingumootori robotid lehtedel leiduvaid linke ja indekseerivad need uuesti. Kuna peaaegu igal WWW lehel on palju linke teistele lehtedele, siis sellise tööga võib otsingumootor lõpptulemuses teoreetiliselt mööda minna kõikidest interneti saitidest.

Just seda tüüpi otsingutööriistad on kõigi Interneti-kasutajate seas kõige kuulsamad ja populaarsemad. Kõik teavad tuntud veebiotsingumootorite (otsingumootorite) nimesid - Yandex, Rambler, Aport.

Seda tüüpi otsingutööriista kasutamiseks peate selle juurde minema ja sisestama otsinguribale teid huvitava märksõna. Järgmisena saate väljundi otsingumootori andmebaasi salvestatud linkidest, mis on teie päringule kõige lähemal. Otsingu kõige tõhusamaks muutmiseks pöörake eelnevalt tähelepanu järgmistele punktidele:

  • otsustada taotluse teema üle. Mida sa täpselt otsid?
  • pöörata tähelepanu keelele, grammatikale, erinevate mittetähestikuliste märkide kasutamisele, morfoloogiale.Oluline on ka võtmesõnade õige sõnastamine ja sisestamine. Igal otsingumootoril on oma päringu esitamise vorm – põhimõte on sama, kuid kasutatavad sümbolid või operaatorid võivad erineda. Nõutavad päringuvormid sõltuvad ka otsingumootori tarkvara keerukusest ja pakutavatest teenustest. Ühel või teisel viisil on igas otsingumootoris jaotis "Abi" ("Abi"), kus kõik süntaksireeglid, samuti soovitused ja näpunäited otsimiseks on hõlpsasti lahti seletatud (otsingumootori lehtede ekraanipilt).
  • kasutada erinevate otsingumootorite võimalusi. Kui te ei leia seda Yandexist, proovige Google'it. Kasutage täpsemaid otsinguteenuseid.
  • teatud termineid sisaldavate dokumentide välistamiseks kasutage iga sellise sõna ees märki "-". Näiteks kui soovite teavet Shakespeare'i teoste kohta, välja arvatud "Hamlet", siis sisestage päring kujul: "Shakespeare-Hamlet". Ja selleks, et teatud lingid kindlasti otsingutulemustes sisalduksid, kasutage sümbolit "+". Seega on konkreetselt autode müügiga seotud linkide leidmiseks vaja päringut "müük + auto". Otsingu tõhususe ja täpsuse suurendamiseks kasutage nende sümbolite kombinatsioone.
  • iga link otsingutulemuste loendis sisaldab - mitu rida leitud dokumendist, mille hulgas on teie märksõnad. Enne lingil klõpsamist hinnake väljavõtte asjakohasust päringu teemaga. Pärast konkreetse saidi lingil klõpsamist vaadake hoolikalt avalehel ringi. Reeglina piisab esimesest lehest, et aru saada, kas oled aadressile tulnud või mitte. Kui jah, siis otsige valitud saidil (saidi jaotistes) vajalikku teavet, kui ei, naaske otsingutulemuste juurde ja proovige järgmist linki.
  • pidage meeles, et otsingumootorid ei tooda sõltumatut teavet (välja arvatud selgitused enda kohta). Otsingumootor on vaid vahendaja teabe (veebisaidi) omaniku ja teie vahel. Andmebaase uuendatakse pidevalt, neisse sisestatakse uusi aadresse, kuid lünk maailmas reaalselt eksisteerivast infost jääb siiski alles. Lihtsalt sellepärast, et otsingumootorid ei tööta valguse kiirusel.

Tuntuimate veebiotsingumootorite hulka kuuluvad Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Vene keelt kõnelejate hulgast võib välja tuua Yandexi, Rambleri, Aporti.

Otsingumootorid on suurimad ja väärtuslikumad, kuid kaugeltki mitte ainsad teabeallikad veebis, sest peale nende on ka teisi võimalusi Internetist otsimiseks.

2.3 Kataloogid

Internetiressursside kataloog on pidevalt uuenev ja täienev hierarhiline kataloog, mis sisaldab paljusid kategooriaid ja üksikuid veebiservereid koos nende sisu lühikirjeldusega.Kataloogiotsingu meetod eeldab liikumist allapoole, st üldisematelt kategooriatelt rohkematele liikumist. konkreetsed. Temaatiliste kataloogide üks eeliseid on see, et linkide selgitused on antud kataloogi loojate poolt ja need kajastavad täielikult selle sisu ehk annab võimaluse täpsemalt kindlaks teha, kuidas serveri sisu vastab eesmärgile. teie otsingust.

Temaatilise venekeelse kataloogi näide on ressurss http://www.ulitka.ru/.

Selle saidi avalehel on temaatiline rubriikaator,

mille abil kasutaja siseneb rubriiki koos linkidega teda huvitavatele toodetele.

Lisaks võimaldavad mõned teemakataloogid otsida märksõnade järgi. Kasutaja sisestab otsinguribale soovitud märksõna

ja saab linkide loendi nende saitide kirjeldustega, mis vastavad tema päringule kõige paremini. Tuleb märkida, et see otsing ei toimu mitte WWW-serverite sisus, vaid nende lühikirjelduses, mis on salvestatud kataloogi.

Meie näites on kataloogil ka võimalus sorteerida saite külastuste arvu, tähestiku ja sisestamise kuupäeva järgi.

Teised näited venekeelsetest kataloogidest:
[email protected]
Veebiloend
Vsego.ru
Ingliskeelsete kataloogide hulgas on:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 Linkide kogud

Lingikogud on teemade järgi sorteeritud lingid. Sisult on need üksteisest üsna erinevad, nii et huvidele kõige sobivama valiku leidmiseks tuleb need oma arvamuse kujundamiseks iseseisvalt läbi käia.

Näitena toome valiku linke "Interneti aarded" JSC "Relcom"

Kasutaja, klõpsates mis tahes teda huvitaval jaotisel

  • SISU

    Autojuhtidele

    • Astronoomia ja astroloogia
    • Sinu maja
    • Teie lemmikloomad
    • Lapsed on elu lilled
    • Vaba aeg
    • Linnad Internetis
    • Tervis ja meditsiin
    • Infoagentuurid ja -teenused
    • koduloomuuseum jne,
    • Autode elektroonika.
    • Antiikautode muuseum.
    • Autoomanike õiguskaitseamet.
    • sportdrive.

    Seda tüüpi otsingutööriistade eeliseks on nende fookus, tavaliselt sisaldab valik haruldasi Interneti-ressursse, mille valib välja konkreetne veebihaldur või veebilehe omanik.

    2.5 Aadresside andmebaasid

    Aadressiandmebaasid on spetsiaalsed otsinguserverid, mis tavaliselt kasutavad klassifikatsioone tegevuse tüübi, pakutavate toodete ja teenuste ning geograafia järgi. Mõnikord lisandub neile ka tähestikuline otsing. Andmebaasi kirjed salvestavad teavet saitide kohta, mis annavad tasu eest teavet e-posti aadressi, organisatsiooni ja postiaadressi kohta.

    Suurima ingliskeelse aadresside andmebaasi saab helistada: http://www.lookup.com/ -

    Nendesse alamkataloogidesse sattudes leiab kasutaja lingid saitidele, mis pakuvad talle huvipakkuvat teavet.

    Laialt kättesaadavad ja ametlikud aadresside andmebaasid Vene Föderatsioonis on meile tundmatud.

    2.6 Gopheri arhiivide otsimine

    Gopher on Interneti kaudu jaotatud serverite omavahel ühendatud süsteem (Gopheri ruum).

    Kõige rikkalikum kirjanduslik raamatukogu on kogutud Gopheri ruumi, kuid materjalid pole kaugvaatamiseks saadaval: kasutaja saab vaadata ainult hierarhiliselt korraldatud sisukorda ja valida faili pealkirja järgi. Spetsiaalse programmi (Veronica) abil saab sellist otsingut teha automaatselt, kasutades märksõnapõhiseid päringuid.

    Kuni 1995. aastani oli Gopher kõige dünaamilisem Interneti-tehnoloogia: seotud serverite arvu kasvutempo ületas kõigi teiste Interneti tüüpide serverite kasvutempo. EUnet/Relcomi võrgus pole Gopheri serverid aktiivset arendust saanud ja täna ei mäleta neid peaaegu keegi.

    2.7 FTP failiotsingu süsteem (FTP otsing)

    FTP-failide otsingumootor on Interneti-otsingumootori eritüüp, mis võimaldab teil leida faile, mis on saadaval "anonüümsetes" FTP-serverites. FTP-protokoll on loodud failide edastamiseks üle võrgu ja selles mõttes on see funktsionaalselt Gopheri omamoodi analoog.

    Peamine otsingukriteerium on mitmel viisil määratud failinimi (täpne vaste, alamstring, regulaaravaldis jne). Seda tüüpi otsing ei saa muidugi võimaluste poolest otsingumootoritega konkureerida, kuna failide sisu ei võeta otsimisel kuidagi arvesse ja failidele saab teatavasti anda suvalisi nimesid. Kui teil on aga vaja leida mõni tuntud programm või standardkirjeldus, siis suure tõenäosusega saab seda sisaldav fail õige nime ja leiate selle mõne FTP-otsinguserveri abil:

    FileSearch otsib FTP-serveritest faile failide endi ja kataloogide nimede järgi. Kui otsid programmi või midagi muud, siis WWW-serveritelt leiad suure tõenäosusega nende kirjelduse ning FTP-serveritest saad need endale alla laadida.

    2.8 Otsingumootor Useneti uudistekonverentsidel

    USENET NEWS on Interneti kogukonna telekonverentsisüsteem. Läänes nimetatakse seda teenust uudisteks. Telekonverentsi lähedane analoog on nn "kajad" FIDO võrgus.

    Telekonverentsi tellija seisukohast on USENET teadetetahvel, millel on jaotised, kust leiate artikleid kõige kohta alates poliitikast kuni aianduseni. See teadetetahvel on sarnaselt e-postiga ligipääsetav arvuti kaudu. Arvuti juurest lahkumata saate lugeda või postitada artikleid konkreetsele konverentsile, leida kasulikke nõuandeid või osaleda aruteludes. Loomulikult võtavad artiklid arvutis ruumi, mistõttu neid ei säilitata igavesti, vaid need hävitatakse perioodiliselt, tehes ruumi uutele. Kogu maailmas on Useneti konverentsidelt teabe leidmiseks parim teenus Google'i gruppide server (Google Inc.).

    Google'i grupid on tasuta võrgukogukond ja vestlusrühmade teenus, mis pakub Internetis suurimat Useneti sõnumite arhiivi (rohkem kui miljard sõnumit). Lisateavet teenuse kasutustingimuste kohta leiate aadressilt http://groups. google.com/intl/ru /googlegroups/tour/index.html

    Venekeelsetest torkavad silma USENET World Systemi server ja Relcomi telekonverentsid. Nii nagu teistes otsinguteenustes, sisestab kasutaja päringustringi ja server loob märksõnadega konverentside loendi. Järgmiseks peate tellima uudistesaates valitud konverentsid. Samuti on olemas sarnane vene FidoNet Online server: WWW-s Fido konverentsid.

    2.9 Metaotsingusüsteemid

    Kiireks otsinguks mitme otsingumootori andmebaasides korraga on parem pöörduda metaotsingusüsteemide poole.

    Metaotsingumootorid on otsingumootorid, mis saadavad teie päringu suurele hulgale erinevatele otsingumootoritele, seejärel töötlevad tulemusi, eemaldavad dubleerivad ressursside aadressid ja esitavad laiemat valikut Internetis esitatavast.

    Maailma populaarseim metaotsingumootor on Search.com.

    Unified Search.com otsingumootor firmalt CNET, Inc. sisaldab peaaegu kahte tosinat otsingumootorit, mille lingid on täis kogu Internetti.

    Seda tüüpi otsingutööriistu kasutades saab kasutaja otsida teavet erinevatest otsingumootoritest, kuid nende süsteemide negatiivseks pooleks võib nimetada nende ebastabiilsust.

    2.10 Inimeste otsingusüsteemid

    Inimeste otsingusüsteemid on spetsiaalsed serverid, mis võimaldavad otsida inimesi Internetist, kasutaja saab määrata täisnime. isik ja hankida tema e-posti aadress ja URL. Siiski tuleb märkida, et inimeste otsingumootorid võtavad e-posti aadresside kohta teavet tavaliselt avatud allikatest, näiteks Useneti foorumitest. Kõige kuulsamate inimeste otsingusüsteemide hulgas on järgmised:

    E-posti aadresside leidmine

    spetsiaalsetest kontaktandmete otsinguväljadest (Eesnimi. Linn, Perekonnanimi, Telefoninumber) leiate teid huvitava teabe.

    Inimeste otsingumootorid on tõesti suured serverid, nende andmebaasid sisaldavad umbes 6 000 000 aadressi.

    3. Järeldus

    Vaatasime üle peamised Internetist teabe otsimise tehnoloogiad ja tutvustasime üldiselt praegu Internetis olemasolevaid otsingutööriistu, samuti populaarsemate vene- ja ingliskeelsete otsingumootorite otsingupäringute struktuuri ning Ülaltoodut kokku võttes tahame märkida, et ühtset optimaalset skeemi Internetist teabe otsimiseks ei eksisteeri. Sõltuvalt konkreetsest teabest, mida vajate, saate kasutada sobivaid otsingutööriistu ja -teenuseid. Ja otsingutulemuste kvaliteet sõltub sellest, kui pädevalt otsinguteenused on valitud.

  • Otsingutehnoloogiad

    Hõõrdumise ja soojuse ja massi ülekande seadused turbulentses piirkihis

    Hõõrdeseaduse ʼʼhõõrdeseaduseʼʼ esituse kohta on mitu versiooni (võrdlusjuhtumi jaoks), mis annavad peaaegu identsed tulemused. Kooskõlas "logaritmilise" piirkihi kontseptsiooniga (esimese turbulentsuskonstandi väärtusega χ = 0,4) Äärmiselt arenenud turbulentsi hõõrdeseadus koos ʼʼkaduva viskoossusegaʼʼ on hästi lähendatud lihtsa Karmani valemiga:

    Kiirusprofiili võimsusseaduse esituse korral tuleks välja pakkuda järgmine valem:

    kus: ; n on kiirusprofiili eksponent;

    – poolempiiriline koefitsient;

    AGA– empiiriline koefitsient;

    δ on piirkihi paksus.

    Erinevatel lineaarsetel suurustel põhinevate Reynoldsi arvude suhte kasutamine:

    Oluline on märkida, et turbulentse piirkihi tekkimise korral esiservast ( x cr = 0) hõõrdeseadust tuleb esitada ka järgmiselt:

    Esitatud valemite parameetriliste väärtuste väärtused erinevate kiirusprofiilide jaoks on kokku võetud tabelis

    Parameeter n
    1/7 1/8 1/9 1/10
    AGA 8,74 9,71 10,6 11,5
    0,0975 0,089 0,0818 0,0757
    1,28 1,25 1,22 1,20
    m 0,250 0,222 0,200 0,182
    B 0,0252 0,0206 0,0190 0,0148
    m 1 0,200 0,182 0,167 0,154
    B1 0,0576 0,0450 0,0362 0,0308

    Tuntakse ja kasutatakse ka teisi hõõrdeseaduse esitusviise, mis annavad praktiliselt samad tulemused. Nii et V.M. Ievlev pakkus välja ligikaudse variandi:

    Soojus- ja massiülekandeseaduste valemid saadakse standardtingimuste (võrdlusjuhtumi) hõõrdeseadustest ʼʼhõõrdeseadustestʼʼ Reynoldsi kolmikanaloogia üldtuntud põhimõtte abil.

    kus: S– parandustegur – Reynoldsi analoogitegur standardi(te) tingimustele mittevastavuse kohta, tegur S esimeses lähenduses on rahuldavalt lähendatud seosega:

    Oluline on märkida, et integraalparameetrite kasutamisel kirjeldavad soojus- ja massiülekande ʼʼseadusiʼʼ hästi sõltuvused:

    Veebitehnoloogia World Wide Web (WWW) peetakse spetsiaalseks tehnoloogiaks dokumentide koostamiseks ja Internetis paigutamiseks. WWW sisaldab veebilehti, elektroonilisi raamatukogusid, katalooge ja isegi virtuaalseid muuseume! Sellise infokülluse juures tekib teravalt küsimus: ʼʼKuidas nii tohutus ja mastaapses inforuumis orienteeruda –ʼʼ Selle probleemi lahendamisel tulevad appi otsingutööriistad.

    Otsingutööriistad on spetsiaalne tarkvara, mille põhieesmärk on pakkuda internetikasutajatele kõige optimaalsemat ja kvaliteetsemat infootsingut. Otsingutööriistu majutatakse spetsiaalsetes veebiserverites, millest igaüks täidab teatud funktsiooni:

    1. Veebilehtede analüüs ja analüüsi tulemuste sisestamine otsinguserveri andmebaasi ühel või teisel tasemel.

    2. Otsige teavet kasutaja soovil.

    3. Kasutajasõbraliku liidese pakkumine teabe otsimiseks ja kasutajapoolseks otsingutulemuste vaatamiseks.

    Nende või muude otsingutööriistadega töötamisel kasutatavad töömeetodid on peaaegu samad. Enne nende üle arutlemist kaaluge järgmisi mõisteid:

    1. Otsingutööriista liides on esitatud hüperlinkide, päringustringi (otsingustringi) ja päringu aktiveerimise tööriistadega leheküljena.

    2. Otsingumootori register - ϶ᴛᴏ teabebaas, mis sisaldab teatud reeglite järgi koostatud veebilehtede analüüsi tulemusi.

    3. Päring – ϶ᴛᴏ märksõna või fraas, mille kasutaja sisestab otsinguribale. Erinevate päringute moodustamiseks kasutatakse erimärke ("", ~), matemaatilisi sümboleid (*, +, -).

    Infootsingu skeem on lihtne. Kasutaja sisestab võtmefraasi ja aktiveerib otsingu, saades seeläbi vastu vormistatud (antud) päringule vastava dokumendivaliku. See dokumentide loend on järjestatud teatud kriteeriumide alusel, nii et loendi ülaosas on need dokumendid, mis vastavad kasutaja päringule kõige paremini. Iga otsingutööriist kasutab dokumentide järjestamisel erinevaid kriteeriume nii otsingutulemuste analüüsil kui ka indeksi moodustamisel (veebilehtede registriandmebaasi täitmisel).

    Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, kui määrate iga otsingutööriista otsingustringis sama päringu, saate erinevaid otsingutulemusi. Kasutaja jaoks on suur tähtsus, millised dokumendid ilmuvad otsingutulemuste järgi kahe-kolmekümne esimese dokumendi hulka ja kuivõrd vastavad need dokumendid kasutaja ootustele.

    Enamik otsingutööriistu pakub otsimiseks kahte võimalust − lihtne otsing(lihtotsing) ja Täpsem otsing(täpsem otsing) koos eritaotluse vormiga ja ilma. Vaatleme mõlemat tüüpi otsinguid ingliskeelse otsingumootori näitel.

    Näiteks on AltaVista kasulik suvaliste päringute jaoks „Midagi infotehnoloogia veebikraadide kohta”, Yahoo otsingutööriist aga võimaldab hankida maailmauudiseid, vahetuskursside teavet või ilmateadet.

    Päringu täpsustamise kriteeriumide ja täpsemate otsingutehnikate valdamine võimaldab suurendada otsingu efektiivsust ja kiiresti leida vajalikku teavet. Esiteks saate otsingu tõhusust suurendada, kasutades päringutes loogilisi operaatoreid (operatsioone) Or, And, Near, Not, matemaatilisi ja erisümboleid. Kasutaja seob operaatorite ja/või sümbolite abil märksõnad soovitud järjestuses, et saada päringule sobivaim otsingutulemus. Lihtne päring tagastab väikese arvu viiteid dokumentidele, sest loend sisaldab dokumente, mis sisaldavad ühte päringu käigus sisestatud sõnadest või lihtsat fraasi (vt tabel 1). Operaator and võimaldab määrata, et kõik märksõnad peavad sisalduma dokumendi sisus. Dokumentide hulk peab siiski olema suur ja nende läbivaatamine võtab piisavalt aega. Sel põhjusel on mõnel juhul palju mugavam kasutada lähikonteksti operaatorit, mis näitab, et sõnad peaksid asuma dokumendis piisavalt lähedal. Läheduse kasutamine vähendab oluliselt leitud dokumentide arvu. Sümboli "*" olemasolu päringustringis tähendab, et sõna otsitakse selle maski järgi. Näiteks saame loendi dokumentidest, mis sisaldavad sõnaga "gov" algavaid sõnu, kui kirjutame päringustringi "gov*". Need on sõnad valitsus, kuberner jne.

    Kõige arenenumat venekeelse teabe otsinguteenust pakub Yandexi otsinguserver. Yandexis saate lihtsalt kirjutada vene keeles fraasi, mis kirjeldab seda, mida soovite leida, ning süsteem analüüsib ja töötleb teie päringut ning proovib seejärel leida kõike, mis on antud teemaga seotud. Saate spetsiaalsete operaatorite abil koostada stringi, mis selgitab otsingumootorile, millised peaksid olema teie nõuded teid huvitava teabe jaoks. Mõned Yandexi päringukeele operaatorid leiate siit: http://help.yandex.ru/search/ -id=481939

    Sama populaarne Rambleri otsingumootor hoiab statistikat lingiliikluse kohta oma andmebaasist, samu loogilisi operaatoreid JA, VÕI, EI, metamärki * (sarnaselt AltaVista märgiga *, mis laiendab päringuvahemikku), koefitsiendi sümboleid + ja -, et suurendada või vähendada päringusse sisestatud sõnade tähtsust.

    Vaatame Internetis kõige populaarsemaid teabeotsingu tehnoloogiaid.

    Teema 3 Interneti otsingumootoritega töötamine


    Pärast selle teema uurimist õpite ja kordate:

    Mille jaoks on otsinguserverid mõeldud?
    - otsinguserverite põhiosade määramine;
    - mis tüüpi teabeotsing Internetis eksisteerib;
    - Yandexi otsingumootoris päringu genereerimise põhireeglid.

    Otsige URL-ide järgi

    Kiireim ja usaldusväärseim viis Internetist teabe leidmiseks on otsida URL-e. Paljud neist on avaldatud trükiväljaannetes, spetsiaalsetes teatmeteostes, kõlavad populaarsete raadiojaamade eetris ja teleriekraanidelt.

    ♦ Jalgpalliklubi Zenit fännid teavad aadressi www.fc-zenit.ru peast.
    ♦ Grupi "Korol i Shut" fännid on hästi teadlikud selle grupi ametlikust saidist www.korol.spb.ru.
    ♦ NTV kanali fännid leiavad hõlpsasti selle veebisaidi aadressil www.ntv.ru. Ülaltoodud ressurssidele kiireks juurdepääsuks käivitage lihtsalt brauseriprogramm, näiteks Internet Explorer, ja tippige aadressiribale tuttav URL.

    Otsingumootorid

    Internetis on tohutult palju dokumente. Vajaliku teabe otsimise hõlbustamiseks luuakse spetsiaalsed otsingumootorid.

    otsingumootorid- Need on automaatsed süsteemid, mis küsitlevad globaalsesse võrku ühendatud servereid ja salvestavad oma andmebaasi infot serverites saadaolevate andmete kohta. Vastavalt spetsiaalselt koostatud päringule annavad otsingumootorid teavet selle kohta, kust saab vajalikke andmeid.

    Reeglina koosnevad otsingumootorid kolmest osast: robot, indeks ja päringu töötlemise programm.

    Robot (ämblik, robot või robot) on programm, mis külastab veebilehti ja loeb (täielikult või osaliselt) nende sisu. Otsingumootori robotid erinevad oma individuaalse veebilehe sisu analüüsimise skeemi poolest.
    Otsingumootori register- see on robotite lehtede külastatud otsingupiltide hoidla. Dokumendi (ka veebilehe) otsingupilt on dokumendi sisu kirjeldus spetsiaalses teabeotsingu keeles. See kirjeldus sisaldab koodid dokumendi märksõnadele, mis kajastavad selle tähendust ja sisu. Iga otsingumootori indeksid erinevad teabe salvestamise mahu ja viisi poolest. Juhtivate otsingumootorite andmebaasid salvestavad infot kümnete miljonite dokumentide kohta ning nende registrimahud on sadu gigabaite. Indekseid uuendatakse ja täiendatakse perioodiliselt, mistõttu võivad ühe otsingumootori sama päringuga tehtud töö tulemused erineda, kui otsing tehti erinevatel aegadel.

    Päringu menetleja on programm, mis vastavalt kasutaja soovile "otsib" indeksist vajaliku info olemasolu ja tagastab leitud dokumentidele lingid. Süsteemi väljundis olevate linkide komplekti jaotab programm kahanevas tähtsuse y järjekorras, st lingi ja päringu vastavuse kõrgeimast astmest madalaima.

    Praegu on Venemaa Interneti-kasutajate seas kõige populaarsemad kolm peamist indeksitüüpi otsingumootorit:

    Need süsteemid võtavad arvesse vene keele grammatilisi iseärasusi, mistõttu on nende otsingutulemused venekeelsetes ressurssides kvaliteetsemad kui lääne süsteemides.

    Otsingumootorid erinevad teaberessursside ulatuse poolest:

    ♦ üldotsingumootoritel on andmebaas kõigis teadmiste valdkondades ning neid eristab ulatuslik indeks ja suur hulk kogutud teavet;
    ♦ Eriotstarbelised otsingumootorid otsivad ainult kindlateemalisi saite, näiteks muusika- või muuseumisaite.

    Otsingumootorite peamised omadused on järgmised:

    ♦ registris olevate dokumentide maht;
    ♦ teabe uuendamise sagedus;
    ♦ inforuum, mida otsingumootori robot katab, ja mitmesugused dokumenditüübid, mille kohta teavet kogutakse;
    ♦ päringu töötlemise kiirust;
    ♦ asjakohasuse määramise kriteerium (leitud dokumendi vastavus otsingupäringule);
    ♦ taotluse täpsustamise ja täpsustamise võimalus.

    Otsing otsingumootori rubrikaatori järgi

    Otsingukataloogid on muude Interneti-ressursside linkide süstemaatiline kogumine (valik). Lingid on korraldatud temaatilise rubrikaatorina, mis kujutab endast hierarhilist struktuuri, mida mööda liikudes leiate vajaliku teabe.

    Toome näitena Yandexi otsingu Interneti-kataloogi struktuuri. See on üldotstarbeline kataloog, kuna see sisaldab peaaegu kõigis võimalikes suundades linke Interneti-ressurssidele. See kataloog sisaldab järgmisi teemasid:

    ♦ Äri ja majandus;
    ♦ Viited ja lingid;
    ♦ Ühiskond ja poliitika;
    ♦ Kodu ja perekond;
    ♦ Teadus ja haridus;
    ♦ meelelahutus ja vaba aeg;
    ♦ Arvutid ja side;
    ♦ Kultuur ja kunst.

    Iga teema sisaldab palju alajaotisi ja need omakorda sisaldavad rubriike jne.

    Oletame, et valmistate ette võidupüha üritust ja soovite Internetist otsida Bulat Okudzhava kuulsa väelaulu "Sa kuuled, kuidas saapad müristavad" sõnu. Otsingut saab korraldada järgmiselt: Yandexi kataloog Kultuur ja kunst Muusika Autorilaul.

    See otsingumeetod on üsna kiire ja tõhus. Lõpus pakutakse teile ainult 5 linki, mille hulgas on linke kuulsate bardide lauludega saitidele. Jääb vaid leida saidilt arhiiv B. Okudzhava laulusõnadega ja valida selles soovitud tekst.

    Veel üks näide. Oletame, et kavatsete osta mobiiltelefoni ja soovite võrrelda erinevate ettevõtete seadmete omadusi. Otsingut saab teha järgmiste kataloogipealkirjade all: Yandexi kataloog Arvutid ja side Mobiilside Mobiiltelefonid.

    Olles saanud piiratud arvu viiteid, saate neid kiiresti vaadata ja valida telefoni, uurides ettevõtete omadusi ja seadmete modifikatsioone.

    Võtmesõna otsing

    Enamikul otsingumootoritel on võimalus otsida märksõnade järgi. See on üks levinumaid otsingutüüpe. Märksõnade järgi otsimiseks peate spetsiaalsesse aknasse sisestama sõna või mitu otsitavat sõna ja klõpsama nuppu Otsi. Otsingumootor leiab oma andmebaasist üles ja näitab neid sõnu sisaldavaid dokumente. Selliseid dokumente võib olla palju, kuid palju ei pruugi sel juhul tähendada head.

    Teeme mõne otsingumootoriga katsed. Oletame, et otsustame asutada akvaariumi ja oleme huvitatud selle teema kohta igasugusest teabest.

    Esmapilgul on kõige lihtsam otsida sõna "akvaarium". Kontrollime seda näiteks Yandexi otsingumootoris. Otsingu tulemuseks on üle 460 000 lehekülje 3500 saidil – tohutul hulgal linke. Veelgi enam, kui vaatate lähemalt, on nende hulgas saite, mis mainivad B. Grebenštšikovi Akvaariumi gruppi, kaubanduskeskusi ja samanimelisi mitteametlikke ühendusi ning palju muud, millel pole akvaariumikaladega mingit pistmist.

    On lihtne arvata, et selline otsing ei suuda rahuldada isegi tagasihoidlikku kasutajat. Liiga palju aega tuleb kulutada kõigi pakutud dokumentide hulgast nende väljavalimisele, mis on seotud meile vajaliku teemaga, ja veelgi enam nende sisuga tutvumiseks.

    Kohe võib järeldada, et enamasti ei tasu otsida ühe sõna järgi, sest ühe sõna järgi on dokumendi, veebilehe või saidi teemat väga raske määrata. Erandiks on haruldased sõnad ja terminid, mida väljaspool nende teemavaldkonda peaaegu kunagi ei kasutata.

    Proovime täpsustada otsingutingimusi ja sisestada fraas "akvaariumi kalad". Otsingu tulemuseks on veidi üle 20 000 lehekülje ja umbes 650 saiti. Nagu näha, on linkide arv vähenenud üle 20 korra. See tulemus sobib meile rohkem, kuid siiski, pakutud linkide hulgast võite kohata näiteks venekeelseid kalapiltidega tikusiltide suveniiride komplekte ja arvuti töölaua ekraanisäästjate kogusid ning fotodega akvaariumi kalade katalooge ja akvaariumi. tarvikute kauplustes.

    On ilmne, et peaksime jätkama liikumist otsingutingimuste täpsustamise suunas.

    Otsingu produktiivsemaks muutmiseks on kõigil otsingumootoritel spetsiaalne päringukeel oma süntaksiga. Need keeled on paljuski sarnased. Nende kõigi õppimine on üsna keeruline, kuid igal otsingumootoril on abisüsteem, mis võimaldab teil soovitud keelt omandada.

    Siin on kümme lihtsat reeglit päringu genereerimiseks Yandexi otsingumootoris.

    1. Märksõnad päringus tuleb kirjutada väiketähtedega (väiketähtedega). See tagab, et otsitakse kõiki märksõnu, mitte ainult neid, mis algavad suure tähega.

    2. Otsing võtab arvesse kõiki sõna vorme vastavalt vene keele reeglitele, olenemata päringus oleva sõna vormist. Näiteks kui päringus oli märgitud sõna “tea”, siis vastavad otsingutingimusele ka sõnad “tean”, “tean” jne.

    3. Stabiilse fraasi otsimiseks tuleks sõnad lisada jutumärkidesse, näiteks “portselannõud”.

    4. Täpse sõnavormi järgi otsimiseks tuleb sõna ette panna hüüumärk. Näiteks sõna "september" otsimiseks genitiivis kirjutage "!September".

    5. Ühe lause piires otsimiseks eraldatakse päringus olevad sõnad tühiku või märgiga &: "seiklusromaan" või "seiklus ja romaan". Kui päringus on sisestatud mitu sõna, mis on eraldatud tühikutega, tähendab see, et need kõik peavad sisalduma otsitava dokumendi ühes lauses.

    6. Kui soovite valida ainult need dokumendid, milles esineb iga päringus määratud sõna, pange nende ette plussmärk "+". Kui soovite vastupidiselt mõne sõna otsingutulemustest välja jätta, pange selle sõna ette miinus "-". Märgid "+" ja "-" tuleb kirjutada tühikuga eelmisest ja ühendada järgmise sõnaga. Näiteks päring "Volga-auto" leiab dokumendid, mis sisaldavad sõna "Volga", mitte sõna "auto".

    7. Kui otsite sünonüüme või sõnu, mis on tähenduselt lähedased, võite sõnade vahele panna vertikaalse riba "|". Näiteks päringu "laps | laps | beebi" leiab dokumendid mis tahes nende sõnadega.

    8. Päringu üksiku sõna asemel saate asendada terve väljendi. Selleks tuleb see võtta sulgudes, näiteks "(laps | beebi | lapsed | beebi) + (hooldus | kasvatus)".

    9. Märk *~" (tilde) võimaldab leida dokumente, mille lause sisaldab esimest sõna, kuid ei sisalda teist. Näiteks otsing "raamatud ~ pood" leiab kõik dokumendid, mis sisaldavad sõna "raamatud", mille kõrval pole (lause sees) sõna "pood".

    10. Kui operaatorit korratakse üks kord (näiteks & või ~), sooritatakse otsing lause sees. Topeltoperaator (&&, -) otsib dokumendist. Näiteks otsinguga "vähk – astroloogia" leiate dokumendid sõnaga "vähk", mis ei ole astroloogiaga seotud.

    Kui soovitud piirkonnas on teatud komplekt enamlevinud termineid, saate kasutada täpsemat otsingut. Joonisel fig. 3.3 näitab Yandexi otsingumootoris täpsema otsingu akent. Selles režiimis rakendatakse päringukeele võimalusi vormina. Sarnast teenust, sealhulgas sõnastikufiltreid, pakuvad peaaegu kõik otsingumootorid.

    Riis. 3.3. Täpsema otsingu näide Yandexi süsteemis

    Arvestades soovitavate ja nõutavate sõnade õiget valikut ning ebasoovitavate terminite välistamist, võib selline otsing anda häid tulemusi.

    Läheme tagasi akvaariumi kalade näite juurde. Pärast mitmete otsingumootori pakutud dokumentide lugemist saab selgeks, et Internetist teabe otsimine ei tohiks alata akvaariumi kalade valikuga. Akvaarium on kompleksne bioloogiline süsteem, mille loomine ja hooldamine nõuab eriteadmisi, aega ja tõsiseid investeeringuid.

    Saadud teabe põhjal saab Internetis otsingut tegev isik edasise otsingu strateegiat kardinaalselt muuta, otsustades uurida uuritava teemaga seotud erialakirjandust.

    Kirjanduse või täisteksti dokumentide otsimiseks on võimalik teha järgmine päring:

    "+ (akvaarium | akvaarist | akvaarist) + algajatele + (nõuanded | kirjandus) + (artikkel | lõputöö | täistekst) - (hind | pood | kohaletoimetamine | kataloog)".

    Pärast päringu töötlemist otsingumootoris saadi järgmine tulemus: lehekülgi - 195, saite - vähemalt 43.

    Nagu otsingustatistikast näha, oli tulemus väga edukas. Juba esimesed lingid viivad vajalike dokumentide juurde:

    Akvaariumi seadistamine > Näpunäiteid algajale akvaaristile >
    Artiklid > Aq uascope. et
    http://aquascope.ru/modules/wfsection/article.php?page=l&articleid=49 (32KB) – range järgimine.
    NÕUANDED ALGAJATELE AKVAARIUMISTELE. Kuidas valida ja paigaldada akvaariumi, kuidas...
    http://www.aquariums.ru/sovna.htm (2KB) 23.07.2002 - mitterange kirjavahetus.

    Nüüd saate kokku võtta otsingu tulemused, teha teatud järeldused ja otsustada võimalike toimingute üle:

    ♦ Lõpetage edasine otsimine, sest erinevatel põhjustel ei käi akvaariumi hooldamine teie jõust üle.
    ♦ Lugege soovitatud artikleid ja alustage akvaariumi seadistamist.
    ♦ Otsige materjale hamstrite või viirpapagoide kohta.

    Professionaalne otsing

    Teadlastel ja spetsialistidel tuleb otsingute korraldamisel läbimõeldumalt läheneda. Professionaalsel Internetist teabe otsimisel peavad olema täidetud järgmised nõuded:

    ♦ suur otsingukiirus;
    ♦ saadud teabe usaldusväärsus;
    ♦ ressursside täielikkus otsingu ajal.

    Kiirus. Otsingu kiirus sõltub peamiselt kahest tegurist: pädevast otsingu planeerimisest (otsinguteenuste ja -tööriistade valik) ning oskustest töötada juba valitud ressursiga (oskus kiiresti mõista selle struktuuri ja navigeerimismeetodeid). Otsinguindeksitest ei piisa otsingukiiruse tagamiseks. Lisaks neile on Internetis hulk otsinguressursse, mille kasutamine tagab professionaalse otsingu sooritamise.

    Töökindlus. Internetist saadava teabe usaldusväärsuse küsimus on väga asjakohane, kuna igaüks võib sinna paigutada mis tahes teavet, ilma et oleks kontrollitud selle vastavust tegelikkusele. See omakorda toob kaasa suure hulga ebausaldusväärseid allikaid, nagu kokkuvõtted ja kursusetööd, mis on internetti üle ujutanud.

    On olemas spetsiaalsed otsinguteenused, mis võimaldavad teil hinnata Interneti-teabeallika usaldusväärsust.

    Täielikkus. Eduka täiemahulise teabe kogumise vajalik tingimus on tänapäeval olemasolevate peamiste ressursside tüüpide tundmine ja erinevate otsinguteenuste kasutamine. Ükski otsingumootor ei suuda katta kõiki Interneti ressursse.

    Reeglina peab kasutaja positiivse tulemuse saavutamiseks kasutama mitme otsingumootori teenuseid. Saate seda teha ise, liikudes süsteemist süsteemi või usaldada selle töö mõnele metaotsingumootorile (meta on süsteeme tähistavate liitsõnade esimene komponent teiste süsteemide kirjeldamiseks ja uurimiseks).

    Riis. 3.4. Metaotsingu aknad

    Metaotsingumootoritel ei ole oma otsinguandmebaase ja nad kasutavad otsimisel paljude teiste otsingumootorite ressursse. Tänu sellele on tõenäosus vajaliku info leidmiseks väga suur. Töö metaotsingusüsteemides toimub samade reeglite järgi nagu töö otsingumootorites. Selle põhjuseks on asjaolu, et metaotsingumootorid on omamoodi lisand otsingumootoritele ja kasutavad oma töös oma indeksite andmebaase. Metaotsingumootorite välimus meenutab tuntud otsingumootorite välimust. Joonisel fig. 3.4 näitab metaotsingumootorite myweb.ru ja metabot.ru aknaid.

    Kogemused näitavad, et enamikul juhtudel saavutatakse parem tulemus mitme sõltumatu otsinguindeksi kasutamisel kui ühe metaotsingumootori kasutamisel.

    Kontrollküsimused ja ülesanded

    1. Mis on brauseriprogrammi eesmärk?

    2. Milliseid brauseriprogramme te teate?

    3. Kust leiab Interneti-otsingut kavandav kasutaja URL-e?

    4. Mis on otsingumootori rubrikaatori otsingutehnoloogia?

    5. Mis on märksõnaotsingu tehnoloogia?

    6. Milliseid nõudeid tuleb järgida professionaalsel Internetist teabe otsimisel?

    7. Millal tuleb otsingukriteeriumides määrata märgid "+" või "-"?

    8. Millised otsingukriteeriumid Yandexis määratakse järgmise fraasiga:

    (lapsehoidja | õpetaja | guvernant) ++ (hooldus | kasvatus | juhendamine).

    9. Mida tähendab märgi kahekordistamine (∼∼ või ++) komplekspäringu moodustamisel?

    10. Mis on otsingu asjakohasus?

    11. Mis on metaotsingumootorite eesmärk?

    Loeng 4. Infootsingu vahendid

    Teabemassiivi pidev värskendamine koos andmemahu suurenemisega muudab äärmiselt keeruliseks olemasolevate dokumentide arvestamise ja vastavalt ka otsingu, mille võib tinglikult jagada:

    • faktiline otsing:entsüklopeediates, teatmeteostes, sõnaraamatutes,
    • bibliograafiline otsing:raamatukogud, kataloogid, programmid.
    • dokumendi otsing:elektroonilised dokumendid, elektroonilised raamatukogud, elektroonilised ajakirjad.

    Infootsingu probleemi olulisus on viinud terve tööstuse kujunemiseni, mille ülesandeks on just abistada kasutajat küberruumis navigeerimisel. Muutke see tööstus eriliseksotsinguteenused või teenuseid. Traditsiooniliselt jagunevad need järgmisteks osadeks:

    • kataloogid või kataloogid
    • otsingumootorid

    Need sordid on visuaalselt väga sarnased, sest"igal kataloogil on oma otsingumootor ja igal otsingumootoril oma kataloog". Nende tööpõhimõtted põhinevad aga täiesti erinevatel lähenemistel ja tehnoloogiatel. Lisaks kasutatakse igat tüüpi otsinguteenuseid teatud tüüpi probleemide lahendamisel. Infootsing hõlmab teatud strateegiate, meetodite, mehhanismide ja vahendite kasutamist. Otsinguprotsessi haldava kasutaja käitumist ei määra mitte ainult infovajadus, vaid ka süsteemi instrumentaalne mitmekesisus – süsteemi pakutavad tehnoloogiad ja tööriistad. Instrumendi valik määrab suurestiotsingustrateegia ja otsingutehnoloogiad.

    Otsingutehnoloogiad- ühtsed (optimeeritud konkreetse teabeotsingusüsteemi raames) jadad üksikute otsingutööriistade tõhusaks kasutamiseks kasutaja suhtlemise protsessis süsteemiga.

    Kasutatud otsingutehnoloogiadInfosüsteemid võib jagada kolme kategooriasse:

    • temaatilised kataloogid ja erikataloogid (veebikataloogid);
    • otsingumootorid (täistekstiotsing);
    • metaotsingu tööriistad.

    Temaatilised kataloogidnäha ette dokumentide töötlemine ja nende määramine ühte mitmest kategooriast, mille loetelu on eelnevalt kindlaks määratud. Tegelikult on see kõigile raamatukoguhoidjatele tuttav.klassifikatsioonipõhine indekseerimine. Spetsialiseeritud kataloogid või juhendid luuakse eraldi harude ja teemade järgi.otsingumootorid(kõige täiustatud otsinguvõimalus Internetis) rakendavad täistekstiotsingu tehnoloogiat. Taotletud serverites asuvad tekstid indekseeritakse.Rahaliste vahendite kasutamisel metaotsing Päringut täidavad korraga mitu otsingumootorit. Otsingutulemused on kombineeritud üldiseks, asjakohasuse järgi sorteeritud loendiks.

    Otsingutööriistad - vastastikku sõltuv teabeotsingu keelte ja andmete määratlemise/halduskeelte kompleks, mis pakub töötlemisobjektide (dokumendid, sõnastikud, otsingutulemuste kogud) struktuurseid ja semantilisi teisendusi.

    1. Teatmeteosed

    Esimese rühma otsingutööriistad on elektroonilised kataloogid, millel on selge hierarhiline süstemaatiline või loogilis-temaatiline struktuur,umbes nagu süstemaatilise raamatukogukataloogi struktuur. Kataloogidega töötamine võimaldab teil navigeerida Interneti-ressurssides üksikute teadmiste harude piires, süvenedes üldisest konkreetsesse, muutes hierarhilisi harusid, liikudes mõne sammu võrra tagasi jne.

    Venemaa arengute hulgas selles valdkonnas on järgmised:

    • Aport (aadress: www.aport.ru),
    • List.ru (aadress: list.mail.ru),
    • Veebiloend (aadress: www.weblist.ru),
    • Ivan Susanin (aadress: www.susanin.net
    • Tigu (aadress: www.ulitka.ru).

    Teatmeteoste peamine eripära on see, et need on käsitsi valmistatud. Iga teatmeteose toimetuskolleegiumid, misoma töö iseloomult meenutavad nad suurte raamatukogude kataloogimis- ja süstematiseerimisosakondi, vaadake regulaarselt üle äsja ilmunud serverite sisu ja jälgige olemasolevate serverite muudatusi. Ilmunud andmeid analüüsitakse ja kantakse teatmeteose osadesse vastavalt aktsepteeritud klassifikatsioonile. Serveri kui terviku kirjeldus (või jaotis, kui see näib olevat täiesti sõltumatu plokk) on varustatud lühikese märkusega, mis sisaldab üldist teavet saadaoleva teabe olemuse kohta. Mõnel juhul sisestatakse lisateavet dokumentide keele, ressursi külastatavuse, selle füüsilise asukoha jms kohta.

    Kataloogide eeliseid iseloomustavad peamised parameetrid on järgmised:

    • maht;
    • uute või muutunud ressursside kajastamise tõhusus;
    • hierarhilise liigitusskeemi järjepidevus ja järjepidevus;
    • struktuuri crossover.

    Kataloogi maht määrab selle usaldusväärsuse või "teabe tugevus". Mõnes süsteemis on spetsiaalne mehhanism, mis kontrollib perioodiliselt saidi saadavust ja jätab selle loendist välja, kui veebis on pikaajaline "puudumine". Rakendatud klassifitseerimisskeemi loogika (teaduslik) määrab, kui kergesti kasutajad vajaliku teabe leiavad. Süsteemristviitedvõimaldab teil tuvastada teavet erinevate lähenemisviiside abil (näiteks territoriaalne või valdkondlik). Sel juhul peaks klassifitseerimisskeem kasutaja automaatselt juhtima soovitud objektini, olenemata sellest, milline otsingutee on valitud.

    Seda tüüpi otsingutööriistade jaoks päringu koostamise võimalus ei mängi erilist rolli. Keerulisi otsinguid, mis nõuavad päringu täpsustamist, kataloogide abil ei teostata.

    Kataloogid on mõeldud lahendamisekskolme tüüpi ülesandeid:

    • orienteerumine võõras teadmiste harus;
    • otsida suuri objekte, mis on näiteks organisatsioonide serverid või olulised projektid;
    • valmis loendi hankimine häguse otsingupildiga ressurssidest (teatud tüüpi raamatukogud, transpordigraafikud või erakondade veebisaidid jne)

    Teine näide on ressursside kataloogi võrdlemine raamatukogu süstemaatilise kataloogiga, kus raamat (antud juhul terve veebisait) jäetakse ainult kirjelduse ja annotatsiooniga.

    2. Otsingumootorid

    Otsingumootorite (otsingumootorite) töö põhineb täiesti erinevatel tehnoloogilistel põhimõtetel. Otsingumootorite ülesanne on pakkuda üksikasjalikku teabeotsingut, mida saab saavutada ainult raamatupidamise kaudu ( indekseerimine ) võimalikult paljude veebilehtede sisu. Erinevalt kataloogidest töötavad otsingumootorid automatiseeritud režiimis ja neil on ühtne tööpõhimõte.

    Otsingumootorid koosnevad kahest põhikomponendist. Esimene komponent on roboti programm , mille ülesanne on liikuda serverist serverisse ja leida sealt uusi (või muudetud) dokumente, laadides need alla süsteemi põhiarvutisse. Robot vaatab läbi dokumendi sisu, leiab uusi linke, nii teistele serveris olevatele dokumentidele kui ka välistele saitidele. Seejärel läheb programm iseseisvalt määratud linkidele, leiab uued dokumendid, mille järel korratakse protsessi uuesti,meenutades bibliograafias tuntud "lumepallimeetodit".. Tuvastatud dokumente töötleb (indekseerib) otsingumootori teine ​​komponent. Sel juhul võetakse reeglina arvesse kogu lehe sisu, sealhulgas tekst, illustratsioonid, heli- ja videofailid. Kõik dokumendis olevad sõnad on indekseeritud, mis võimaldab kasutada otsingumootoreid üksikasjalike otsingute tegemiseks kõige kitsamatel teemadel. Moodustatud indeksfailid , salvestades teavet selle kohta, mis märksõna, mitu korda, millises dokumendis ja millises serveris seda kasutatakse, moodustavad andmebaasi, millele raamatukoguhoidja pöördub märksõnakombinatsioonide sisestamisel päringustringi.

    Tulemuste väljastamine toimub spetsiaalse mooduli abil, mis toodabintelligentne tulemuste järjestamine . See võtab arvesse:

    • termini asukoht dokumendis (pealkiri, pealkiri, põhitekst), selle kordumise sagedus,
    • otsingusõna ja lehe teksti protsentuaalne suhe,
    • muudelt saitidelt sellele lehele viivate välislinkide arv ja autoriteet.

    To otsingumootorite põhiparameetrid seotud:

    • indekseeritud serverite ja üksikute dokumentide arv (indeksifailide maht);
    • andmebaasi uuendamise tõhusus uute materjalide kohta teabe lisamise ja vananenud materjalide kustutamise kaudu;
    • päringu tegemise võimalused;
    • otsingutulemuste järjestussüsteemi intelligentsus;
    • täiendavate teenusefunktsioonide olemasolu, mis hõlbustavad kasutaja tööd.

    Otsingumootori võime päringut võimalikult täpselt väljendada määrab suuresti saadud tulemuste kvaliteedi. Igal masinal on oma sõnavara, mis võimaldab erinevatel viisidel detaile kirjeldadaotsi retsepti.

    Kõik otsingumootorid onotsingutulemuste järjestamise moodul. See on kõigi süsteemide teine ​​põhikomponent. Dokumendi koha määramisel linkide loendis arvesse võetavate tegurite loetelu on ebatavaliselt lai: alates sõna asukohast lehel kuni leitud dokumendile viitavate lehtede reitingu (autoriteedi)ni.

    • Google (aadress: www.google.com ),
    • AlltheWeb (aadress: www.alltheweb.com),
    • Alta Vista (aadress: www.altavista.com).

    Sarnased otsingutööriistad on ka Venemaal. Kõik need on loodud töötama venekeelsete dokumentidega ja neil on võimas http://www.metabot.ru).

    Järeldused loenguploki teemal

    Otsingumootor teeb andmebaasist lehekülgede valiku vastavalt päringule, seejärel järjestatakse lehed kahanevate vastete järgi (märkus A.A.)

    Sel juhul on otsene analoogia raamatukogu hajutatud koondkataloogide toimimispõhimõtetega. Võtmevõimalus metaotsing on võimalus saata kasutajate päringuid samaaegselt erinevatele otsingumootoritele – koos tulemuste hilisema summeerimisega. (A.A. märkus)

    Kataloogide poole pöördudes võib raamatukoguhoidja eeldada, et ta saab selle teema kohta ainult väga üldist teavet ja mitte kunagi - üksikasjalikke andmeid: tuhandeid lehekülgi sisaldava suurettevõtte serverist esitab kataloog ainult nime ja paar rida annotatsiooni.

    Laadimine...
    Üles