Infootsingu infotehnoloogiad. Infootsingu etapid

Infootsingu infotehnoloogiad

Info otsimine: organisatsiooni põhimõisted, liigid ja vormid

Infootsing ehk infootsing on üks peamisi infoprotsesse. Inimkond on seda teinud iidsetest aegadest peale. Otsingu eesmärgid, võimalused ja iseloom on alati sõltunud kättesaadavusest, informatsioonist, selle tähtsusest ja kättesaadavusest ning otsingu korraldamise vahenditest.

20. sajandi lõppu – 21. sajandi algust iseloomustavad tohutud massiivid pidevalt kasvava ja mitmekesise informatsiooniga, mis on kättesaadav ja pakub huvi kõige laiemale ühiskonnakihile. Lisaks võimaldavad enamikule inimestele kättesaadavad Interneti-tehnoloogiad ning tarkvara- ja riistvaratööriistad seda protsessi läbi viia igal ajal, peaaegu kõikjal ja iga soovi korral.

Otsing- protsess, mille käigus ühes või teises järjestuses korreleeritakse otsitav iga massiivi salvestatud objektiga. Igasuguse otsingu eesmärk on vajadus, vajadus või soov leida erinevat tüüpi teavet, mis aitab otsijal saada vajalikku teavet, teadmisi jne. parandada oma professionaalset, kultuurilist ja muud taset; uue teabe loomine ja uute teadmiste kujundamine; juhtimisotsuste tegemine jne.

Ekspertide sõnul on Internetis miljardeid kasutajaid. Neist sajad miljonid on võrgus (inglise keeles "on-line" - interaktiivne juurdepääs igal ajal) ja selliste kasutajate arv kasvab pidevalt. See raskendab operatiivse otsingu korraldamist ja nii suure hulga kasutajate jaoks vajaliku teabe leidmist. Probleemid tekivad infootsingu erinevatest võimalustest (tüüpidest), nende erinevatest realiseerimisviisidest infootsingusüsteemides (IPS), erinevate kasutajate teadmiste tasemetest selliste süsteemide võimaluste kohta, eriti päringute genereerimise ja saadud andmete töötlemise valdkonnas. nende päringute täitmise tulemus jne.

Eeldatakse, et tulevikus luuakse IS-id, mis suudavad automaatselt kohaneda konkreetsete kasutajate teadmiste taseme ja taotlustega, tajuvad päringuid loomulikus keeles ning tehisintellekti kasutades annavad neile asjakohast ja asjakohast teavet. Sellise IPS-i loomine nõuab konkreetsete IPS-i kasutajate või nende vahendajate intelligentsust ja teadmisi. Seni aga eeldatakse, et paljud otsingumootorite kasutajad valdavad seda teemavaldkonda üsna hästi.

Mõisteid "infootsing" või "teabeotsing" on erinevalt tõlgendatud.

Mõiste "teabe otsimine" (inglise keeles "information retrieval") tutvustas Ameerika matemaatik K. Muers. Ta märkas, et sellise otsingu ajendiks on infovajadus , mida väljendatakse teabenõude vormis. K. Muers salastatud dokumendid, teave nende olemasolu ja (või) asukoha kohta ning faktiline teave kui teabeotsingu objektid.

Raamatukogude esindajad asusid esimesena lahendama faktograafilise otsingu probleeme. Nad töötasid välja teabeotsingu tööriistad nimega " võrdlus- ja otsinguseadmed "(kataloogid, bibliograafilised registrid jne). Kodumaises professionaalses ajakirjanduses on seda terminit kasutatud alates 1970. aastatest. Raamatukoguhoidjad määratlevad " teabe otsimine "teabe sees olevatdokumentide hulk vastavkasutajate teabepäring .

Arvutitehnoloogia kasutamise seisukohast "teabe otsimine "- loogiliste ja tehniliste toimingute kogum, mille lõppeesmärk on leida tarbija taotlusega seotud dokumente, nende kohta teavet, fakte, andmeid.

" Asjakohasus" - installitud millalteabe otsimine vastavus dokumendi sisuleinfonõue või dokumendi otsingupilti otsingu ettekirjutusse.

On ka teisi määratlusi. Igal juhul põhjustab infootsingu vajadus rahuldada nende kasutajate infovajadusi, kes loodavad saada kiiresti otsimootorite abil vajalikke andmeid või informatsiooni. See on meetod asjakohaste dokumentide ja/või faktide sihipäraseks otsimiseks ja hankimiseks erinevatest teabeallikatest, näiteks andmepankadest või salvestusseadmetest. Need on elusad ja elutud objektid, mis esindavad erinevaid teabeallikaid ja -kandjaid.

Nimetatakse süsteeme, mis tagavad sellise infootsingu teostamiseotsingumootorid(PS). Traditsioonilistes tehnoloogiates esindavad PS failikappe ja katalooge, aadressi- ja muid katalooge, registreid, entsüklopeediaid, väljaannete ja muude materjalide viiteseadmeid.

1945. aastal tõstatas Ameerika teadlane ja insener W. Bush oma artiklis "A Possible Mechanism of Our Thinking" esimest korda laialdaselt küsimuse teabeotsingu mehhaniseerimise vajadusest.

Alates 1960. aastatest on ilmunud automatiseeritud otsingumootorid, mis töötavad teabega. Sellest perioodist alates on tehtud intensiivne töö infootsingu põhimõtete ja meetodite kujundamise ja rakendamise alal.

" Otsingumootorid" sooritama otsingut antud sõnu sisaldavate andmebaasi dokumentide või muude masinloetavate andmemassiivide hulgast.

Tavalisi või intelligentseid terminale (PC) kasutav elektrooniline PS võimaldab kasutajatel teha otsingupäringuid, kasutades formaalseid ja sisu kirjeldavaid elemente ning kasutades spetsiaalseid loogilisi operaatoreid; sooritama otsingut antud sõnu sisaldavate andmebaasi dokumentide või muude masinloetavate andmemassiivide hulgast. Otsingumootorid lubavad ainult otsinguprotseduure ja nendega seotud protsesse.

Infootsingu süsteemid

Suure hulga funktsioonide ja võimalustega PS on tavaliselt DBMS-i osa ja neid nimetatakse teabeotsingusüsteemideks. Samuti luuakse ja kasutatakse neid vajalike andmete tõhusaks leidmiseks, sealhulgas Internetist.

terminoloogiliselt"teabeotsingu süsteem" (inglise keeles "information retrieval system", IRS) - tähistab süsteemi, mis on loodud teabe otsimiseks ja säilitamiseks; tarkvarapakett, mis rakendab teabe andmebaasides ja andmepankades loomise, värskendamise, salvestamise ja otsimise protsesse.

Infootsingu süsteem tõlgendatakse süsteemina, mis pakub infootsingu keele ja vastavate otsingureeglite alusel vajalike andmete otsimist ja valikut ning andmebaasi- vahendite ja meetodite kogumina andmete kirjeldamiseks, salvestamiseks ja töötlemiseks, mis hõlbustab suurte teabemassiivide kogumist, kogumist ja töötlemist. Erinevate andmebaaside korraldus erineb andmeobjektide tüübi ja nendevaheliste suhete poolest.

Kaasaegse IPS-i toimimine põhineb kahel eeldusel:

    kasutaja nõutud dokumente ühendab mõne tunnuse või tunnuste kombinatsiooni olemasolu;

    kasutaja saab selle atribuudi määrata.

Mõlemad eeldused praktikas ei täitu ja rääkida saab vaid nende täitumise tõenäosusest. Seetõttu on teabeotsingu protsess tavaliselt etappide jada, mis viib läbi süsteemi mingi tulemuseni ja võimaldab hinnata selle täielikkust. Samas ei motiveeri kasutaja käitumist otsinguprotsessi juhtimise organiseeriva algusena mitte ainult infovajadus, vaid ka süsteemi pakutavate strateegiate, tehnoloogiate ja tööriistade mitmekesisus.

Tavaliselt ei ole kasutajal igakülgseid teadmisi otsitava ressursi sisust. Ta oskab hinnata nii päringuavaldise adekvaatsust kui ka saadud tulemuse täielikkust lisateabe leidmisega või protsessi korraldamisega nii, et osa otsingutulemustest saab kinnitada või ümber lükata päringu adekvaatsuse. teine ​​osa. Samal ajal iseloomustab professionaalseid kasutajaid temaatilise profiili stabiilsus. Kui nad on "teabele orienteeritud", siis iseloomustab neid soov ja oskus organiseerida probleemi inforuumi. See tähendab, et kasutaja loob sisuliselt uue, "iseseisva" probleemipõhise, individuaalselt uuendatava ja täiendatava IR-i, mis sisaldab lisaks dokumendikogudele ka metainfot, näiteks erialaterminoloogia sõnastikke, ainevaldkonna klassifikaatoreid, ressurssi. kirjeldused jne.

Kasutaja töö iseärasus iseteenindusrežiimis tähendab koondtegevuse automatiseerimise ülesande kontekstis seda, et süsteem peab esindama keskkonda, mis pakub tuge tarbija funktsioonidele leitud info töötlemisel, samuti kui need, mis on traditsiooniliselt seotud teabevahendaja funktsioonidega (päringu tõlgendamine, selle tõlkimine teabeotsingu keelde, IR valik, automatiseeritud otsing ja materjalide käsitsi valimine), aga ka selliseid "pakkuvaid" funktsioone nagu: teabevajaduste struktureerimine, päringu leksikaalne kohandamine, otsingutulemuste hindamine, süstematiseerimine ja töötlemine nii eraldiseisva dokumendi kui ka inforessursside tasandil üldiselt. Kasutaja käsutuses olevad tehnilised võimalused võimaldavad tal luua inforessurssi – moodustada massiive, süstematiseerida ja luua nende sisu väliseid esitusi enda või välise kasutuse jaoks.

IPS jaguneb traditsiooniliseks (manuaalne, mehaaniline, elektromehaaniline) ja automatiseeritud (elektrooniline).

Automatiseeritud IPS (AIPS), kasutavad arvutitarkvara, riistvara ja tehnoloogiaid ning on mõeldud teabe otsimiseks ja kasutajatele väljastamiseks vastavalt kindlaksmääratud kriteeriumidele. Otsingu automatiseerimise meetodite mõistmiseks on määravad järgmised kaks tegurit.

    ei võrrelda mitte objekte endid, vaid kirjeldusi - nn "otsimispilte";

    protsess ise on keeruline (komposiitne ja mitte üheaktiline) ja seda rakendatakse tavaliselt toimingute jada kaudu.

Andmed AIPS-i sisestatakse spetsiaalselt välja töötatud sisestusvormingute alusel. Kogu info ühe objekti kohta IPS-is esitatakse süstematiseeritud andmetena, mis moodustavad tabeli ühe rea ja mida nimetatakse rekord . Samas, kui IS esindab raamatukogu elektroonilist kataloogi, siis mis tahes selles sisalduva dokumendi bibliograafiline kirjeldus (BD) on üks kirje, mis koosneb BD elementide arvuga võrdsetest väljadest. Kirjete komplekt moodustab andmebaasi, mis tavaliselt salvestatakse ühte faili. Andmepanga moodustab andmebaaside kogum, mida ühendab üks DBMS.

Kuna AIPStööriist, mida inimene otsimisel kasutab (kuid mitteintelligentne otsingumasin teave - põhitegevuse probleemide valmislahendused), selle kasutamise efektiivsus sõltub sellest, kui hästi inimene tunneb tööobjektide olemust ja selle tööriista omadusi, mille kaudu ta nende objektidega töötab.

Infootsing hõlmab teatud strateegiate, meetodite, mehhanismide ja vahendite kasutamist. Otsinguprotsessi haldava kasutaja käitumist ei määra mitte ainult infovajadus, vaid ka süsteemi instrumentaalne mitmekesisus – süsteemi pakutavad tehnoloogiad ja tööriistad.

Otsingustrateegia - süsteemi või kasutaja käitumise üldine plaan (kontseptsioon, eelistus, seadistus), et väljendada ja rahuldada kasutaja teabevajadusi, mis tuleneb nii otsingu eesmärgi olemusest ja tüübist kui ka süsteemi "strateegilistest" otsustest; andmebaasi arhitektuur, meetodid ja otsingutööriistad konkreetses AIPS-is.

Üldjuhul on strateegia valik optimeerimisprobleem. Praktikas määrab selle suuresti praktiliste vajaduste ja olemasolevate vahendite võimaluste vahel kompromissi saavutamise kunst.

Otsingumeetod - mudelite ja algoritmide komplekt üksikute tehnoloogiliste etappide rakendamiseks: otsingupäringu pildi (PRI) loomine, dokumentide valimine (päringute ja dokumentide otsingupiltide võrdlemine), päringu laiendamine ja ümbersõnastamine, väljastamise lokaliseerimine ja hindamine.

Päringu otsingu pilt- ILP-s kirjutatud tekst, mis väljendab teabepäringu semantilist sisu ja sisaldab infootsingu efektiivseimaks rakendamiseks vajalikke juhiseid.

Otsingumeetodid, st. dokumentide alamhulga valik, mis potentsiaalselt sisaldab dokumentide valimise probleemi (OD) lahenduse kirjeldust, peegeldab lahenduse leidmise protsessi ning sõltub probleemi olemusest ja teemavaldkonnast.

Arvestades otsingut kui iteratiivset protsessi, moodustavad (skaneeritud alamhulga) otsinguruumi vähendamise meetodid sisuliselt otsingustrateegia metoodilise aluse ja need võib jagada järgmistesse klassidesse – otsingumeetodid:

    üks ruum (tavaliselt temaatiline);

    hierarhiliselt järjestatud ruum;

    alternatiivsed ruumid;

    dünaamiline (otsingu käigus muutuv) ruum.

POS-i koostamise meetod peaks pakkuma tõhusaid viise päringu koostamiseks, et saavutada erinevat tüüpi eesmärke.

Otsingumootorid - süsteemis rakendatud mudelite ja algoritmide komplekt otsingupäringule vastuseks välja antud dokumentide genereerimiseks.

Otsingutööriistad ühelt poolt on infootsingu keelte (IRL) ja andmemääratlus-/halduskeelte kompleks, mis pakub töötlemisobjektide (dokumendid, sõnastikud, otsingutulemuste komplektid) struktuurseid ja semantilisi teisendusi. teisest küljest kasutajaliidese objektid, mis pakuvad konkreetse AIPS-i tööobjektide valimise juhtimisjada.

Otsingutehnoloogiad on ühtsed (optimeeritud konkreetse AIPS-i raames) järjestused, mis võimaldavad tõhusalt kasutada üksikuid otsingutööriistu kasutaja suhtlemise protsessis süsteemiga, et saada jätkusuutlikke lõpp- ja vahetulemusi.

Navigeerimine tellitava otsingu protsessi teostusena valitud andmebaasis - konkreetse AIPS-i meetodite, tööriistade ja tehnoloogiate eesmärgistatud, strateegiaga määratletud jada tulemuse saamiseks ja hindamiseks.

Navigeerimisvahendid võimaldab kasutajal otsinguprotsessi juhtida. Need antakse kasutajale vormisliides , mis võimaldab korraldada andmebaasiga enam-vähem tõhusa suhtluse protsessi. Samal ajal iseloomustab liidese "sõbralikkust" mitte ainult ergonoomika ja selgus, vaid ka tööobjektide valiku varieeruvus.

Infootsingu protsess on etappide jada, mis viib läbi süsteemi teatud tulemuseni ja võimaldab hinnata selle täielikkust. Kuna kasutajal ei ole tavaliselt igakülgseid teadmisi selle ressursi infosisu kohta, milles ta otsingut sooritab, saab ta hinnata päringuavaldise adekvaatsust ja ka saadud tulemuse täielikkust, tuginedes ainult välistele hinnangutele või vahetulemusi ja üldistusi, kõrvutades neid näiteks , eelnevatega.

Otsinguprotsessi saab esitada järgmiste põhikomponentidena:

    päringu vormistamine loomulikus keeles, otsingumootorite ja teenuste valimine, päringu vormistamine vastavas ILP-s;

    otsingu läbiviimine ühes või mitmes otsingumootoris;

    saadud tulemuste ülevaatamine (viited);

    saadud tulemuste eeltöötlus: linkide sisu vaatamine, asjakohaste ja asjakohaste andmete väljavõtt ja salvestamine;

    vajadusel päringu muutmine ja korduva (selgitava) otsingu läbiviimine koos tulemuste hilisema töötlemisega.

Valitud materjalide mahu vähendamiseks filtreeritakse otsingutulemused allika tüübi (saidid, portaalid), teemade ja muude põhjuste järgi.

Kasutatud otsingutehnoloogiad IS võib jagada 4 kategooriasse:

    Temaatilised kataloogid;

    Erikataloogid (veebikataloogid);

    Otsingumootorid (täistekstiotsing);

    Metaotsingu tööriistad.

Internetis majutatakse IPS-i ühes või mitmes serveris. Infosüsteem kogub, indekseerib ja registreerib infot süsteemi poolt teenindatavate veebiserverite rühmas saadaolevate dokumentide kohta. Kõik olulised sõnad on dokumentides indekseeritud või ainult sõnad pealkirjadest.

Temaatilised kataloogid näha ette dokumentide menetlemine ja nende määramine ühte mitmest kategooriast, mille loetelu on eelnevalt kindlaks määratud. Tegelikult on see klassifikatsioonil põhinev indekseerimine. Indekseerimine võib toimuda automaatselt või käsitsi ekspertide abiga, kes sirvivad populaarseid veebisaite ja koostavad kokkuvõtlike dokumentide lühikirjelduse (märksõnad, abstrakt, kokkuvõte).

Spetsialiseeritud kataloogid võiteatmeteosed on loodud üksikute tegevusalade ja teemade, uudiste, linnade, e-posti aadresside jne järgi.

otsingumootorid (Interneti kõige arenenum otsinguvõimalus) rakendavad täistekstiotsingu tehnoloogiat. Küsitlusserverites asuvad tekstid indekseeritakse. Indeks võib sisaldada teavet mitme miljoni dokumendi kohta. Näiteks populaarse IPS-i "AltaVista" register sisaldab rohkem kui 56 miljonit URL-i.

Rahaliste vahendite kasutamiselmetaotsing Päringut täidavad korraga mitu otsingumootorit. Otsingutulemused on ühendatud ühiseks loendiks, mis on sorteeritud asjakohasuse järgi. Iga süsteem töötleb ainult osa võrgusõlmedest, mis võimaldab otsingubaasi laiendada. Sellesse klassi kuuluvad ka "isiklikud otsinguprogrammid", mis võimaldavad teil luua oma metaotsingu tööriistu (näiteks teha automaatselt päringuid sageli külastatavatelt saitidelt).

Teabeandmebaasid võivad sisaldada peaaegu igasugust teavet, sealhulgas mis tahes kombinatsiooni. Infootsing toimub nii täistekstis EIR-is olemasolevate terminite kui ka ILP osaks olevate erielementide abil. Päringute moodustamiseks kasutatakse spetsiaalseid teabeotsingu keeli.

Leitud valimi sees püüab IPS tavaliselt dokumente järjestada nende "asjakohasust " ehk lähedus kasutaja sisestatud päringule. Sellise läheduse kriteeriume on palju ja päringule "tähenduselt" lähedaste dokumentide tuvastamine ei lahenda teabe hankimise probleemi asjakohase dokumendi puudumisel. Olukord on üsna triviaalne, ka seetõttu, et kasutaja otsib sageli dokumenti. Tuleb märkida, et otsingu tulemusel saab kasutaja nii asjakohaseid, asjakohaseid kui ka ebaolulisi ja mitteasjakohaseid andmeribasid.

IPS on tegelikultinfo tugisüsteemidning need on andmebaasid ja andmepangad. Naguobjektiksneed hõlmavad üksikisikut, organisatsiooni, tööstust, piirkonda jne.Teabetoetuse teemaon arvutiteadlane, iga teabe tarbija.

Otsi organisatsiooni

Tehakse ettepanek jagada vajaliku teabe otsimise protseduur üheksaks põhietapiks:

    Teadmisvaldkonna määratlus;

    Andmete tüübi ja allikate valimine;

    Infomudeli täitmiseks vajalike materjalide kogumine;

    Kõige kasulikuma teabe valik;

    Infotöötlusmeetodi valik (klassifikatsioon, klasterdamine, regressioonanalüüs jne);

    Algoritmi valimine mustrite otsimiseks;

    Otsige kogutud teabest mustreid, formaalseid reegleid ja struktuurseid seoseid;

    Saadud tulemuste loov tõlgendamine;

    Väljavõetud "teadmiste" integreerimine.

Otsingu läbiviimiseks laaditakse kasutaja arvutisse algselt vastava andmebaasiga töötamise liides. See võib olla kohalik või kaugandmebaas. Esialgu peaksite otsustama otsingu tüübi üle (lihtne, täiustatud jne). Seejärel otsimiseks pakutavate väljade komplektiga. IPS võib pakkuda üht või mitut sisestusvälja. Viimasel juhul on tavaliselt need väljad: autor, pealkiri (pealkiri), ajaperiood, dokumendi tüüp, märksõnad, pealkirjad jne. Päringu moodustamisel võimaldavad peaaegu kõik süsteemid kasutada loogilisi elemente "AND", "OR" ", "EI".

Infootsingu tehnoloogiad

Infovajaduste täitmiseks kasutatavad otsinguvahendid ja -tehnoloogiad määratakse kasutaja poolt lahendatava põhitegevuse ülesande tüübi ja oleku järgi: tema teadmiste ja teadmatuse suhe uuritava objekti kohta. Lisaks määrab kasutaja süsteemiga suhtlemise protsessi kasutajate teadmiste tase ressursi sisust (esituse täielikkus, allika usaldusväärsus jne) ja süsteemi kui tööriista funktsionaalsus. Üldiselt taanduvad need tegurid tavaliselt "professionaalsuse" mõistele - informatiivne (koolitatud/koolitamata kasutaja) jateema (professionaalne/mitteprofessionaalne)"professionaalsus ".

Teabe otsimise protsess on tavaliselt empiiriline. See kujutab sammude jada, mis viivad läbi süsteemi mingi tulemuseni, võimaldades hinnata selle täielikkust. Samas ei motiveeri kasutaja käitumist otsinguprotsessi juhtimise organiseeriva algusena mitte ainult infovajadus, vaid ka süsteemi pakutavate strateegiate, tehnoloogiate ja tööriistade mitmekesisus.

Tavaliselt pole kasutajal ammendavaid teadmisi selle ressursi infosisu kohta, milles ta otsingut teeb, seetõttu saab ta lisateavet leides hinnata nii päringuavaldise adekvaatsust kui ka saadud tulemuse täielikkust, või korraldades protsessi nii, et osa otsingutulemustest saab kasutada teise osa adekvaatsuse kinnitamiseks või ümberlükkamiseks.

Operatsiooniobjektid, mis on otseselt seotud kasutajate suhtlusega otsingumootoriga, on dokumendi otsingupilt (DOI) ja DO, mille vastavuse tuvastab AIPS-i otsingumootor formaalsel tasemel. Kujutise adekvaatsuse dokumendi tegelikule sisule määrab teabe keerdumise protsessi kvaliteet ja teadmiste tase refleksiooni vahendi subjekti - ainevaldkonna kontseptuaalse skeemiga ja ILP võimalustega.

Dokumendiotsingu pilt- dokumendi kirjeldus, mis on väljendatud ILP abil ja mis iseloomustab selle dokumendi peamist semantilist sisu või muid tunnuseid, mis on vajalikud selle taotluse korral selle otsimiseks.

Enamik PS-e pakub kasutajatele algselt kas BR-sid või linke täielikele või osalistele dokumentidele, nende kirjeldustele ja teistele, mis on salvestatud erinevatesse AIPS-idesse. Tänapäevased PS-id võimaldavad määrata ja näidata, mis ja millisel kujul infoallikas kasutajat huvitab.

Otsingutulemuste töötlemise meetodid

Vastavalt teisenduste olemusele (töötlemistulemuste edasise kasutamise kontekstis) võib otsingutulemuste töötlemise meetodid jagada kahte rühma:

    Struktuurivormingus teisendused;

    Struktuursemantilised teisendused (infoanalüütilised, loogilis-semantilised).

Otsingu rakendamine

Internetist sageli otsitud: üksikisikute ja organisatsioonide isikuandmed; mitmesugused aadressiandmed; konkreetsed materjalid (artiklid, raamatud, fotod, viiteandmed, tarkvara jne), sealhulgas nende säilitamise koht; kus ja kui palju maksavad teatud materjalid, teenused, tooted jms; infosaidid ja portaalid jne.

Üldiselt on aktsepteeritud korraldada otsingut sõna algusfragmentide järgi (otsing parema kärpimisega), näiteks võib sõna "raamatukogu" asemel sisestada selle fragmendi "raamatukogu*". Sel juhul leitakse dokumendid, mis sisaldavad mitte ainult sõna "raamatukogu", vaid ka "raamatukogu", "raamatukoguhoidja", "raamatukoguhoidja" jne. Igal juhul peab kasutaja ette kujutama, mida ta täpselt leida soovib, kuna pakutud him variandis leitakse palju suurem hulk dokumente, kui antud sõna täielikult (ilma kärpimata) täpsustamisel. Sellisel juhul on võimalik vastuvõetud teabemassiivis läbi viia täpsustusotsing ja selle tulemusena saada asjakohasemaid ja asjakohasemaid andmeid.

Tulemuste registreerimine

IS-i seisukohalt on selles leiduv otsingutulemus leitud dokumentide või nendele viitavate dokumentide kogum (alamhulk). Tavaliselt esitatakse see kasutajale loendi kujul. See tähendab, et sel juhul on lihtsaim väljundvorm linkide loend täielike või osaliste BR-ide kujul, mille IR leidis. Sellist nimekirja saab kohe välja printida või saata suvalisele e-posti aadressile, kui IP poolt selline võimalus on ja kasutajal on internetiühendus.

Graafilist ja täisteksti EIR-i saab pakkuda kasutajale ainult vaatamiseks, erinevates vormingutes ja mõõtkavas kopeerimiseks ning tervikuna või osaliselt. Graafilised IR-d eksisteerivad tavaliselt üldtunnustatud vormingutes nagu: JPG, GIFF, TIFF, BMP jne ning tekstimaterjalide jaoks kasutavad nad tavaliselt tekstivorminguid TXT, DOC jne, HTML ja PDF – tegelikult graafiline vorming, milles neid saab salvestada nii teksti kui ka graafiliste andmetena.

Otsingu tulemusel saadud dokumendid salvestatakse.

Otsi hindamiskriteeriume

Otsingutulemuse kriteeriumiks on see, kas kasutaja saab tema otsingupäringus sõnastatud vajadustele kõige paremini vastava dokumentide loetelu, ühe dokumendi või selle osad. IPS-is on tavaks moodustada otsingu tulemusena saadud dokumentide loetelu nende asjakohasuse järgi. Otsinguretsepti ja väljastatud dokumendi vahel on semantilise ja formaalse vastavuse kriteeriumid.

arvuti Interneti-animatsiooni otsingumootor

Interneti otsingumootorid

Vajaliku ressursi leidmiseks Internetist märksõnade järgi kasutatakse otsingumootoreid Google, Yahoo, Yandex, Mail .... Need süsteemid või, nagu neid muidu nimetatakse, otsingumootorid, läbivad iga päev miljoneid WWW-servereid, indekseerivad ja kataloogivad leitud ressursse. Võimalus Internetist ressurssi otsida on väga mugav, kuid me ei tohi unustada, et veeb elab oma elu - iga päev ilmub tuhandeid uusi lehti, mõned vanad kaovad ... Seetõttu ei anna otsingumootorid alati kõige täpsemat teavet.

Otsingu- ja struktureerimistööriistu, mida mõnikord nimetatakse ka otsingumootoriteks, kasutatakse selleks, et aidata inimestel leida vajalikku teavet. Internetis asuvate dokumentide kohta teabe kogumiseks kasutatakse otsingutööriistu, nagu agendid, ämblikud, roomajad ja robotid. Need on eriprogrammid, mis otsivad veebilehti, eraldavad nendelt lehtedelt hüperteksti linke ja indekseerivad leitud teabe automaatselt andmebaasi koostamiseks. Igal otsingumootoril on oma reeglid, mis määravad dokumentide kogumise. Mõned järgivad iga leitud lehekülje iga linki ja uurivad seejärel iga linki igal uuel lehel jne. Mõned inimesed ignoreerivad linke, mis viivad graafika- ja helifailide, animatsioonifailide juurde; teised ignoreerivad viiteid ressurssidele, nagu WAIS-i andmebaasid; teistel palutakse kõigepealt vaadata kõige populaarsemaid lehti.

Google- suurim otsingumootorite võrgustik, mille omanik on Google Inc.

Esimene populaarseim süsteem, mis töötleb 41 miljardit 345 miljonit päringut kuus, indekseerib enam kui 25 miljardit veebilehte, suudab leida teavet 195 keeles.

Google'i liides sisaldab üsna keerukat päringukeelt, mis võimaldab teil piirata otsingut konkreetsete domeenide, keelte, failitüüpidega jne.

Otsingutulemuste jaoks andis Google varem võimaluse uuesti otsida, võimaldades teil otsida üksikasjalikumalt. Täpsema otsingu jaoks pidid kasutajad määrama tulemuste valimise lisaparameetrid, mis võimaldasid kohe kuvada mitte ainult päringu, vaid ka konteksti, kus seda rakendatakse. See funktsioon lihtsustas otsinguprotseduuri, kaotades vajaduse iga tulemust avada. 22. septembril 2010 käivitas ettevõte Venemaal häälotsingu. Otsimiseks peate vajutama telefoni otsinguriba kõrval olevat nuppu ja ütlema oma päringu, telefon saadab teie hääle serverisse ja brauser kuvab stringi, mis sisaldab teie päringut ja selle otsingutulemusi.

Seoses ingliskeelse otsingumootori populaarsusega on tekkinud neologism google’ile ehk Google’ile, mida kasutatakse Google’i abil internetist info otsimise kohta. Just selle määratlusega on tegusõna loetletud inglise keele kõige autoriteetsemates sõnaraamatutes - Oxford English Dictionary ja Merriam-Webster, kuigi teised allikad toovad näiteid selle kasutamise kohta, mis tähendab Internetist millegi otsimist.

Yandex on Venemaa IT-ettevõte, mis omab veebiotsingusüsteemi ja samanimelist internetiportaali. Yandexi otsingumootor on töödeldud otsingupäringute arvu poolest maailma otsingumootorite seas neljas. Alates 8. veebruarist 2013 on sait yandex.ru Alexa.com reitingu järgi maailmas populaarsuselt 20. kohal ja Venemaal 1. kohal.

Otsingumootor Yandex.ru kuulutati ametlikult välja 23. septembril 1997 ja algul töötati välja CompTek Internationali raames. Eraldi ettevõttena asutati Yandex 2000. aastal. 2011. aasta mais korraldas Yandex esmase avaliku pakkumise, teenides sellega rohkem kui ükski Interneti-ettevõte pärast Google'i IPO-d 2004. aastal.

ь Indekseerimise haldamine Yandexi otsingumootoris

Indekseerimise load ja keelud võetakse failist robots.txt. Yandex toetab META robotite märgendit, NOINDEXi märgendit ja mittestandardset robots.txt laiendust – hosti direktiivi. Indekseerimise load ja keelud võtavad kõik otsingumootorid serveri juurkataloogis asuvast failist robots.txt. Mitme lehekülje indekseerimise keeld võib ilmneda näiteks soovist mitte indekseerida samu dokumente erinevas kodeeringus. Mida väiksem on server, seda kiiremini robot sellest mööda läheb. Seetõttu on soovitav keelata failis robots.txt kõik dokumendid, mida pole mõtet indekseerida.

ь Lehtede lisamine Yandexi otsingumootorisse

Yandex skannib iga päev sadu tuhandeid veebilehti, otsides muudatusi või uusi linke. Ressursiomanikud saavad lisada oma saidi, täites AddURL-i vormi

Yandexi otsingumootor on täistekst, see tähendab, et selle registrisse satuvad (ja muutuvad otsimiseks kättesaadavaks) ainult need sõnad, mis on kirjutatud saitide lehtedele.

ь Indekseerimine Yandexi otsingumootoris

Kui Yandex tuvastab uue või muudetud lehe, indekseerib see selle. Selle käigus jagatakse leht elementideks, mille sisu kantakse registrisse. Kui Yandex tuvastab uue või muudetud lehe, indekseerib see selle. Selle käigus jagatakse leht elementideks (tekst, pealkirjad, pildiallkirjad, lingid ja nii edasi), mille sisu kantakse registrisse. See võtab arvesse sõnade asukohti, st nende asukohta dokumendis või selle elemendis. Dokumenti ennast andmebaasi ei salvestata.

Yahoo! on Ameerika ettevõte, mis omab maailmas populaarsuselt teist otsingumootorit ja pakub mitmeid teenuseid, mida ühendab internetiportaal Yahoo! kataloog; portaal sisaldab populaarset Yahoo meiliteenust.

Alexa Interneti statistika järgi 2012. aasta veebruaris-aprillis Yahoo! - neljas enim külastatud veebisait Internetis ja ligikaudu 28% külastustest koosneb ainult ühe lehe vaatamisest.

Mail- Vene Interneti suur suhtlusportaal, mille igakuine auditoorium ületab 2012. aasta oktoobri seisuga 31,9 miljonit inimest.

Töötajate arv on 2800 inimest.

Ressurss kuulub investeerimisgrupile Mail. Grupp Ru.

Portaali põhiteenus on postiteenus Pochta@Mail. Ru, loodi 1998. aastal vene emigrantide asutatud Ameerika tarkvarafirmas DataArt. DataArti Peterburi kontori programmeerijad lõid veebimeiliserverile uue tarkvara, mis pidi edaspidi müüma lääne firmadele. Teenuse testimiseks tehti see 1998. aasta novembris ajutiselt Venemaa kasutajatele avalikult kättesaadavaks ning teenus hakkas ühtäkki kiiresti populaarsust koguma.

Posti VP ja CTO sõnul. Ru Vladimir Gabrielyan, portaalis on kaheksa andmekeskust, serverite arv on 9000 ühikut. Maili tehnilises osakonnas. Ru annab tööd enam kui seitsmesajale spetsialistile.

Otsi organisatsiooni

Otsinguvorm on väga kasulik ja populaarne asi, eriti kui tegemist on tõsiste suurte (lehtede arvu ja esitatava materjali poolest) ja hästi külastatud saitidega. Selliselt saidilt õige teabe leidmine ainult navigeerimismenüü ja siselinkide abil võib mõnikord olla keeruline ülesanne. Märksa lihtsam on paar vajalikku sõna vastavale väljale sõita, klõpsata nupule “leida” ja selle tulemusena hankida linke lehtedele, kus võib olla kasutajat huvitavat infot.

Otsingut saab tavaliselt teha kahel viisil:

1. saidimootori (php või mõne muu veebiprogrammeerimiskeele) abil teostatud otsing - kuid see on mõeldud ainult tõsistele veebiprogrammeerijatele, lihtsurelikule on eelistatav meetod number 2;

2. otsingumootorit käsitlev otsinguvorm. See meetod on saadaval igale inimesele, kes on omandanud HTML-i põhitõed, ja sobib igale saidile, isegi kui see koosneb staatilistest HTML-lehtedest. Selline otsing tehakse aga ainult nendel lehtedel, mis on otsingumootori andmebaasis. Selleks, et saidi kõik lehed saaksid normaalselt indekseeritud, tuleb järgida kahte reeglit: 1) otselink ilma ümbersuunamiseta peaks viima saidi igale lehele; 2) sait ei tohi rikkuda kasutatava otsingumootori otsingulitsentsi.

Asjakohasus

Infootsingu asjakohasus on otsingupäringu ja dokumendi otsingupildi semantiline vastavus. Üldisemas mõttes on "asjakohasuse" kvaliteedi mõistele üks kõige lähedasem "adekvaatsus", st mitte ainult vastavuse astme hinnang, vaid ka tulemuse praktilise rakendatavuse aste, kuna samuti probleemi lahenduse sotsiaalse rakendatavuse määr.

Asjakohasuse tüübid

Dokumendi vastavus teabenõudele, määratud mitteametlikult

2. Formaalne asjakohasus

Sobivus, mis määratakse kindlaks otsingupäringu kujutise ja dokumendi otsingupildi võrdlemisel teatud algoritmi järgi.

Loeng INFOOTSINGU KORRALDUS JA TEHNOLOOGIA INTERNETIS 1. 2. Infootsingu tööriistad Infootsingu tehnoloogia

Interneti omadused võimaldavad kiiremini teavet otsida kui traditsioonilised. Märkimisväärse teabehulgaga on võrk poolstruktureeritud. Sellega seoses arendatakse aktiivselt teabeotsingu tööriistu, et automatiseerida selles keskkonnas teabeotsingu protsessi. slaid number 3

Infootsingu tööriistad Interneti-otsinguteenused (teabe otsimiseks mõeldud tööriistad) Otsingumootorid Kataloogid (otsingumootorid) (kataloogid) Metaotsingumootorid (metaotsingumootorid) Slaidi number 5

Otsingumootorite klassifikatsioon teaberessursside ulatuse järgi Slaid nr 6 INTERNET Otsingumootorid Kataloogid Globaalne piirkondlik kohalik spetsialiseerunud piirkondlik metaotsingumootorid Võrk Kohalik Spetsialist

Otsingutööriistade klassifitseerimine teaberessursside ulatuse järgi Konkreetne otsingutööriist võib vastata korraga mitmele loetletud tüübile. Otsingutööriista tüüp määrab selle tööriistaga Interneti-teaberessursside katvuse. slaid number 7

Infootsingusüsteem Slide nr 8 Teabeotsingusüsteem (IPS) on süsteem, mis võimaldab dokumentide indeksi alusel infot valida, indekseerida ja hankida. Info indekseerimine tähendab igale dokumendile dokumendi sisu kajastavate ja otsingut juhtivate märksõnade määramist, mis viib nende dokumentideni, mille sõnad osutuvad sarnasemaks IS-i päringu sõnadega, kogumise, säilitamise probleemide lahendamine. , teabe töötlemine ja väljastamine, dokumentide otsimine, nende sisu analüüsimine, dokumentide otsingupiltide koostamine (teabe ammutamine dokumentidest, mida süsteem kasutab teadmiseks dokumendi kohta), otsingupiltide salvestamine, kasutajate päringute analüüsimine, asjakohaste dokumentide otsimine ( vastav) päringule ja kasutajatele dokumentide linkide väljastamine.

Tüüpiline IPS-skeemi slaid nr 9 Taotlege klienditeavet Roboti indekseerija kasutajaliidese vastused Otsingumootori vastuse päringu dokumendi register

IPS-i slaidi nr 10 omadused Iga konkreetne otsingumootor ei salvesta teavet kõigi Interneti-dokumentide kohta, vaid ainult nende dokumentide kohta, mis on selle süsteemi jaoks teada (erinevate süsteemide puhul on indekseeritud dokumentide protsent erinev, kuid reeglina , ei ületa 70%). Otsingumootorid ei salvesta dokumente ise, vaid ainult nende kohta piisavat infot, et kasutaja need leiaks, ning sellest tulenevalt ei pruugi kõnealune süsteem otsingu tulemusena mõnda päringule vastavat dokumenti tagastada. Otsingu (päringule vastamise) tulemusel sorteerib süsteem dokumendid vastavalt kasutaja päringule vastavuse astmele otsingumootori algoritmi seisukohalt, mitte aga nende otsingumootori algoritmi seisukohalt. tegelik vastavus taotlusele.

IPS-i slaidi nr 11 kasutamine Otsingumootorid on kõige mahukam teadmiste allikas Interneti lehtede (dokumentide) kohta. Enamasti tuleb infootsingusüsteemide abil otsida mitmesugust infot internetist. Kasutaja päringu alusel teabe hankimise kiiruse ja täielikkuse osas pole neil võrdset. Paljud otsingumootorid jagavad otsingumootorit ja kataloogi.

Infootsingusüsteemid Internetis ülemaailmselt populaarsed teabeotsingusüsteemid on: n Google (http: //www. google. com) n Bing (http: //search. msn. com/) n Küsi. com (http://www. ask. com) Vene IPS sisaldab: n Yandex (http://www. yandex. ru, http://www. ya. ru) n Rambler (http://www. rambler . ru) n Webalta (http://www.aport.ru/) Slaid nr 12

Kataloogi slaid nr 20 Kataloog on süsteem, mis pakub teabe klassifitseerimist. Selle eripäraks on ressursside hierarhia (järjestusskeem), milles iga ressurss kuulub ühte või mitmesse sektsiooni. Kataloogid salvestavad Interneti-ressursside kirjeldusi (märkusi). Need on täidetud veebihalduritega (inimesed, kes loovad teaberessursse) või spetsiaalsete toimetajatega, kes vaatavad võrgu teaberessursse. Vastuseks kasutaja päringule otsivad kataloogid neid kirjeldusi. Kataloogid ei tuvasta automaatselt võrgu teaberessursside muudatusi.

Tüüpiline kataloogiskeemi slaid nr 21 Päringu teabe ressursid Tehniliste töötajate kasutajaliidese vastused hüpertekst lingid Kliendi otsingumootori vastuse päringu teaberessursside hierarhia ja nende kirjeldused

Kataloogi kasutamine Slaid nr 22 Otsinguprobleemi lahendamisel, kui on vaja leida grupp inforessursse üsna laial teemal, on kataloog parim tööriist otsingu sooritamiseks, näiteks kontaktandmeid pakkuvate saitide otsimisel Moskva organisatsioonide või elektrooniliste meedialehtede jaoks. Kataloogide otsingutulemused võivad olla sisukamad, kuna neis olevad teaberessursid on inimeste poolt ette valmistatud.

Kataloogid Slaid nr 23 Ülemaailmsed elektroonilised kataloogid Internetis on järgmised: n Yahoo (http://www. yahoo. com) n avatud kataloog (http: // www. dmoz. org) n Look. Nutikas (http: //www. lookmart. com) Kõige olulisemad Venemaa elektroonilised kataloogid on: n Yandexi kataloog (http: //yaca. yandex. ru) n E-posti kataloog. ru (http://www. list. ru/) n Rambler’s Top 100 kataloog (http://top 100. rambler. ru)

Metaotsingusüsteem Slide nr 28 Metaotsingusüsteem on pealisehitus otsingumootorite ja elektrooniliste kataloogide kohal, millel puudub oma andmebaas (indeks) ja mis kasutaja otsinguretsepti otsimisel genereerib automaatselt päringuid mitme välise otsingutööriista jaoks ning seejärel ka analüüsib automaatselt nendelt saadud tulemusi ja tagastab linkide loendi järjekorras, mis on määratud mitme otsingumootori vastuste hinnangute suhte järgi korraga. Erinevate otsingumootorite teaberessursside strateegiate ja ulatuse erinevused viivad sageli selleni, et erinevad otsingumootorid annavad samale päringule erinevaid vastuseid. Metaotsingusüsteemid kasutavad oma töös teiste infootsingu vahendite potentsiaali.

Metaotsingusüsteemi tüüpiline skeem Slaid nr 29 Päring Kliendi kasutajaliides Vastus Otsingumootor Päringud Teabeallikad Vastused IPS 1 Kataloog 1 IPS N Kataloog N

Metaotsingumootori slaid nr 30 kasutamine Metaotsingumootorid on kõige tõhusamad teabe otsimise algfaasis. Need võimaldavad teil kiiresti kontrollida, kas vajalik teave on Internetis olemas, ja lokaliseerida otsingutööriistad, milles see on. Metaotsingumootorid võimaldavad teil vähendada teabe otsimisele kuluvat aega, kuna kasutaja päringu töötlemisel pääsevad need süsteemid korraga juurde mitmele erinevale otsingumootorile.

Metaotsingumootorite tüübid Slaid nr 31 Võrk – teabe otsimiseks võrgu kaudu kättesaadav Interneti kaudu saadaolevate globaalsete metaotsingumootorite hulka kuuluvad: n Meta. Crawler (http://www.metacrawler.com) n Veeb. Crawler (http://www.webcrawler.com) n Otsing. com (http://www.search.com) Venemaa kuulsaimad metaotsingumootorid: n Meta. Bot. ru (http: //metabot. ru) n Nigma (http: //nigma. ru) Venekeelsete otsingutööriistade eeliseks on päringu korrektne töötlemine riigikeeles.

Spetsialiseeritud otsingutööriistad Slide #33 Süsteemid, mis otsivad faile, näiteks faili. otsing. ru (http: //www. filesearch. ru) Süsteemid, mis pakuvad otsingut elektroonilise meedia uudistes, näiteks Yandex News (http: //news. yandex. ru), Google News (http: //news. google. ru ) Otsige kaupu, näiteks Yandex Market (http://market. yandex. ru), Torg. ru (http://www. torg. ru) Inimesed otsivad näiteks POISKI. ru (http://poiski. ru), Poisk 24 (http://www. poisk 24. de), Yahoo! Inimeste otsing (http://people.yahoo.com)

Spetsiaalsed otsingutööriistad Pildiotsing, näiteks Yandex Pictures (http://images.yandex.ru), Google Pictures (http://images.google.ru) Videootsing, näiteks Yandex Video (http://images.yandex.ru) .yandex .ru), Google Video (http://video.google.ru) Slaid № 34

Täiendavad otsingutööriistad ja -meetodid Slaid nr 36 Internetis saab infot otsida mitte ainult otsingumootoritega, vaid ka muul viisil. Veebis on palju erinevaid saite, teenuseid ja kasutajaid, mis võivad teid otsingu tegemisel aidata. Selliste teenuste hulka kuuluvad küsimuste-vastuste süsteemid, foorumid, erinevad Interneti-kogukonnad (sotsiaalvõrgustikud), e-post, vestlused. Kõigil neil teabe hankimise viisidel on ühine see, et teie küsimustele vastavad teised inimesed (ja mitte programmid). Küsimuste ja vastuste süsteemid: Vastuste Mail. ru (http://answer. mail. ru), Google'i küsimused ja vastused (http: //answer. google. ru), Znatok. ru (http://znatok.ru)

Täiendavad otsingutööriistad ja -meetodid Slaid nr 37 Need meetodid on täiendavad, kuna: n nad ei ole universaalsed (kuhjuvad aadresse ebapiisavas mahus või kitsastes suundades); n küsimusele vastuse saamisel pole täpset garantiid (küsimuse võib lihtsalt ignoreerida), sellistes süsteemides võib vastuse saamine mõnikord kaua aega võtta. Täiendavate otsingumeetodite kasutamise peamine eelis on saadud teabe suur täpsus.

Soovitused infootsinguks Slaid nr 40 Veenduge, et päringu sõna (fraas) on õigesti kirjutatud. Teie taotlust saab parandada, kui sõna, milles te vea tegite, kasutatakse sageli. Haruldasi sõnu või väljendeid ei pruugita leida. Otsingumootorite abil teabe otsimisel peaksite teadma, et süsteemid vastavad tavaliselt igale kasutaja päringule (suure Interneti-mahu tõttu) (näiteks päring asgr vkt 5, mis esmapilgul on mõttetu komplekt tähemärkidest, leidis Yandexi otsingumootor 12 veebilehte, millel see fraas esineb). Ole ettevaatlik.

Soovitused teabe otsimiseks Slaid № 41 Täpsustage päring. Mida täpsem on päringufraas, seda tõenäolisem on kiiresti vajalik teave leida, näiteks Yesenini luuletuse ja Yesenini algusaastate luuletuse otsingutulemused on erinevad. Kasutage sünonüüme. Kui teie päring ei leidnud vajalikku teavet, proovige oma päringut täpsustada, asendades sõna selle sünonüümiga, näiteks RAM või RAM või RAM. Erinevad sõnad ja fraasid annavad erinevaid tulemusi. Kasutage sõnu, mida võiks otsitavatel veebisaitidel kasutada.

Soovitused infootsinguks Slaid nr 42 Päringu koostamisel tuleb alati mõttes ette kujutada, milline võiks olla dokumendi kavandatav sisu. Näiteks kui teil on vaja leida teavet A. S. Puškini kohta, siis ei piisa ainult tema perekonnanime märkimisest päringus (tulemuste loend sisaldab palju erinevaid asutusi, mis asuvad erinevates linnades Puškini tänavatel). Otsing toob suurema efekti, kui perekonnanimele lisada luuletaja teoste nimed. Teoste tekstide otsimiseks tasub neist sisestada eraldi read (viidates eelistatavalt harva kasutatud).

Soovitused infootsinguks Slaidi number 43 Ärge sisestage otsingumootorisse päringut tavalises kõnekeeles. Niisiis, nõudmisel, milline on ilm praegu Nižni Novgorodis? leitakse dokumendid, mis sisaldavad kõiki päringu sõnu, nimelt seda küsimust sisaldavad tekstid (näiteks kirjandusteoste tekstid). Sel juhul oleks tõhusam sisestada Nižni Novgorodi ilmapäring, mille vastuse esimesele kümnele lingile on vajalik teave. Proovige päringusõnu kirjutada ainult väikeste tähtedega - sellise päringu jaoks leiate lisadokumente.

Näpunäiteid teabe leidmiseks Slaid #44 Otsige sarnaseid dokumente. Kui üks leitud dokumentidest on otsitavale teemale lähemal kui ülejäänud, klõpsake lingil "leia sarnaseid dokumente" . Otsingumootor analüüsib lehte ja leiab teie määratud dokumendiga sarnased dokumendid. Kuid kui see leht on serverist kustutatud ja otsingumootoril pole veel olnud aega seda registrist eemaldada, kuvatakse teile teade "Soovitud dokumenti ei leitud".

Soovitused teabe leidmiseks Slaidi number 45 Kasutage märke "+" ja "-". Dokumentide välistamiseks, kus konkreetne sõna esineb, lisage selle ette miinusmärk. Ja vastupidi, veendumaks, et teatud sõna on dokumendis olemas, pange selle ette plussmärk. Pange tähele, et sõna ja pluss-/miinusmärgi vahel ei tohi olla tühikuid. Päringu täpsustamiseks saate kasutada ka muid spetsiaalseid käske. Nende loendi leiate süsteemispikust, tavaliselt lehelt "Päringu keel".

Näpunäiteid teabe leidmiseks Slaid #46 Otsige täpseid fraase. Kui teate täpset fraasi, mis tulemuste lehel ilmuma peaks, siis täpsustage see päringus, pannes jutumärkidesse. Näiteks "Laiad ruumid unistustele ja elule Tulevad aastad avanevad meile" Kasutage piirkondlikke otsingumootoreid. Täpsema teabe saamiseks muus keeles kui inglise keeles võite kasutada piirkondlikke süsteeme, mis töötavad selle keelega. Paljudes riikides on piirkondlikel süsteemidel lai valik ressursse. Venemaa suurim otsingumootor on Yandex (http://www.yandex.ru).

Soovitused teabe otsimiseks Slaidi number 47 Kasutage spetsiaalseid otsingumootoreid. Kui otsite pilte, videoid, tooteid, kaarte ja muud teavet, leiate kogu selle teabe kiiremini, kasutades selleks spetsiaalseid otsingumootoreid. Paljudel üldotstarbelistel otsingumootoritel on seda tüüpi teabe otsimiseks spetsiaalsed liidesed (vt konkreetsete süsteemide kirjeldusi). Otsingupäring võib sel juhul olla järgmine: pildiotsing.

Soovitused teabe otsimiseks Slaid nr 48 Kui teabeallikaks on organisatsioon, siis proovige otsida infot selle organisatsiooni kodulehelt. Otsingumootorid ei pruugi olla teadlikud kogu Interneti-saitidel salvestatud teabest. Minge selle organisatsiooni veebisaidile, kust see teave pärines, võib-olla leiate selle kohta üksikasjalikku teavet. Saitidel on kohalikud otsingumootorid (mis otsivad spetsiaalselt seda saiti) või võite proovida leida vajalikku teavet saidi jaotistes navigeerides. Kui näiteks kuulsite raadiost saadet ja teate selle raadiojaama nime. Otsige teavet selle programmi kohta selle raadiojaama ametlikult veebisaidilt.

Näpunäiteid teabe leidmiseks Slaid #49 Küsige teistelt inimestelt abi teabe leidmisel. Internetis on spetsiaalsed süsteemid (näiteks küsimuste-vastuste süsteemid), milles mõned kasutajad saavad aidata teisi teabe leidmisel. Võib-olla on inimesed juba teiega sama küsimuse vastu huvi tundnud ja teavad õiget vastust.

Interneti-otsingu meetodid

Kolm võimalust veebist otsimiseks

Internet üldiselt ja täpsemalt World Wide Web pakuvad abonendile juurdepääsu tuhandetele serveritele ja miljonitele veebilehtedele, mis salvestavad kujuteldamatul hulgal teavet. Kuidas mitte eksida selles "infoookeanis"? Selleks peate õppima, kuidas võrgust vajalikku teavet otsida ja leida.

Nagu juba mainitud, on Internetist teabe leidmiseks kolm peamist viisi.

1. Lehekülje aadressi täpsustamine. See on kiireim viis otsimiseks, kuid seda saab kasutada ainult siis, kui dokumendi aadress on täpselt teada.

2. Navigeerimine hüperlinkide kaudu. See on kõige vähem mugav meetod, kuna seda saab kasutada dokumentide otsimiseks, mis on ainult praegusele dokumendile lähedased. Kui käesolev dokument on pühendatud näiteks muusikale, siis selle dokumendi hüperlinke kasutades on vaevalt võimalik spordile pühendatud saidile pääseda.

3. Otsinguserveriga (otsingumootoriga) ühenduse võtmine. Otsingumootorite kasutamine on teabe leidmiseks kõige mugavam viis. Praegu on Interneti venekeelses osas populaarsed järgmised otsinguserverid:

Yandex;
Rambler;
Aport.

On ka teisi otsingumootoreid. Näiteks on meiliteenuse serveris mail.ru rakendatud tõhus otsingusüsteem.

Otsi serveritest

Kõige kättesaadavam ja mugavam viis veebist teabe leidmiseks on kasutada otsingumootoreid. Samas saab infot otsida nii kataloogide kui ka otsitavat tekstidokumenti iseloomustavate märksõnade komplekti järgi.

Kaaluge otsinguserverite kasutamist üksikasjalikumalt. otsinguserver sisaldab suurel hulgal linke mitmesugustele dokumentidele ja kõik need lingid on süstematiseeritud temaatilistesse kataloogidesse. Näiteks: sport, filmid, autod, mängud, teadus jne. Pealegi määrab server need lingid iseseisvalt, vaadates regulaarselt kõiki veebilehti, mis veebis ilmuvad. Lisaks annavad otsingumootorid kasutajale võimaluse otsida teavet märksõnade järgi. Pärast märksõnade sisestamist alustab otsinguserver teistes veebiserverites dokumentide sirvimist ja kuvab lingid nendele dokumentidele, milles määratud sõnad on leitud. Tavaliselt sorteeritakse otsingutulemused kahanevas järjekorras spetsiaalse dokumendi reitingu järgi, mis näitab, kui hästi antud dokument otsingukriteeriumitele vastab või kui sageli seda veebis küsitakse.



Otsingumootori päringu keel

Märksõnade rühma, mis on moodustatud teatud reeglite järgi – kasutades päringukeelt, nimetatakse päringuks otsinguserverile. Erinevate otsingumootorite päringukeeled on väga sarnased. Selle kohta saate lisateavet, kui külastate soovitud otsinguserveri jaotist "Abi". Mõelge näiteks Yandexi otsingumootori abil päringute genereerimise reeglitele.

Operaatori süntaks Mida tähendab operaator Taotlege näidet
tühik või & Loogiline JA (lause sees) füsioteraapia
&& Loogiline JA (dokumendi sees) retseptid && (sulatatud juust)
| Loogiline VÕI foto | fotograafia | hetktõmmis | fotograafiline pilt
+ Sõna kohustuslik esinemine leitud dokumendis +olla või +mitte olla
() Sõnade rühmitamine (tehnoloogia | tootmine) (juust | kodujuust)
~ Kahendoperaator AND NOT (lause sees) pangad ~ seadus
~~ või _ Binaarne JA MITTE operaator (dokumendi sees) Pariisi reisijuht ~~ (agentuur | ekskursioon)
/(nm) Kaugus sõnades (miinus (-) - tagasi, pluss (+) - edasi) tarnijad /2 kohvimuusika /(-2 4) haridus vabad kohad ~ /+1 õpilast
" " Fraaside otsing "punamütsike" Samaväärne: punane / +1 ratsamütsike
&&/(nm) Kaugus lausetes (miinus (-) - tagasi, pluss (+) - edasi) panga && /1 maksud

Parimate otsingutulemuste saamiseks peate meeles pidama mõnda lihtsat reeglit:

1. Ärge otsige teavet ainult ühe märksõna kohta.

2. Parem on mitte sisestada märksõnu suurtähtedega, kuna nii võib juhtuda, et samu väikese tähega kirjutatud sõnu ei leita.

3. Kui teie otsing ei anna tulemusi, kontrollige, kas märksõnades pole kirjavigu.

Kaasaegsed otsingumootorid pakuvad võimalust semantilise analüsaatori genereeritud päringuga ühenduse loomiseks. Selle abil saate sõna sisestades valida dokumente, milles on selle sõna tuletisi erinevates käänetes, ajavormides jne.

Infootsingu infotehnoloogiad

Info otsimine: organisatsiooni põhimõisted, liigid ja vormid

Infootsing ehk infootsing on üks peamisi infoprotsesse. Inimkond on seda teinud iidsetest aegadest peale. Otsingu eesmärgid, võimalused ja iseloom on alati sõltunud kättesaadavusest, informatsioonist, selle tähtsusest ja kättesaadavusest ning otsingu korraldamise vahenditest.

20. sajandi lõppu – 21. sajandi algust iseloomustavad tohutud massiivid pidevalt kasvava ja mitmekesise informatsiooniga, mis on kättesaadav ja pakub huvi kõige laiemale ühiskonnakihile. Lisaks võimaldavad enamikule inimestele kättesaadavad Interneti-tehnoloogiad ning tarkvara- ja riistvaratööriistad seda protsessi läbi viia igal ajal, peaaegu kõikjal ja iga soovi korral.

Otsing- protsess, mille käigus ühes või teises jadas korreleeritakse otsing iga massiivi salvestatud objektiga. Igasuguse otsingu eesmärk on vajadus, vajadus või soov leida erinevat tüüpi teavet, mis aitab otsijal saada vajalikku teavet, teadmisi jne. parandada oma professionaalset, kultuurilist ja muud taset; uue teabe loomine ja uute teadmiste kujundamine; juhtimisotsuste tegemine jne.

Ekspertide hinnangul on Internetis 30 või enam miljonit kasutajat. Neist kümned tuhanded on võrgus (inglise keeles "on-line" - interaktiivne juurdepääs igal ajal) ja selliste kasutajate arv kasvab pidevalt. See raskendab operatiivse otsingu korraldamist ja nii suure hulga kasutajate jaoks vajaliku teabe leidmist. Probleemid tekivad infootsingu erinevatest võimalustest (tüüpidest), nende erinevatest realiseerimisviisidest infootsingusüsteemides (IPS), erinevate kasutajate teadmiste tasemetest selliste süsteemide võimaluste kohta, eriti päringute genereerimise ja saadud andmete töötlemise valdkonnas. nende päringute täitmise tulemus jne.

Eeldatakse, et tulevikus luuakse IS-id, mis suudavad automaatselt kohaneda konkreetsete kasutajate teadmiste taseme ja taotlustega, tajuvad päringuid loomulikus keeles ning tehisintellekti kasutades annavad neile asjakohast ja asjakohast teavet. Sellise IPS-i loomine nõuab konkreetsete IPS-i kasutajate või nende vahendajate intelligentsust ja teadmisi. Seni aga eeldatakse, et paljud otsingumootorite kasutajad valdavad seda teemavaldkonda üsna hästi.

Mõisteid "infootsing" või "teabeotsing" on erinevalt tõlgendatud.

Mõiste " teabe otsimine" (inglise keeles "information retrieval") tutvustas Ameerika matemaatik K. Muers. Ta märkas, et sellise otsingu ajendiks on infovajadus, mida väljendatakse teabenõude vormis. K. Muers salastatud dokumendid, teave nende olemasolu ja (või) asukoha kohta ning faktiline teave kui teabeotsingu objektid.

Raamatukogude esindajad asusid esimesena lahendama faktograafilise otsingu probleeme. Nad töötasid välja teabeotsingu tööriistad nimega " võrdlus- ja otsinguseadmed"(kataloogid, bibliograafilised registrid jne). Kodumaises professionaalses ajakirjanduses on seda terminit kasutatud alates 1970. aastatest. Raamatukoguhoidjad määratlevad " teabe otsimine "teabe sees olevat dokumentide hulk vastav kasutajate teabepäring.

Arvutitehnoloogia kasutamise seisukohast " teabe otsimine "- loogiliste ja tehniliste toimingute kogum, mille lõppeesmärk on leida tarbija taotlusega seotud dokumente, nende kohta teavet, fakte, andmeid.

"Asjakohasus" - installitud aadressil teabe otsimine vastavus dokumendi sisule infonõue või dokumendi otsingupilti otsingu ettekirjutusse.

On ka teisi määratlusi. Igal juhul põhjustab infootsingu vajadus rahuldada nende kasutajate infovajadusi, kes loodavad saada kiiresti otsimootorite abil vajalikke andmeid või informatsiooni. See on meetod asjakohaste dokumentide ja/või faktide sihipäraseks otsimiseks ja hankimiseks erinevatest teabeallikatest, näiteks andmepankadest või salvestusseadmetest. Need on elusad ja elutud objektid, mis esindavad erinevaid teabeallikaid ja -kandjaid.

Nimetatakse süsteeme, mis tagavad sellise infootsingu teostamise otsingumootorid(PS). Traditsioonilistes tehnoloogiates esindavad PS failikappe ja katalooge, aadressi- ja muid katalooge, registreid, entsüklopeediaid, väljaannete ja muude materjalide viiteseadmeid.

1945. aastal tõstatas Ameerika teadlane ja insener W. Bush oma artiklis "A Possible Mechanism of Our Thinking" esimest korda laialdaselt küsimuse teabeotsingu mehhaniseerimise vajadusest. Alates 1960. aastatest on ilmunud automatiseeritud otsingumootorid, mis töötavad teabega. Sellest perioodist alates on tehtud intensiivne töö infootsingu põhimõtete ja meetodite kujundamise ja rakendamise alal.

"Otsingumootorid" sooritama otsingut antud sõnu sisaldavate andmebaasi dokumentide või muude masinloetavate andmemassiivide hulgast.

Tavalisi või intelligentseid terminale (PC) kasutav elektrooniline PS võimaldab kasutajatel teha otsingupäringuid, kasutades formaalseid ja sisu kirjeldavaid elemente ning kasutades spetsiaalseid loogilisi operaatoreid; sooritama otsingut antud sõnu sisaldavate andmebaasi dokumentide või muude masinloetavate andmemassiivide hulgast. Otsingumootorid lubavad ainult otsinguprotseduure ja nendega seotud protsesse.

Laadimine...
Üles