Інформаційні технології пошуку інформації. Етапи пошуку інформації

Інформаційні технології пошуку інформації

Пошук інформації: основні поняття, види та форми організації

Пошук інформації або інформаційний пошук є одним з основних інформаційних процесів. Людство з давніх-давен займалося ним. Цілі, можливості та характер пошуку завжди залежали від наявності, інформації, її важливості та доступності, а також засобів організації пошуку.

Кінець XX – початок XXI століття, характеризується величезними масивами постійно зростаючої різноманітної інформації, доступною і цікавою для найширших верств соціуму. Більше того, Інтернет-технології та програмно-технічні засоби, також доступні для більшості людей, дозволяють здійснювати цей процес у будь-який час, практично в будь-якому місці за будь-якими запитами.

Пошук– процес, у ході якого у тій чи іншій послідовності виробляється співвіднесення що з кожним об'єктом, які у масиві. Мета будь-якого пошуку полягає в потребі, необхідності або бажанні знаходити різні види інформації, що сприяють отриманню особою, яка здійснює пошук, потрібних йому відомостей, знань і т.д. для підвищення власного професійного, культурного та будь-якого іншого рівня; створення нової інформації та формування нових знань; прийняття управлінських рішень тощо.

За оцінкою фахівців, в Інтернеті працюють мільярди користувачів. З них сотні мільйони – в режимі онлайн (англ. "on-line" – інтерактивний доступ у будь-який момент часу) та кількість таких користувачів постійно зростає. Це ускладнює організацію оперативного пошуку та знаходження потрібної такій кількості користувачів інформації. Виникають проблеми, зумовлені різноманітними можливостями (видами) пошуку інформації, різними способами їх реалізації в інформаційно-пошукових системах (ІПС), різним рівнем знань користувачів про можливості таких систем, особливо у сфері формування запитів та обробки даних, отриманих у результаті виконання цих запитів та і т.д.

Передбачається, що надалі будуть створені ІПС, здатні автоматично адаптуватися з урахуванням рівня знань та запитів конкретних користувачів, сприймати запити природною мовою та, використовуючи штучний інтелект, видавати їм релевантну та пертинентну інформацію. Для створення таких ІПС знадобиться інтелект і знання конкретних користувачів ІПС або їх посередників. Поки що від широкого кола користувачів пошукових систем потрібно досить добре володіти даною предметною областю.

Існують різні тлумачення терміна "пошук інформації" чи "інформаційний пошук".

Термін "інформаційний пошук(англ. "information retrieval") ввів американський математик К. Муерс. Він зауважив, що спонукальною причиною такого пошуку є інформаційна потреба , Виражена у формі інформаційного запиту. До об'єктів інформаційного пошуку К. Муерс відніс документи, відомості про їх наявність та (або) місцезнаходження, фактографічну інформацію.

Вирішувати проблеми фактографічного пошуку першими стали представники бібліотек. Вони розробили засоби інформаційного пошуку, що дістали назву " довідково-пошуковий апарат (каталоги, бібліографічні покажчики та ін.) У професійній вітчизняній пресі даний термін використовується з 1970-х років. Бібліотекарі визначають інформаційний пошук як знаходження в інформаційномумасиві документів , відповіднихінформаційний запит користувачів .

З точки зору використання комп'ютерної технікиінформаційний пошук - сукупність логічних і технічних операцій, що мають кінцевою метою знаходження документів, відомостей про них, фактів, даних, релевантних запиту споживача.

" Релевантність- встановлюється приінформаційному пошуку відповідність змісту документаінформаційному запиту або пошукового образу документа.

Існують та інші визначення. У будь-якому разі, інформаційний пошук викликаний потребою задоволення інформаційних запитів користувачів, які очікують за допомогою пошукових систем оперативно отримати необхідні дані або відомості. Він є методом націленого пошуку та вилучення релевантних документів та (або) фактів з різних джерел інформації, наприклад, банків даних або пристроїв, що запам'ятовують. Як таких виступають живі та неживі об'єкти, що представляють різні джерела та носії інформації.

Системи, що забезпечують реалізацію такого пошуку інформації, називаютьсяпошуковими системами(ПС). У традиційних технологіях ПС представляють картотеки та каталоги, адресні та інші довідники, покажчики, енциклопедії, довідковий апарат до видань та інші матеріали.

У 1945 роки американський вчений та інженер В. Буш у статті "Можливий механізм нашого мислення" вперше широко порушив питання необхідності механізації інформаційного пошуку.

Починаючи з 1960-х років, з'являються автоматизовані пошукові системи, що працюють з інформацією. З цього періоду ведуться інтенсивні роботи у сфері формування та реалізації принципів та методів інформаційного пошуку.

" Пошукові системиздійснюють пошук серед документів бази або інших масивів машиночитаних даних, що містять задані слова.

Електронні ПС за допомогою звичайних або інтелектуальних терміналів (ПЕОМ) дають можливість користувачам здійснювати пошукові запити за допомогою формальних та описуючих зміст елементів та із застосуванням спеціальних логічних операторів; здійснюють пошук серед документів бази чи інших масивів машиночитаемых даних, які містять задані слова. Пошукові системи дозволяють здійснювати лише пошукові процедури та пов'язані з ними процеси.

Інформаційно-пошукові системи

ПС з великим набором функцій та можливостей зазвичай входять до складу СУБД і називаються інформаційно-пошуковими системами. Вони також створюються та використовуються для ефективного знаходження користувачами необхідних даних, у тому числі в Інтернеті.

Термінологічноінформаційно-пошукова система(англ. "information retrieval system", IRS) – представляє систему, призначену для пошуку та зберігання інформації; пакет програмного забезпечення, що реалізує процеси створення, актуалізації, зберігання та пошуку в інформаційних базах та банках даних.

Інформаційно-пошукова система трактується і як система, що забезпечує пошук та відбір необхідних даних на основі інформаційно-пошукової мови та відповідних правил пошуку, а база даних– як сукупність засобів і методів опису, зберігання та маніпулювання даними, що полегшують збирання, накопичення та обробку великих інформаційних масивів. Організація різних БД відрізняється видом об'єктів даних та відносин між ними.

Функціонування сучасних ІПС засноване на двох припущеннях:

    документи, необхідні користувачеві, об'єднані наявністю певної ознаки чи комбінації ознак;

    користувач здатний вказати цю ознаку.

Обидва ці припущення практично не виконуються, і можна говорити лише про ймовірність їх виконання. Тому, процес пошуку інформації зазвичай є послідовність кроків, які призводять за допомогою системи до деякого результату, і дозволяють оцінити його повноту. У цьому поведінка користувача, як організує початок управління процесом пошуку, мотивується як інформаційної потребою, а й різноманітністю стратегій, технологій і коштів, наданих системою.

Користувач зазвичай немає вичерпних знань про інформаційному змісті ресурсу, у якому проводить пошук. Оцінити адекватність висловлювання запиту, як і повноту одержуваного результату, може, відшукавши додаткові відомості, чи організувавши процес, щоб частина результатів пошуку могла використовуватися на підтвердження чи заперечення адекватності інший частини. У той же час, для користувачів професіоналів характерна стійкість тематичного профілю. Коли вони є "інформаційно-орієнтованими", то їм властиве бажання та здатність організувати інформаційний простір проблеми. Це означає, що користувач створює по суті новий, "самостійний" проблемно-орієнтований, індивідуально оновлюваний і поповнюваний ІР, що включає крім добірок документів також метаінформацію, наприклад, словники спеціальної термінології, класифікатори предметних областей, описи ресурсів і т.д.

Особливість роботи користувача в режимі "самообслуговування", в контексті завдання автоматизації сукупної діяльності, означає, що система повинна представляти середовище, що забезпечує підтримку функцій споживача з обробки знайденої інформації, а також традиційно пов'язані з функціями інформаційного посередника (інтерпретація запиту, його переклад на інформаційно- пошукова мова, вибір ІР, автоматизований пошук та ручний відбір матеріалів), але також і такі "забезпечуючі" функції, як: структурування інформаційної потреби, лексична адаптація запиту, оцінка, систематизація та обробка результатів пошуку, причому на рівні як окремого документа, так і інформаційних ресурсів загалом. Технічні можливості, які має користувач, дозволяють йому створювати інформаційний ресурс - формувати масиви, систематизувати і створювати зовнішні уявлення їх змісту для власного або зовнішнього використання.

ІПС поділяються на: традиційні (ручні, механічні, електромеханічні) та автоматизовані (електронні).

Автоматизовані ІПС (АІПС), використовують комп'ютерні програмно-технічні засоби та технології та призначаються для знаходження та видачі користувачам інформації за заданими критеріями. Визначальними для розуміння методів автоматизації пошуку є два наступні фактори:

    порівнюються самі об'єкти, а описи – звані " пошукові образи " ;

    сам процес є складним (складеним і одноактним) і зазвичай реалізується послідовністю операцій.

Дані в АІПС вводяться на основі форматів введення, що спеціально розробляються. Всі відомості про один об'єкт в ІПС подаються у вигляді систематизованих даних, що утворюють один рядок таблиці та називаються записом . При цьому, якщо ІПС представляє електронний каталог бібліотеки, будь-який бібліографічний опис (БО) документа в ньому – це один запис, що складається з полів, рівних кількості елементів БО. Сукупність записів утворює БД, яка зазвичай зберігається в одному файлі. Сукупність БД, об'єднаних однією СУБД, утворює банк даних.

Оскільки АІПСінструмент, який використовується людиною при пошуку (а неінтелектуальний автомат для пошуку інформації – готових розв'язань завдань основної діяльності), ефективність її використання залежить від того, наскільки добре людина знає природу операційних об'єктів та властивості інструмента, за допомогою якого він працює з цими об'єктами.

Інформаційний пошук має на увазі використання певних стратегій, методів, механізмів та засобів. Поведінка користувача, здійснює управління процесом пошуку, визначається як інформаційної потребою, а й інструментальним розмаїттям системи – технологіями і засобами, наданими системою.

Стратегія пошуку - загальний план (концепція, перевага, установка) поведінки системи або користувача для вираження та задоволення інформаційної потреби користувача, зумовлений як характером мети та видом пошуку, так і системними "стратегічними" рішеннями - архітектурою БД, методами та засобами пошуку у конкретній АІПС.

Вибір стратегії у випадку є оптимізаційним завданням. На практиці значною мірою він визначається мистецтвом досягнення компромісу між практичними потребами та можливостями наявних коштів.

Метод пошуку – сукупність моделей та алгоритмів реалізації окремих технологічних етапів: побудови пошукового образу запиту (ПОЗ), відбору документів (співставлення пошукових образів запитів та документів), розширення та реформування запиту, локалізації та оцінки видачі.

Пошуковий образ запиту– записаний на ІСЯ текст, який виражає змістове зміст інформаційного запиту і містить вказівки, необхідних найефективнішого здійснення інформаційного пошуку.

способи пошуку, тобто. виділення підмножини документів, що потенційно містять опис вирішення задачі відбору документів (ОД), є відображенням процесу знаходження рішення та залежать від характеру задачі та предметної області.

Розглядаючи пошук як ітеративний процес, методи скорочення простору перебору (підмножини, що переглядається) утворюють по суті методологічну основу стратегії пошуку і можуть бути розділені на наступні класи – методи пошуку в:

    одному просторі (зазвичай, тематичному);

    ієрархічно упорядкованому просторі;

    альтернативних просторах;

    динамічному (змінюваному у процесі пошуку) просторі.

Реалізований метод побудови ПЗЗа повинен забезпечувати ефективні способи побудови запиту для досягнення цілей різного типу.

Механізми пошуку – сукупність реалізованих у системі моделей та алгоритмів процесу формування видачі документів у відповідь на пошуковий запит.

Засоби пошуку , з одного боку, – взаємозалежний комплекс інформаційно-пошукових мов (ІПЯ) та мов визначення/управління даними, що забезпечує структурні та семантичні перетворення об'єктів обробки (документів, словників, сукупностей результатів пошуку), а з іншого, – об'єкти інтерфейсу користувача, що забезпечують управління послідовністю вибору операційних об'єктів конкретної АІПС

Пошукові технології – уніфіковані (оптимізовані в рамках конкретної АІПС) послідовності ефективного використання окремих засобів пошуку у процесі взаємодії користувача із системою для стійкого отримання кінцевого та проміжних результатів.

Навігація як реалізація процесу пошуку за запитом у обраній БД – цілеспрямована, яка визначається стратегією, послідовність використання методів, засобів та технологій конкретної АІПС для отримання та оцінки результату.

Засоби навігації дозволяють користувачеві здійснювати управління процесом пошуку. Вони надаються користувачеві у виглядіінтерфейсу , що дозволяє організувати більш менш ефективний процес взаємодії з БД. У цьому " дружність " інтерфейсу характеризується як ергономічністю і зрозумілістю, а й варіантністю вибору операційних об'єктів.

Процес пошуку інформації представляє послідовність кроків, що призводять за допомогою системи до деякого результату, і дозволяють оцінити його повноту. Так як користувач зазвичай не має вичерпних знань про інформаційний зміст ресурсу, в якому проводить пошук, то оцінити адекватність висловлювання запиту, так само як і повноту одержуваного результату, він може, ґрунтуючись лише на зовнішніх оцінках або на проміжних результатах та узагальненнях, зіставляючи їх, наприклад з попередніми.

Процес пошуку можна представити у вигляді таких основних компонентів:

    формулювання запиту природною мовою, вибір пошукових системи та сервісів, формалізація запиту на відповідному ІПЯ;

    проведення пошуку в одній або кількох пошукових системах;

    огляд одержаних результатів (посилань);

    попередня обробка отриманих результатів: перегляд змісту посилань, вилучення та збереження релевантних та пертинентних даних;

    при необхідності модифікація запиту та проведення повторного (уточнюючого) пошуку з подальшою обробкою отриманих результатів.

Для зменшення обсягу відібраних матеріалів здійснюють фільтрацію результатів пошуку за типом джерел (сайтів, порталів), тематики та інших підстав.

За використовуваними пошуковими технологіями ІС можна розбити на 4 категорії:

    Тематичні каталоги;

    Спеціалізовані каталоги (онлайнові довідники);

    Пошукові машини (повнотекстовий пошук);

    Кошти метапошуку.

В Інтернеті ІПС розміщується на одному або кількох серверах. В ІПС збирається, індексується і реєструється інформація про документи, наявні в групі веб-серверів, що обслуговується системою. У документах індексуються всі значущі слова або лише слова із заголовків.

Тематичні каталоги передбачають опрацювання документів та віднесення їх до однієї з кількох категорій, перелік яких заздалегідь заданий. Фактично, це індексування на основі класифікації. Індексування може проводитися автоматично або вручну за допомогою фахівців, які переглядають популярні веб-вузли та складають короткий опис документів-резюме (ключові слова, інструкція, реферат).

Спеціалізовані каталоги абодовідники створюються за окремими галузями та темами, за новинами, містами, за адресами електронної пошти тощо.

Пошукові машини (найрозвиненіший засіб пошуку в Інтернеті) реалізують технологію повнотекстового пошуку. Індексуються тексти, розміщені на опитуваних серверах. Індекс може містити інформацію про кілька мільйонів документів. Наприклад, в індексі популярної ІПС "AltaVista" понад 56 млн. URL-адрес.

При використанні коштівметапошуку запит здійснюється одночасно кількома пошуковими системами. Результат пошуку об'єднується у загальний, упорядкований за рівнем релевантності список. Кожна система обробляє лише частину вузлів мережі, що дозволяє розширити базу пошуку. До подібного класу можна віднести і "персональні програми пошуку", що дозволяють формувати свої власні інструменти метапошуку (наприклад, автоматично опитувати вузли, що часто відвідувані).

Бази інформаційних даних можуть містити практично будь-які види інформації, у тому числі будь-якої комбінації. Інформаційний пошук здійснюється як за існуючими у повнотекстових ЕІР термінах, так і за спеціальними елементами, що входять до складу ІСЯ. Для формування запитів використовують спеціальні інформаційно-пошукові мови.

ІПС усередині знайденої вибірки зазвичай намагаються розмістити документи в порядку їхньогорелевантності ", тобто близькості до введеного користувачем запиту. Критеріїв такої близькості багато і виявлення близьких "за змістом" до запиту документів не вирішує проблеми отримання інформації за відсутності релевантного документа. Подібна ситуація досить тривіальна, у тому числі й тому, що користувач найчастіше шукає документ Слід зазначити, що в результаті проведеного пошуку користувач може отримати як релевантні, пертинентні, так і нерелевантні та непертинентні підмасиви даних.

ІПС фактично єсистемами інформаційного забезпеченняі є бази та банки даних. В якостіоб'єктау яких виступає індивід, організація, галузь, регіон тощо.Суб'єктом інформаційного забезпеченняє фахівець-інформатик, будь-який споживач інформації.

Організація пошуку

Пропонується процедуру пошуку необхідної інформації поділити на дев'ять основних етапів:

    Визначення галузі знань;

    Вибір типу та джерел даних;

    Збір матеріалів, необхідних для наповнення інформаційної моделі;

    Відбір найкориснішої інформації;

    вибір методу обробки інформації (класифікація, кластеризація, регресійний аналіз тощо);

    вибір алгоритму пошуку закономірностей;

    Пошук закономірностей, формальних правил та структурних зв'язків у зібраній інформації;

    Творча інтерпретація одержаних результатів;

    Інтеграція одержаних "знань".

Для пошуку спочатку на комп'ютері користувача завантажується інтерфейс роботи з відповідної БД. Це може бути локальна чи віддалена БД. Спочатку слід визначитися з видом пошуку (простий, розширений тощо). Потім з набором пропонованих для пошуку полів. ІПС можуть запропонувати для введення одного або кількох полів. В останньому випадку це зазвичай поля: автора, назви (назви), тимчасового періоду, виду документа, ключових слів, рубрик та ін. При формуванні запиту практично всі системи дозволяють використовувати логічні елементи "І", "АБО", "НІ".

Технології пошуку інформації

Пошукові засоби та технології, що використовуються для реалізації інформаційних потреб, визначаються типом і станом вирішуваної користувачем завдання основної діяльності: співвідношенням його знання та незнання про досліджуваний об'єкт. Крім того, процес взаємодії користувача з системою визначається рівнем знання користувачем змісту ресурсу (повноти уявлення, достовірності джерела тощо) та функціональних можливостей системи як інструменту. У цілому нині ці чинники зазвичай зводяться до поняття " професіоналізму " – інформаційного (підготовлений/непідготовлений користувач) тапредметного (професіонал/непрофесіонал)професіоналізму ".

Процес пошуку інформації зазвичай має емпіричний характер. Він представляє послідовність кроків, що призводять за допомогою системи до деякого результату, що дозволяють оцінити його повноту. У цьому поведінка користувача, як організує початок управління процесом пошуку, мотивується як інформаційної потребою, а й різноманітністю стратегій, технологій і коштів, наданих системою.

Зазвичай користувач не має вичерпних знань про інформаційний зміст ресурсу, в якому проводить пошук, тому оцінити адекватність висловлювання запиту, як і повноту одержуваного результату, він може, відшукавши додаткові відомості, або організувавши процес так, щоб частина результатів пошуку могла використовуватися для підтвердження або заперечення адекватності іншої частини.

Операційними об'єктами, які безпосередньо беруть участь у взаємодії користувачів з пошуковою системою є пошуковий образ документа (ПОД) та ПОЗ, відповідність яких встановлюється пошуковим механізмом АІПС на формальному рівні. Адекватність образу дійсному змісту документа визначається якістю процесу згортки інформації та рівнем знання суб'єктом засобів відображення – концептуальної схеми предметної галузі та можливостей ІПЯ.

Пошуковий образ документа- Опис документа, виражений засобами ІПЯ і характеризує основний зміст або будь-які інші ознаки цього документа, необхідні для його пошуку за запитом.

Більшість ПС спочатку пропонують користувачам або БО, або посилання на повні або часткові документи, їх опис та інше, що зберігаються у різних АІПС. Сучасні ПС дозволяють визначитися і вказати, яке і в якому вигляді джерело інформації цікавить користувача.

Методи обробки результатів пошуку

За характером перетворень (у контексті подальшого використання результатів обробки) методи обробки результатів пошуку можна умовно поділити на дві групи:

    структурно-форматні перетворення;

    Структурно-семантичні перетворення (інформаційно-аналітичні, логіко-семантичні).

Реалізація пошуку

Що зазвичай шукають в Інтернеті: персональні дані про індивідууми та організації; різні адресні дані; конкретні матеріали (статті, книги, фотографії, довідкові дані, програмне забезпечення та ін) у тому числі місце їх зберігання; де і скільки коштують ті чи інші матеріали, послуги, продукти тощо; інформаційні сайти та портали та ін.

Загальноприйнято організацію пошуку за початковими фрагментами слова (пошук із усіченням справа), наприклад, замість слова "бібліотечний" можна ввести його фрагмент "бібліоті*". При цьому будуть знайдені документи, в яких міститься не тільки слово "бібліотечний", а й "бібліотека", "бібліотекар", "бібілотекознавство" та ін. У кожному випадку користувач повинен уявляти, що саме він хоче знайти, тому що у запропонованому йому варіанті буде знайдено набагато більше документів, ніж при заданні цього слова повністю (без усічення). У такому разі можна в отриманому масиві інформації провести уточнюючий пошук і в результаті отримати більш релевантні та пертинентні дані.

Оформлення результатів

З погляду ІПС результат пошуку у ній є сукупність (підмножина) знайдених документів чи посилань ними. Зазвичай він представляється користувачеві як списку. Тобто найпростішою вихідною формою в даному випадку буде список посилань у вигляді повних або часткових БО, знайдених ІР. Такий список може бути роздрукований або надісланий на будь-яку адресу електронної пошти, якщо така можливість надається ІПС і користувач підключений до Інтернету.

Графічні та повнотекстові ЕІР можуть пропонуватися користувачеві лише для перегляду, для копіювання в різних форматах та масштабах, причому повністю або частково. Графічні ІР зазвичай існують у загальноприйнятих форматах типу: JPG, GIFF, TIFF, BMP та ін., а для текстових матеріалів зазвичай використовують текстові формати TXT, DOC та ін., HTML та PDF – фактично графічний формат, у якому можуть зберігатися як текстові, і графічні дані.

Отримані під час пошуку документи зберігають.

Критерії оцінки пошуку

Критерієм результату пошуку є одержання користувачем списку документів, одного документа або їх частин, що максимально задовольняє його потреби, сформульовані в пошуковому запиті. В ІПС прийнято формувати список отриманих у результаті пошуку документів щодо їх релевантності. Розрізняють критерії смислової та формальної відповідності між пошуковим розпорядженням та документом, що видається.

комп'ютерний internet анімація пошуковий

Пошукові системи Internet

Пошукові системи Google, Yahoo, Яндекс, Mail ... служать виявлення необхідного ресурсу в мережі Інтернет за ключовими словами. Ці системи, або, як їх інакше називають, пошукові машини щодня перебирають мільйони WWW серверів, індексують і каталогізують знайдені ресурси. Можливість пошуку ресурсу в Інтернет дуже зручна, але не можна забувати про те, що Мережа живе своїм життям - щодня з'являються тисячі нових сторінок, деякі старі зникають… Тому пошукові системи не завжди видають найточнішу інформацію.

Засоби пошуку та структурування, іноді звані пошуковими механізмами, використовуються для того, щоб допомогти людям знайти інформацію, якої вони потребують. Засоби пошуку типу агентів, павуків, кроулерів та роботів використовуються для збору інформації про документи, що знаходяться в Інтернеті. Це спеціальні програми, які займаються пошуком сторінок в Мережі, отримують гіпертекстові посилання на цих сторінках і автоматично індексують інформацію, яку вони знаходять для побудови бази даних. Кожен пошуковий механізм має власний набір правил, що визначають, як збирати документи. Деякі йдуть за кожним посиланням на кожній знайденій сторінці і потім, у свою чергу, досліджують кожне посилання на кожній з нових сторінок і так далі. Деякі ігнорують посилання, що ведуть до графічних та звукових файлів, файлів мультиплікації; інші ігнорують посилання на ресурси типу баз даних WAIS; інші проінструктовані, що потрібно переглядати перш за все найбільш популярні сторінки.

Google- найбільша мережа пошукових систем, що належить корпорації Google Inc.

Перша за популярністю система, що обробляє 41 млрд 345 млн запитів на місяць, індексує понад 25 млрд веб-сторінок, може знаходити інформацію 195 мовами.

Інтерфейс Google містить досить складну мову запитів, що дозволяє обмежити область пошуку окремими доменами, мовами, типами файлів тощо.

Для результатів пошуку Google раніше надавав можливість повторного пошуку, що дозволяло здійснювати пошук детальніше. Для більш детального пошуку користувачам необхідно було вказувати додаткові параметри, якими відбувався відбір результатів, що дозволяло відразу відобразити як запит, а й контекст, де він застосовується. Ця можливість спрощувала процедуру пошуку, виключивши необхідність у відкритті кожного результату. 22 вересня 2010 року компанія запустила голосовий пошук у Росії. Щоб здійснити пошук, необхідно натиснути в телефоні кнопку поруч із рядком пошуку та вимовити свій запит, телефон відправить ваш голос на сервер, і браузер видасть рядок з розпізнаним вашим запитом та результатами пошуку за ним.

Через популярність пошукової системи в англійській мові з'явився неологізм to google або Google, що використовується для позначення пошуку інформації в Інтернеті за допомогою Google. Саме з таким визначенням дієслово занесено до найавторитетніших словників англійської мови - Оксфордський словник англійської мови та Merriam-Webster, хоча в інших джерелах, наводяться приклади його використання для позначення пошуку взагалі чогось в Інтернеті.

Яндекс- російська ІТ-компанія, що володіє однойменною системою пошуку в Мережі та інтернет-порталом. Пошукова система «Яндекс» є четвертою серед пошукових систем світу за кількістю опрацьованих пошукових запитів. Станом на 8 лютого 2013 року, згідно з рейтингом Alexa.com, за популярністю сайт yandex.ru посідає 20-те місце у світі та 1-е місце в Росії.

Пошукова система Yandex.ru була офіційно анонсована 23 вересня 1997 року, і спочатку розвивалася в рамках компанії CompTek International. Як окрема компанія «Яндекс» утворився у 2000 році. У травні 2011 року Яндекс провів первинне розміщення акцій, заробивши на цьому більше, ніж будь-яка з Інтернет-компаній з часів IPO пошуковика Google у 2004 році.

ü Управління індексуванням у пошуковій системі Яндекс

Дозволи та заборони на індексацію беруться із файлу robots.txt. Яндекс підтримує META тег robots, тег NOINDEX та нестандартне розширення robots.txt – директиву Host. Дозволи та заборони на індексацію беруться всіма пошуковими системами з файлу robots.txt, що знаходиться у кореневому каталозі сервера. Заборона індексації низки сторінок може виникнути, наприклад, з бажання не індексувати однакові документи в різних кодуваннях. Що менше сервер, то швидше робот його омине. Тому бажано заборонити у файлі robots.txt усі документи, які не має сенсу індексувати.

ь Додавання сторінок до пошукової системи Яндекс

Яндекс щодня переглядає сотні тисяч Web-сторінок у пошуках змін чи нових посилань. Власники ресурсів можуть самостійно додати свій сайт, заповнивши форму AddURL

Пошукова система Яндекс - повнотекстова, тобто до її індексу потрапляють (і стають доступними для пошуку) тільки ті слова, які написані на сторінках сайтів.

ь Індексація в пошуковій системі Яндекс

Коли Яндекс виявляє нову або змінену сторінку, він індексує її. У цьому сторінка розбивається на елементи, зміст яких заноситься в індекс. Коли Яндекс виявляє нову або змінену сторінку, він індексує її. У цьому сторінка розбивається на елементи (текст, заголовки, підписи до картинок, посилання тощо), зміст яких заноситься в індекс. При цьому враховуються позиції слів, тобто їхнє положення в документі або його елементі. Сам документ у базі не зберігається.

Yahoo!- американська компанія, яка володіє другою за популярністю у світі пошуковою системою та надає ряд сервісів, об'єднаних інтернет-порталом Yahoo! Directory; портал включає популярний сервіс електронної пошти Yahoo.

Згідно зі статистикою Alexa Internet, у лютому-квітні 2012 р. Yahoo! - четвертий за відвідуваністю веб-сайт в мережі Інтернет, і приблизно 28% відвідувань складаються з перегляду тільки однієї сторінки.

Mail- Великий комунікаційний портал російського Інтернету, щомісячна аудиторія якого, за даними на жовтень 2012 року, перевищує 31,9 млн осіб.

Число працівників складає 2800 осіб.

Ресурс належить інвестиційній групі Mail. Ru Group.

Ключовий сервіс порталу – поштова служба Пошта@Mail. Ru, був створений у 1998 році у заснованій російськими емігрантами американської софтверної компанії DataArt. Програмісти петербурзького офісу DataArt створили нове програмне забезпечення для поштового веб-сервера, яке передбачалося продавати західним компаніям. Щоб протестувати сервіс, його тимчасово виклали у відкритий доступ у листопаді 1998 року для російських користувачів, і сервіс раптом став швидко набирати популярності.

За словами віце-президента та технічного директора Mail. Ru Володимира Габрієляна, портал має вісім центрів обробки даних, кількість серверів становить 9000 одиниць. У технічному департаменті Mail. Ru працює понад сімсот фахівців.

Організація пошуку

Пошукова форма це дуже корисна і затребувана штука, особливо якщо йдеться про серйозні великі (у плані кількості сторінок і представлений матеріал) і сайти, що добре відвідувані. Знайти потрібну інформацію на подібному сайті використовуючи лише меню навігації та внутрішні посилання часом може представляти важке завдання. Набагато простіше вбити пару потрібних слів у відповідне поле, натиснути кнопочку «знайти» і отримати в результаті посилання на сторінки, де можливо і буде інформація, що цікавить користувача.

Пошук зазвичай можна реалізувати двома способами:

1. пошук, реалізований засобами движка сайту (php або якась інша мова веб-програмування) - але це тільки для серйозних веб-програмістів, для простих смертних кращий спосіб номер 2;

2. пошукова форма звертається до пошукової системи. Цей спосіб доступний кожній людині, яка освоїла ази html, і підходить для будь-якого сайту, що навіть складається з набору статичних html-сторінок. Однак такий пошук вестиметься лише по тих сторінках, які є в базі пошукача. Щоб усі сторінки сайту нормально індексувалися, необхідно дотримання двох правил: 1) на кожну сторінку сайту має вести пряме посилання без редиректу; 2) сайт не повинен порушувати пошукову ліцензію використовуваного пошукача.

Релевантність

Релеватність в інформаційному пошуку – семантична відповідність пошукового запиту та пошукового образу документа. У загальному сенсі, одне з найближчих поняття якості «релевантності» - «адекватність», тобто як оцінка ступеня відповідності, а й ступеня практичної застосовності результату, і навіть ступеня соціальної застосовності варіанта розв'язання завдання.

Види релевантності

Відповідність документа інформаційному запиту, що визначається неформальним шляхом

2. Формальна релевантність

Відповідність, що визначається шляхом порівняння образу пошукового запиту з пошуковим чином документа за певним алгоритмом.

Лекція ОРГАНІЗАЦІЯ ТА ТЕХНОЛОГІЯ ПОШУКУ ІНФОРМАЦІЇ В ІНТЕРНЕТІ 1. 2. Кошти інформаційного пошуку Технологія пошуку інформації

Характеристика мережі Інтернет надає швидший спосіб пошуку інформації у порівнянні з традиційними. Маючи значний обсяг інформації, мережа є слабоструктурованою. У зв'язку з цим активно ведуться розробки засобів інформаційного пошуку, що автоматизують процес пошуку інформації в даному середовищі. Слайд №3

Засоби інформаційного пошуку Служби пошуку інтернету (засоби для пошуку інформації) Пошукові системи Каталоги (search engines) (directories) Метапошукові системи (metasearch engines) Слайд № 5

Класифікація засобів пошуку по широті охоплення інформаційних ресурсів Слайд № 6 ІНТЕРНЕТ

Класифікація засобів пошуку за широтою охоплення інформаційних ресурсів Конкретний засіб пошуку може одночасно відповідати декільком із перерахованих видів. Вигляд засобу пошуку визначає широту охоплення інформаційних ресурсів інтернету засобом. Слайд №7

Інформаційно-пошукова система Слайд № 8 Інформаційно-пошукова система (ІПС) – це система, що забезпечує відбір, індексування та пошук інформації на основі індексу документів. Індексувати інформацію означає приписати кожному документу ключові слова, що відображають зміст документа і керуючі пошуком, приводячи до тих документів, слова яких виявляються більш подібними до слів зробленого запиту ІПС, вирішуючи завдання збору, зберігання, обробки та видачі інформації, виконують пошук документів, аналіз їх вмісту , Побудова пошукових образів документів (витяг з документів інформації, що використовується системою як знання про документ), зберігання пошукових образів, аналіз запитів користувачів, пошук релевантних (відповідних) запиту документів та видачу посилань на документи користувачам.

Типова схема ІПС Слайд № 9 Запит Клієнт Інформаційні ресурси Роботиндексувальник Інтерфейс користувача Відповідь Пошукова машина Відповідь Запит Індекс документів

Особливості ІПС Слайд № 10 У кожній конкретній пошуковій системі зберігаються відомості не про всі документи інтернету, а лише про ті документи, які відомі даній системі (для різних систем відсоток проіндексованих документів різний, але, як правило, не перевищує 70%). У пошукових системах зберігаються не самі документи, а лише відомості про них, достатні для їх знаходження користувачем і, як наслідок цього, система, що розглядається, в результаті пошуку може не видати деякі відповідні запиту документи. В результаті пошуку (відгуку на запит) системою сортуються документи за рівнем відповідності зробленому користувачем запиту з точки зору алгоритму пошукової системи, а не з точки зору фактичної їх відповідності запиту.

Використання ІПС Слайд № 11 Пошукові системи – це найбільше джерело знань про сторінки (документи) інтернету. Виконувати пошук різної інформації в інтернеті здебільшого слід саме за допомогою інформаційно-пошукових систем. За швидкістю та повнотою отримання інформації на запит користувача їм немає рівних. Багато пошукових систем використовують спільно систему пошуку та каталог.

Інформаційно-пошукові системи Популярними інформаційно-пошуковими системами глобального масштабу в Інтернеті є: n Google (http://www.google.com) n Bing (http://search. msn. com/) n Ask. com (http://www. ask. com) До російських ІПС відносяться: n Яndex (http://www. yandex. ru, http://www. ya. ru) n Rambler (http: //www. rambler .ru) n Webalta (http://www.aport.ru/) Слайд № 12

Каталог Слайд № 20 Каталог - це система, що забезпечує класифікацію інформації. Його відмінна риса – наявність ієрархії (схеми впорядкування) ресурсів, у якій кожен із ресурсів належить до одного чи більше розділів. Каталоги зберігають опис (анотації) ресурсів інтернету. Вони наповнюються web-майстрами (людьми, які створюють інформаційні ресурси) або спеціальними редакторами, які переглядають інформаційні ресурси мережі. У відповідь на запит користувача каталоги шукають ці описи. Каталоги автоматично не виявляють змін інформаційних ресурсів мережі.

Типова схема каталога Слайд № 21 Запит Інформаційні ресурси Технічний персонал Інтерфейс користувача Відповідь Гіпертекстові зв'язки Клієнт Пошукова машина Відповідь Запит Ієрархія інформаційних ресурсів та їх описи

Використання каталогу Слайд № 22 При вирішенні пошукової задачі, коли потрібно знайти групу інформаційних ресурсів на досить широку тему, каталог є найкращим засобом для пошуку, наприклад при пошуку сайтів, що надають контактну інформацію організацій м. Москви або сайтів електронних ЗМІ. Результати пошуку в каталогах можуть бути осмисленими, оскільки інформаційні ресурси в них підготовлені людьми.

Каталоги Слайд № 23 Електронними каталогами глобального масштабу в Інтернеті є: n Yahoo (http://www. yahoo. com) n Open Directory (http://www. dmoz. org) n Look. Smart (http://www.looksmart.com) До найбільш значущих російських електронних каталогів відносяться: n Каталог Яndex (http://yaca. yandex. ru) n Каталог Mail. ru (http://www. list. ru/) n Каталог Rambler's Top 100 (http://top 100. rambler. ru)

Метапошукова система Слайд № 28 Метапошукова система – це надбудова над пошуковими системами та електронними каталогами, яка не має власної бази даних (індексу) та при пошуку за пошуковим розпорядженням користувача автоматично формує запити для кількох зовнішніх засобів пошуку, а потім також автоматично аналізує отримані від них результати та видає список посилань у порядку, що визначається співвідношенням рейтингів відповіді відразу за декількома засобами пошуку. Відмінності у стратегії та широті охоплення інформаційних ресурсів різних пошукових систем часто призводять до того, що різні засоби пошуку дають різні відповіді на той самий запит. Метапошукові системи у своїй роботі використовують потенціал інших засобів інформаційного пошуку.

Типова схема метапошукової системи Слайд № 29 Запит Клієнт Інтерфейс користувача Відповідь Пошукова машина Запити Інформаційні ресурси Відповіді ІПС 1 Каталог 1 ІПС N Каталог N

Використання метапошукової системи Слайд № 30 Метапошукові системи найефективніші на початкових етапах пошуку інформації. Вони дозволяють швидко перевірити, чи є в інтернеті необхідна інформація та локалізувати засоби пошуку, в яких вона присутня. Метапошукові системи дозволяють скоротити час, що витрачається на пошук інформації, так як при обробці запиту користувача ці системи одночасно звертаються до різних засобів пошуку.

Види метапошукових систем Слайд № 31 Мережеві - доступні через мережу для пошуку інформації До глобальних метапошукових систем, доступних через інтернет, відносяться: n Meta. Crawler (http://www. metacrawler. com) n Web. Crawler (http://www. webcrawler. com) n Search. com (http://www. search. com) Найбільш відомі російські метапошукові системи: n Meta. Bot. ru (http://metabot. ru) n Nigma (http://nigma. ru) Перевагою російських засобів пошуку є коректна обробка запиту національною мовою.

Спеціалізовані засоби пошуку Слайд №33 Системи, що здійснюють пошук файлів, наприклад, File. Search. ru (http://www. filesearch. ru) Системи, що забезпечують пошук у новинах електронних ЗМІ, наприклад, Яндекс Новини (http://news. yandex. ru), Google Новини (http://news. google. ru) Пошук товарів, наприклад, Яндекс Маркет (http://market.yandex.ru), Торг. ru (http://www. torg. ru) Пошук людей, наприклад, POISKI. ru (http://poiski. ru), Poisk 24 (http://www. poisk 24. de), Yahoo! People Search (http://people. yahoo. com)

Спеціалізовані засоби пошуку Пошук картинок, наприклад, Яндекс Картинки (http://images. yandex. ru), Google Картинки (http://images. google. ru) Пошук відео, наприклад, Яндекс Відео (http://video. yandex .ru), Google Відео (http://video.google.ru) Слайд № 34

Додаткові засоби та способи пошуку Слайд №36 В інтернеті можна шукати інформацію не тільки пошуковими системами, але й іншими способами. У мережі багато різних сайтів, служб та користувачів, які можуть допомогти у пошуку. До таких служб можна віднести системи питання-відповідь, форуми, різні інтернет-спільноти (соціальні мережі), електронну пошту, чати. Усі вказані способи отримання інформації поєднує те, що на ваші запитання відповідають інші люди (а не програми). Системи питання-відповідь: Відповіді Mail. ru (http://otveti. mail. ru), Питання та відповіді Google (http://otvety. google. ru), Знаток. ru (http://znatok. ru)

Додаткові засоби та способи пошуку Слайд № 37 Дані способи є додатковими, оскільки: вони не є універсальними (накопичують адреси в недостатньому обсязі або за вузькими напрямками); n немає точної гарантії отримання відповіді питання (питання може бути просто проігноровано), отримання відповіді у таких системах іноді можна витратити багато часу. Головною перевагою при використанні додаткових способів пошуку є висока точність інформації, що отримується.

Поради щодо пошуку інформації Слайд № 40 Переконайтеся в правильності написання слова (фрази) запиту. Ваш запит може бути скоригований, якщо слово, у якому помилилися, – загальновживане. Рідкі слова або фрази можуть бути не знайдені. При пошуку інформації, використовуючи пошукові системи, слід знати, що системи зазвичай відповідають на будь-який запит користувача (через великий обсяг Інтернету) (наприклад, на запит asgr вкт 5, що є, на перший погляд, безглуздим набором символів, пошукова система Яндекс знайшла 12 web -Сторінок, в яких це словосполучення зустрічається). Будьте уважні.

Поради щодо пошуку інформації Слайд № 41 Уточніть запит. Чим точніше фраза запиту, тим більше шансів швидко знайти потрібну вам інформацію, наприклад результати пошуку за запитами вірша Єсеніна та вірші Єсеніна ранніх років будуть різними. Використовуйте синоніми. Якщо за вашим запитом не була знайдена потрібна інформація, спробуйте уточнити запит заміною слова на його синонім, наприклад, оперативна пам'ять або оперативний пристрій або ОЗУ. Різні слова та фрази видають різні результати. Використовуйте слова, які можуть бути використані на веб-сайтах, які ви шукаєте.

Рекомендації до пошуку інформації Слайд № 42 При складанні запиту завжди необхідно уявити, яким може бути передбачуваний зміст документа. Наприклад, якщо потрібно знайти відомості про А. С. Пушкіна, то недостатньо просто вказати його прізвище у запиті (у списку результату буде багато різноманітних установ, розташованих на вулицях Пушкіна у різних містах). Більший ефект дасть пошук, якщо до прізвища додати назви творів поета. Для пошуку текстів творів варто ввести окремі рядки з них (бажано рідко використовуються в цитатах).

Поради щодо пошуку інформації Слайд № 43 Не вводьте запит до пошукової системи у звичайній розмовній формі. Так, на запит Яка погода зараз у Нижньому Новгороді? будуть знайдені документи, що включають усі слова запиту, а саме тексти, що містять це питання (наприклад, тексти літературних творів). Більш ефективним в даному випадку буде ввести запит погода в Нижньому Новгороді, в першій десятці посилань на відповідь на який буде необхідна інформація. Спробуйте слова запиту записати лише малими літерами – на запит можуть бути знайдені додаткові документи.

Поради щодо пошуку інформації Слайд № 44 Виконайте пошук схожих документів. Якщо один із знайдених документів ближче до шуканої теми, ніж інші, натисніть посилання «Знайти схожі документи» . Пошукова система проаналізує сторінку та знайде документи, схожі на те, що ви вказали. Але якщо ця сторінка була стерта з сервера, а пошукова система ще не встигла видалити її з індексу, ви отримаєте повідомлення «Запитаний документ не знайдено» .

Поради щодо пошуку інформації Слайд № 45 Використовуйте знаки «+» та «-» . Щоб виключити документи, де є певне слово, поставте перед ним знак мінуса. І навпаки, щоб певне слово обов'язково було у документі, поставте перед ним плюс. Зверніть увагу, що між словом та знаком плюс-мінус не має бути пробілу. Також можна використовувати інші спеціальні команди для уточнення запиту. Список їх можна знайти у довідці до системи, як правило, на сторінці "Мова запитів" .

Рекомендації до пошуку інформації Слайд № 46 Шукайте точні фрази. Якщо вам відома точна фраза, яка повинна бути присутня на сторінці результатів, то вкажіть її в запиті, взявши в лапки. Наприклад, "Широкий простір для мрії та життя Прийдешні нам відкривають роки" Використовуйте регіональні пошукові системи. Для отримання більш повної інформації мовою відмінною від англійської можна скористатися регіональними системами, що працюють з даною мовою. У багатьох країнах регіональні системи мають широке охоплення ресурсів. Найбільша пошукова система в Росії - Яндекс (http://www.yandex.ru).

Поради щодо пошуку інформації Слайд № 47 Використовуйте спеціалізовані пошукові системи. Якщо ви шукаєте картинки, відео, товари, карти та деякі інші відомості, то всю цю інформацію знайти швидше з використанням спеціалізованих пошукових систем, призначених для цих цілей. Багато пошукових систем загального призначення мають спеціальні інтерфейси для пошуку цих видів інформації (дивіться описи конкретних систем). Запит на пошук в цьому випадку може бути таким: пошук картинок.

Рекомендації до пошуку інформації Слайд № 48 Якщо джерелом інформації є організація, спробуйте пошукати інформацію на сайті цієї організації. Пошукові системи можуть не знати про всю інформацію, що зберігається на сайтах інтернету. Перейдіть на сайт організації, від якої виходила ця інформація, можливо там будуть докладні відомості про неї. На сайтах бувають локальні системи пошуку (виконують пошук саме на цьому сайті) або можна спробувати знайти потрібну інформацію шляхом навігації по розділах сайту. Якщо, наприклад, ви чули передачу по радіо і знаєте назву цієї радіостанції. Перегляньте інформацію про цю передачу на офіційному сайті цієї радіостанції.

Поради щодо пошуку інформації Слайд № 49 Попросіть допомоги в пошуку інформації у інших людей. В інтернеті існують спеціальні системи (наприклад, системи питання-відповідь), в яких одні користувачі можуть допомогти іншим у пошуку інформації. Можливо люди вже цікавилися тим самим питанням, що й ви знають правильну відповідь.

Способи пошуку в Інтернеті

Три способи пошуку в Інтернеті

Інтернет загалом і Всесвітня павутина, зокрема, надають абоненту доступ до тисяч серверів та мільйонів Web-сторінок, на яких зберігається неймовірний обсяг інформації. Як не загубитися у цьому "інформаційному океані"? Для цього необхідно навчитися шукати та знаходити потрібну інформацію в мережі.

Як уже було сказано, існують три основні способи пошуку інформації в Інтернеті.

1. Вказівка ​​адреси сторінки.Це найшвидший спосіб пошуку, але його можна використовувати лише в тому випадку, якщо точно відома адреса документа.

2. Пересування гіперпосиланнями.Це найзручніший спосіб, так як з його допомоги можна шукати документи, тільки близькі за змістом поточному документу. Якщо поточний документ присвячений, наприклад, музиці, то, використовуючи гіперпосилання цього документа, навряд чи можна буде потрапити на сайт, присвячений спорту.

3. Звернення до пошукового сервера (пошукової системи). Використання пошукових серверів – найбільш зручний спосіб пошуку інформації. В даний час в російськомовній частині Інтернету популярні такі пошукові сервери:

Yandex;
Rambler;
Апорт.

Існують інші пошукові системи. Наприклад, ефективна система пошуку реалізована на сервері поштової служби mail.ru.

Пошукові сервери

Найбільш доступним та зручним способом пошуку інформації у Всесвітній павутині є використання пошукових систем. При цьому пошук інформації можна здійснювати за каталогами, а також за набором ключових слів, що характеризують текстовий документ, що відшукується.

Розглянемо використання пошукових серверів докладніше. Пошуковий сервермістить велику кількість посилань на різні документи, і всі ці посилання систематизовані в тематичні каталоги. Наприклад: спорт, кіно, автомобілі, ігри, наука та ін. Причому ці посилання встановлюються сервером самостійно, в автоматичному режимі шляхом регулярного перегляду всіх веб-сторінок, що з'являються у Всесвітній павутині. Крім того, пошукові сервери надають користувачеві можливість пошуку інформації за ключовими словами. Після введення ключових слів пошуковий сервер починає переглядати документи на інших веб-серверах та виводити на екран посилання на ті документи, в яких зустрілися зазначені слова. Зазвичай результати пошуку сортуються за зменшенням спеціального рейтингу документів, який показує, наскільки повно заданий документ відповідає умовам пошуку або як часто він запитується в мережі.



Мова запитів пошукової системи

Група ключових слів, сформована за певними правилами – за допомогою мови запитів, називається запитом до пошукового сервера. Мови запитів до різних пошукових серверів дуже схожі. Докладніше про це можна дізнатися, відвідавши розділ "Допомога" потрібного пошукового сервера. Розглянемо правила формування запитів з прикладу пошукової системи Яndex.

Синтаксис оператора Що означає оператор Приклад запиту
пробіл або & Логічне І (у межах пропозиції) лікувальна фізкультура
&& Логічне І (у межах документа) рецепти && (плавлений сир)
| Логічне АБО фото | фотографія | знімок | фотозображення
+ Обов'язкова наявність слова у знайденому документі +бути або +не бути
() Групування слів (технологія | виготовлення) (сиру | сиру)
~ Бінарний оператор І НЕ (у межах пропозиції) банки ~ закон
~~ або _ Бінарний оператор І НЕ (у межах документа) путівник по Парижу ~~ (агентство | тур)
/(n m) Відстань у словах (мінус (-) – назад, плюс (+) – вперед) поставщики /2 кофе музыкальное /(-2 4) освіта вакансії ~ /+1 студентів
" " Пошук фрази "червона шапочка" Еквівалентно: червона /+1 шапочка
&&/(n m) Відстань у пропозиціях (мінус (-) – назад, плюс (+) – вперед) банк && /1 податки

Щоб отримати найкращі результати пошуку, необхідно запам'ятати кілька простих правил:

1. Не шукати інформацію лише за одним ключовим словом.

2. Краще не вводити ключові слова з великої літери, оскільки це може призвести до того, що не будуть знайдені ті самі слова, написані з малої літери.

3. Якщо в результаті пошуку ви не отримали жодних результатів, перевірте, чи немає ключових слів орфографічних помилок.

Сучасні пошукові системи надають можливість підключення до сформованого запиту семантичного аналізатора. З його допомогою можна, ввівши якесь слово, вибрати документи, в яких зустрічаються похідні від цього слова в різних відмінках, часах та ін.

Інформаційні технології пошуку інформації

Пошук інформації: основні поняття, види та форми організації

Пошук інформації або інформаційний пошук є одним з основних інформаційних процесів. Людство з давніх-давен займалося ним. Цілі, можливості та характер пошуку завжди залежали від наявності, інформації, її важливості та доступності, а також засобів організації пошуку.

Кінець XX - початок XXI століття, характеризується величезними масивами постійно зростаючої різноманітної інформації, доступною і цікавою для найширших верств соціуму. Більше того, Інтернет-технології та програмно-технічні засоби, також доступні для більшості людей, дозволяють здійснювати цей процес у будь-який час, практично в будь-якому місці за будь-якими запитами.

Пошук- процес, у ході якого у тій чи іншій послідовності виробляється співвіднесення що з кожним об'єктом, які у масиві. Мета будь-якого пошуку полягає в потребі, необхідності або бажанні знаходити різні види інформації, що сприяють отриманню особою, яка здійснює пошук, потрібних йому відомостей, знань і т.д. для підвищення власного професійного, культурного та будь-якого іншого рівня; створення нової інформації та формування нових знань; прийняття управлінських рішень тощо.

За оцінкою фахівців в Інтернеті працює 30 та більше мільйонів користувачів. З них десятки тисяч – в режимі онлайн (англ. "on-line" – інтерактивний доступ у будь-який момент часу) і кількість таких користувачів постійно зростає. Це ускладнює організацію оперативного пошуку та знаходження потрібної такій кількості користувачів інформації. Виникають проблеми, зумовлені різноманітними можливостями (видами) пошуку інформації, різними способами їх реалізації в інформаційно-пошукових системах (ІПС), різним рівнем знань користувачів про можливості таких систем, особливо у сфері формування запитів та обробки даних, отриманих у результаті виконання цих запитів та і т.д.

Передбачається, що надалі будуть створені ІПС, здатні автоматично адаптуватися з урахуванням рівня знань та запитів конкретних користувачів, сприймати запити природною мовою та, використовуючи штучний інтелект, видавати їм релевантну та пертинентну інформацію. Для створення таких ІПС знадобиться інтелект і знання конкретних користувачів ІПС або їх посередників. Поки що від широкого кола користувачів пошукових систем потрібно досить добре володіти даною предметною областю.

Існують різні тлумачення терміна "пошук інформації" чи "інформаційний пошук".

Термін " інформаційний пошук(англ. "information retrieval") ввів американський математик К. Муерс. Він зауважив, що спонукальною причиною такого пошуку є інформаційна потреба, Виражена у формі інформаційного запиту. До об'єктів інформаційного пошуку К. Муерс відніс документи, відомості про їх наявність та (або) місцезнаходження, фактографічну інформацію.

Вирішувати проблеми фактографічного пошуку першими стали представники бібліотек. Вони розробили засоби інформаційного пошуку, що дістали назву " довідково-пошуковий апарат(каталоги, бібліографічні покажчики та ін.) У професійній вітчизняній пресі даний термін використовується з 1970-х років. Бібліотекарі визначають інформаційний пошук як знаходження в інформаційному масиві документів, відповідних інформаційний запит користувачів.

З точки зору використання комп'ютерної техніки інформаційний пошук " - сукупність логічних і технічних операцій, що мають кінцевою метою знаходження документів, відомостей про них, фактів, даних, релевантних запиту споживача.

"Релевантність" - встановлюється при інформаційному пошукувідповідність змісту документа інформаційному запитуабо пошукового образу документа.

Існують та інші визначення. У будь-якому разі, інформаційний пошук викликаний потребою задоволення інформаційних запитів користувачів, які очікують за допомогою пошукових систем оперативно отримати необхідні дані або відомості. Він є методом націленого пошуку та вилучення релевантних документів та (або) фактів з різних джерел інформації, наприклад, банків даних або пристроїв, що запам'ятовують. Як таких виступають живі та неживі об'єкти, що представляють різні джерела та носії інформації.

Системи, що забезпечують реалізацію такого пошуку інформації, називаються пошуковими системами(ПС). У традиційних технологіях ПС представляють картотеки та каталоги, адресні та інші довідники, покажчики, енциклопедії, довідковий апарат до видань та інші матеріали.

У 1945 роки американський вчений та інженер В. Буш у статті "Можливий механізм нашого мислення" вперше широко порушив питання необхідності механізації інформаційного пошуку. Починаючи з 1960-х років, з'являються автоматизовані пошукові системи, що працюють з інформацією. З цього періоду ведуться інтенсивні роботи у сфері формування та реалізації принципів та методів інформаційного пошуку.

"Пошукові системиздійснюють пошук серед документів бази або інших масивів машиночитаних даних, що містять задані слова.

Електронні ПС за допомогою звичайних або інтелектуальних терміналів (ПЕОМ) дають можливість користувачам здійснювати пошукові запити за допомогою формальних та описуючих зміст елементів та із застосуванням спеціальних логічних операторів; здійснюють пошук серед документів бази чи інших масивів машиночитаемых даних, які містять задані слова. Пошукові системи дозволяють здійснювати лише пошукові процедури та пов'язані з ними процеси.

Завантаження...
Top