Сучасні способи пошуку інформації. Через війну формується перелік інформаційних ресурсів. Цей крок дозволяє створити персональну інформаційну систему, спрямовану вирішення конкретної завдання пошуку. Сутність цього методу полягає в застосуванні

1. Введення

З кожним роком обсяги Інтернету збільшуються в рази, тому можливість знайти необхідну інформацію різко зростає. Інтернет поєднує мільйони комп'ютерів, безліч різних мереж, кількість користувачів збільшується на 15-80% щорічно. І, тим не менш, все частіше при зверненні до Інтернету основною проблемою виявляється не відсутність шуканої інформації, а можливість її знайти. Як правило, звичайна людина через різні обставини не може або не хоче витрачати на пошук потрібної їй відповіді більше 15-20 хвилин. Тому особливо актуально правильно і грамотно навчитися, здавалося б, простої речі – де і як шукати, щоб отримувати БАЖАНІ відповіді.

Щоб знайти потрібну інформацію, потрібно знайти її адресу. Для цього існують спеціалізовані пошукові сервери (роботи індексів (пошукові системи), тематичні Інтернет-каталоги, системи мета-пошуку, служби пошуку людей тощо). У цьому майстер-класі розкриваються основні технології пошуку інформації в Інтернеті, надаються загальні риси пошукових інструментів, розглядаються структури пошукових запитів для найпопулярніших російськомовних та англомовних пошукових систем.

2. Технології пошуку

Web-технологія World Wide Web (WWW) вважається спеціальною технологією підготовки та розміщення документів у мережі Інтернет. До складу WWW входять і web-сторінки, і електронні бібліотеки, каталоги та навіть віртуальні музеї! За такої великої кількості інформації гостро постає питання: «Як зорієнтуватися в такому величезному та масштабному інформаційному просторі?»
У вирішенні цієї проблеми на допомогу приходять пошукові інструменти.

2.1 Пошукові інструменти

Пошукові інструменти – це особливе програмне забезпечення, основна мета якого – забезпечити найбільш оптимальний та якісний пошук інформації для користувачів Інтернету. Пошукові інструменти розміщуються на спеціальних веб-серверах, кожен з яких виконує певну функцію:

  1. Аналіз веб-сторінок та занесення результатів аналізу на той чи інший рівень бази даних пошукового сервера.
  2. Пошук інформації на запит користувача.
  3. Забезпечення зручного інтерфейсу для пошуку інформації та перегляду результату пошуку користувачем.

Прийоми роботи, які використовуються під час роботи з тими чи іншими пошуковими інструментами, практично однакові. Перед тим як перейти до їх обговорення, розглянемо такі поняття:

  1. Інтерфейс пошукового інструменту представлений у вигляді сторінки з гіперпосиланнями, рядком подання запиту (рядком пошуку) та інструментами активізації запиту.
  2. Індекс пошукової системи – це інформаційна база, що містить результат аналізу веб-сторінок, складена за певними правилами.
  3. Запит – це ключове слово або фраза, яку користувач вводить у рядок пошуку. Для формування різних запитів використовують спеціальні символи ("", ~), математичні символи (*, +, ?).

Схема пошуку інформації в Інтернеті проста. Користувач набирає ключову фразу та активізує пошук, тим самим отримує добірку документів за сформульованим (заданим) запитом. Цей список документів ранжується за певними критеріями так, щоб зверху списку опинилися ті документи, які найбільше відповідають запиту користувача. Кожен із пошукових інструментів використовує різні критерії ранжирування документів, як під час аналізу результатів пошуку, і під час формування індексу (наповнення індексної бази даних web-страниц).

Таким чином, якщо вказати у рядку пошуку для кожного пошукового інструменту однакової конструкції запит, можна отримати різні результати пошуку. Для користувача має велике значення, які документи виявляться у перших двох-трьох десятках документів за результатами пошуку та наскільки ці документи відповідають очікуванням користувача.

Більшість пошукових інструментів пропонують два способи пошуку. simple search(простий пошук) та advanced search(розширений пошук) з використанням спеціальної форми запиту та без неї. Розглянемо обидва види пошуку на прикладі англомовної пошукової машини.

Наприклад, AltaVista зручно використовувати для довільних запитів, "Something about online degrees in information technology", тоді як пошуковий інструмент Yahoo дозволяє отримувати світові новини, інформацію про курс валют або прогноз погоди.

Освоєння критеріїв уточнення запиту та прийомів розширеного пошуку, дозволяє збільшувати ефективність пошуку та досить швидко знайти необхідну інформацію. Насамперед, збільшити ефективність пошуку Ви можете за рахунок використання у запитах логічних операторів (операцій) Or, And, Near, Not, математичних та спеціальних символів. За допомогою операторів та/або символів користувач пов'язує ключові слова у потрібній послідовності, щоб отримати найбільш адекватний запит результат пошуку. Форми запитів наведено у таблиці 1.

Таблиця 1

Простий запит дає кілька посилань на документи, т.к. до списку потрапляють документи, що містять одне зі слів, введених під час запиту, або просте словосполучення (див. таблицю 1). Оператор and дозволяє вказати на те, що до змісту документа повинні бути включені всі ключові слова. Тим не менш, кількість документів може бути ще великою, і їх перегляд займе достатньо часу. Тому в ряді випадків набагато зручніше застосувати контекстний оператор near, що вказує на те, що слова повинні розташовуватися в документі в достатній близькості. Використання близько зменшує кількість знайдених документів. Наявність символу "*" у рядку запиту означає, що здійснюватиметься пошук слова за його маскою. Наприклад, отримаємо список документів, що містять слова, що починаються на gov, якщо в рядку запиту запишемо gov *. Це може бути слова government, governor тощо.

Не менш популярна пошукова система Rambler веде статистику відвідуваності посилань з власної бази даних, підтримуються ті ж логічні оператори. слів, що вводяться в запит.

Давайте розглянемо найпопулярніші технології пошуку інформації в Інтернеті.

2.2 Пошукові машини (search engines)

Машини веб-пошуку - це сервери з величезною базою даних URL-адрес, які автоматично звертаються до сторінок WWW на всі ці адреси, вивчають вміст цих сторінок, формують і прописують ключові слова зі сторінок у свою базу даних (індексує сторінки).

Більше того, роботи пошукових систем переходять за посиланнями, що зустрічаються на сторінках, і переіндексують їх. Так як майже будь-яка сторінка WWW має безліч посилань на інші сторінки, то при подібній роботі пошукова машина зрештою теоретично може обійти всі сайти в Інтернет.

Саме цей вид пошукових інструментів є найбільш відомим та популярним серед усіх користувачів мережі Інтернет. Кожен на слуху назви відомих машин веб-пошуку (пошукових систем) – Яndex, Rambler, Aport.

Щоб скористатися даним видом пошукового інструменту, необхідно зайти на нього і набрати в рядку пошуку ключове слово, що Вас цікавить. Далі Ви отримаєте видачу з посилань, що зберігаються в базі пошукової системи, які найбільш близькі до Вашого запиту. Щоб пошук був найбільш ефективним, заздалегідь зверніть увагу на такі моменти:

  • визначтеся з темою запиту. Що саме зрештою Ви хочете знайти?
  • звертайте увагу на мову, граматику, використання різних небуквенних символів, морфологію. Важливо також правильно сформулювати та вписати ключові слова. Кожна пошукова система має форму складання запиту - принцип один, але можуть відрізнятися використовувані символи чи оператори. Необхідні форми запиту різняться також залежно від складності програмного забезпечення пошукових систем та послуг, що надаються ними. Так чи інакше, кожна пошукова система має розділ "Help" ("Допомога"), де всі синтаксичні правила, а також рекомендації та поради щодо пошуку, доступно пояснюються (скриншот сторінок пошукових систем).
  • використовуйте можливості різних пошукових систем. Якщо ви не знайшли на Яndex, спробуйте на Google. Користуйтеся послугами розширеного пошуку.
  • Щоб виключити документи, які містять певні терміни, скористайтеся символом "-" перед кожним таким словом. Наприклад, якщо Вам потрібна інформація про роботи Шекспіра, за винятком "Гамлета", введіть запит у вигляді: "Шекспір-Гамлет". І для того, щоб, навпаки, результати пошуку обов'язково включалися певні посилання, використовуйте символ "+". Так, щоб знайти посилання про продаж саме автомобілів, Вам потрібен запит "продаж+автомобіль". Для збільшення ефективності та точності пошуку використовуйте комбінації цих символів.
  • кожне посилання у списку результатів пошуку містить кілька рядків зі знайденого документа, серед яких зустрічаються Ваші ключові слова. Перш ніж переходити за посиланням, оцініть відповідність сниппета темі запиту. Перейшовши на певний сайт, уважно окиньте поглядом головну сторінку. Як правило, першої сторінки достатньо, щоб зрозуміти – на адресу Ви прийшли чи ні. Якщо так, то подальші пошуки потрібної інформації ведіть на вибраному сайті (у розділах сайту), якщо ні – повертайтеся до результатів пошуку та спробуйте ще одне посилання.
  • пам'ятайте, що пошукові системи не виробляють самостійну інформацію (за винятком роз'яснень про себе). Пошукова система – це лише посередник між власником інформації (сайтом) та Вами. Бази даних постійно оновлюються, до них вносяться нові адреси, але відставання від реально існуючої у світі інформації все одно залишається. Просто тому, що пошукові системи не працюють зі швидкістю світла.

До найвідоміших машин веб-пошуку відносяться Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Серед російськомовних можна назвати Яndex, Rambler, Апорт.

Пошукові системи є наймасштабнішими та найціннішими, але далеко не єдиними джерелами інформації в Мережі, адже крім них існують інші способи пошуку в Інтернеті.

2.3 Каталоги (directories)

Каталог Інтернет-ресурсів – це ієрархічний каталог, що постійно оновлюється і поповнюється, що містить безліч категорій та окремих web-серверів з коротким описом їх вмісту. Однією з переваг тематичних каталогів є те, що пояснення до посилань дають творці каталогу і повністю відображають його зміст, тобто дає можливість точніше визначити, наскільки відповідає зміст сервера мети Вашого пошуку.

Прикладом тематичного російськомовного каталогу можна назвати ресурс http://www.ulitka.ru/.

На головній сторінці цього сайту розташований тематичний рубрикатор,

за допомогою якого користувач потрапляє в рубрику з посиланнями на продукцію, що його цікавить.

Крім того, деякі тематичні каталоги дають змогу шукати за ключовими словами. Користувач вводить необхідне ключове слово у рядок пошуку

та отримує список посилань з описами сайтів, які найбільш повно відповідають його запиту. Варто відзначити, що цей пошук відбувається не у вмісті WWW-серверів, а в їх короткому описі, що зберігаються в каталозі.

У нашому прикладі у каталозі також є можливість сортування сайтів за кількістю відвідувань, за алфавітом, за датою занесення.

Інші приклади російськомовних каталогів:
Каталог@Mail.ru
Weblist
Vsego.ru
Серед англомовних каталогів можна виділити:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 Добірки посилань

Добірки посилань – це відсортовані на теми посилання. Вони досить сильно відрізняються один від одного за наповненням, тому щоб знайти добірку, яка найбільш повно відповідає Вашим інтересам, необхідно ходити по них самостійно, щоб скласти власну думку.

Як приклад наведемо Підбірку посилань "Скарби Інтернет" АТ "Релком"

Користувач, натискаючи на будь-яку рубрик, що його зацікавив.

  • ЗМІСТ

    Автомобілістам

    • Астрономія та астрологія
    • Ваш будинок
    • Ваші вихованці
    • Діти квіти життя
    • Дозвілля
    • Міста в Мережі Internet
    • Здоров'я та медицина
    • Інформаційні агенції та служби
    • Краєзнавчий музей тощо,
    • Автомобільні електроніки.
    • Музей старовини автомото.
    • Колегія правового захисту автовласників.
    • Sportdrive.

    Перевагою такого виду пошукових інструментів є їх цілеспрямованість, зазвичай добірка включає рідкісні інтернет ресурси, підібрані конкретним веб-майстром або господарем інтернет сторінки.

    2.5 Бази даних адрес (addresses database)

    Бази даних адрес - це спеціальні пошукові сервери, які зазвичай використовують класифікації за родом діяльності, по продукції, що випускається, і послуг, що надаються, за географічною ознакою. Іноді вони доповнені пошуком за абеткою. У записах бази даних зберігається інформація про сайти, які надають інформацію про електронну адресу, організацію та поштову адресу за певну плату.

    Найбільшою англомовною базою даних адрес можна назвати: http://www.lookup.com/ -

    Потрапляючи в дані піддиректорії, користувач виявляє посилання на сайти, які і пропонують інформацію, що його цікавить.

    Широко доступних та офіційних баз даних адрес в РФ нам невідомо.

    2.6 Пошук у архівах Gopher (Gopher archives)

    Gopher - це взаємозалежна система серверів (Gopher-простір), розподілена по Інтернету.

    У просторі Gopher зібрана найбагатша літературна бібліотека, проте матеріали недоступні для перегляду у віддаленому режимі: користувач може лише переглядати ієрархічно організований зміст та вибирати файл за назвою. За допомогою спеціальної програми (Veronica) такий пошук можна зробити автоматично, використовуючи запити, побудовані на ключових словах.

    До 1995 року Gopher був найдинамічнішою технологією Інтернет: темпи зростання кількості відповідних серверів випереджали темпи зростання серверів інших типів Інтернет. У мережі EUnet/Relcom активного розвитку сервери Gopher не отримали і сьогодні про них практично ніхто не згадує.

    2.7 Система пошуку FTP файлів (FTP Search)

    Система пошуку FTP-файлів - це особливий тип засобів пошуку в Інтернеті, який дозволяє знаходити файли, доступні на "анонімних" FTP-серверах. Протокол FTP призначений передачі по мережі файлів, й у сенсі він функціонально є своєрідним аналогом Gopher.

    Основним критерієм пошуку є назва файлу, що задається різними способами (точна відповідність, підрядок, регулярне вираження тощо). Даний тип пошуку, звичайно ж, не може змагатися за можливостями з пошуковими машинами, так як вміст файлів ніяк не враховується при пошуку, а файли, як відомо, можна давати довільні імена. Тим не менш, якщо Вам потрібно знайти якусь відому програму або опис стандарту, то з великою ймовірністю файл, що містить його, буде мати відповідне ім'я, і ​​Ви зможете знайти його за допомогою одного з серверів FTP Search :

    FileSearch шукає файли на FTP-серверах на ім'я самих файлів і каталогів. Якщо Ви шукаєте якусь програму або ще щось, то на WWW-серверах Ви скоріше знайдете їх опис, а з FTP-серверів Ви зможете перекачати їх до себе.

    2.8 Система пошуку у конференціях Usenet News

    USENET NEWS – це система телеконференцій спільноти мереж Інтернету. На Заході цей сервіс прийнято називати новинами. Близьким аналогом телеконференцій є і так звані "ехи" у мережі FIDO.

    З точки зору абонента телеконференції, USENET являють собою дошку оголошень, в якій є розділи, де можна знайти статті на будь-яку тему - від політики до садівництва. Ця дошка оголошень доступна через комп'ютер, подібно до електронної пошти. Не відходячи від комп'ютера, можна читати або поміщати статті на ту чи іншу конференцію, знайти корисну пораду або вступати в дискусії. Звичайно, статті займають місце на комп'ютерах, тому не зберігаються вічно, а періодично знищуються, звільняючи місце для нових. У всьому світі найкращим сервісом для пошуку інформації у конференціях Usenet є сервер Google Groups (Google Inc.).

    Групи Google – це безкоштовна інтерактивна спільнота та служба груп обговорень, яка пропонує найбільший в Інтернеті архів повідомлень мережі Usenet (більше мільярда повідомлень). /googlegroups/tour/index.html

    Серед російськомовних виділяється сервер Всесвітня система USENET та телеконференції Relcom. Так само, як і в інших пошукових службах, користувач набирає рядок запиту, а сервер формує список конференцій, що містять ключові слова. Далі треба підписатися на відібрані конференції у програмі роботи з новинами. Також має місце аналогічний російський сервер FidoNet Online: конференція Fido на WWW.

    2.9 Системи мета-пошуку

    Для швидкого пошуку в базах декількох пошукових систем краще звернутися до систем мета-пошуку.

    Системи мета-пошуку - це пошукові машини, які посилають Ваш запит на величезну кількість різних пошукових систем, потім обробляють отримані результати, видаляють повторювані адреси ресурсів і представляють ширший спектр того, що представлено в Інтернеті.

    Найбільш популярна у світі система мета-пошуку Search.com.

    Об'єднаний пошуковий сервер Search.com компанії CNET, Inc. включає майже два десятки пошукових систем, посиланнями на які рясніє весь Інтернет.

    За допомогою цього виду пошукових інструментів користувач може шукати інформацію в багатьох пошукових системах, проте негативною стороною даних систем можна назвати їх нестабільність.

    2.10 Системи пошуку людей

    Системи пошуку людей – це спеціальні сервери, які дозволяють здійснювати пошук людей в Інтернет, користувач може вказати П.І.Б. людину і отримати його адресу електронної пошти та URL-адресу. Проте, слід зазначити, що системи пошуку людей, переважно, беруть інформацію про електронних адресах з відкритих джерел, як-от конференції Usenet. Серед найвідоміших систем пошуку людей можна виділити:

    Пошук адрес e-mail

    у спеціальні графи пошуку контактні дані (First Name. City, Last Name, Phone number), Ви можете знайти цікаву для Вас інформацію.

    Системи пошуку людей - це справді великі сервери, їх бази даних містять близько 6 000 000 адрес.

    3. Висновок

    Ми розглянули основні технології пошуку інформації в Інтернет і представили загалом пошукові інструменти, які існують на даний момент в Інтернеті, а також структуру пошукових запитів для найбільш популярних російськомовних та англомовних пошукових систем і, підбиваючи підсумок вищесказаному, хочемо відзначити, що єдиної оптимальної схеми пошуку інформації в Інтернеті не існує. Залежно від специфіки потрібної інформації, Ви можете використовувати відповідні пошукові інструменти та служби. А від того, наскільки грамотно будуть підібрані пошукові служби, залежить якість результатів пошуку.

  • Технології пошуку

    Закони тертя та тепломасообміну в турбулентному прикордонному шарі

    Існує кілька різновидів уявлення «закону тертя» (для еталонного випадку), що призводять практично до тотожних результатів. Відповідно до поняття «логарифмічного» прикордонного шару (при значенні першої константи турбулентності χ = 0,4) закон тертя для гранично розвиненої турбулентності з «зникаючою в'язкістю» добре апроксимується простою формулою Кишені:

    При степеневому поданні профілю швидкості повинна бути запропонована формула:

    де: ; n– статечний показник профілю швидкості;

    - Напівемпіричний коефіцієнт;

    А- Емпіричний коефіцієнт;

    δ - Товщина прикордонного шару.

    Використовуючи співвідношення для чисел Рейнольдса, побудованих на різних лінійних величинах:

    Важливо зазначити, що для випадку розвитку турбулентного прикордонного шару з передньої кромки ( х кр = 0) закон тертя має бути представлений також у вигляді:

    Значення параметричних величин представлених формул для різних профілів швидкостей зведені до таблиці

    Параметр n
    1/7 1/8 1/9 1/10
    А 8,74 9,71 10,6 11,5
    0,0975 0,089 0,0818 0,0757
    1,28 1,25 1,22 1,20
    m 0,250 0,222 0,200 0,182
    B 0,0252 0,0206 0,0190 0,0148
    m 1 0,200 0,182 0,167 0,154
    B 1 0,0576 0,0450 0,0362 0,0308

    Відомі і використовуються також інші форми подання закону тертя, що призводять практично до одних і тих самих результатів. Так, В.М. Євлевим запропоновано апроксимацію:

    Формули для законів тепло- і масообміну виходять з «законів тертя» для стандартних умов (еталонний випадок) за допомогою відомого принципу потрійної аналогії Рейнольдса.

    де: S– коригуючий множник – фактор аналогії Рейнольдса на не дотримання умов еталона (і), фактор Sу першому наближенні задовільно апроксимується співвідношенням:

    Важливо зазначити, що для випадку використання інтегральних параметрів «закони» тепло- та масообміну добре описуються залежностями:

    Web-технологія World Wide Web (WWW) вважається спеціальною технологією підготовки та розміщення документів у мережі Інтернет. До складу WWW входять і web-сторінки, і електронні бібліотеки, каталоги та навіть віртуальні музеї! При такій розмаїтості інформації гостро постає питання: «Як зорієнтуватися в такому величезному і масштабному інформаційному просторі» У вирішенні цієї проблеми на допомогу приходять пошукові інструменти.

    Пошукові інструменти - це особливе програмне забезпечення, основна мета якого - забезпечити найбільш оптимальний та якісний пошук інформації для користувачів Інтернету. Пошукові інструменти розміщуються на спеціальних веб-серверах, кожен з яких виконує певну функцію:

    1. Аналіз веб-сторінок та занесення результатів аналізу на той чи інший рівень бази даних пошукового сервера.

    2. Пошук інформації на запит користувача.

    3. Забезпечення зручного інтерфейсу для пошуку інформації та перегляду результату пошуку користувачем.

    Прийоми роботи, які використовуються під час роботи з тими чи іншими пошуковими інструментами, практично однакові. Перед тим як перейти до їх обговорення, розглянемо такі поняття:

    1. Інтерфейс пошукового інструменту представлений у вигляді сторінки з гіперпосиланнями, рядком подання запиту (рядком пошуку) та інструментами активізації запиту.

    2. Індекс пошукової системи - це інформаційна база, що містить результат аналізу веб-сторінок, складена за певними правилами.

    3. Запит - це ключове слово або фраза, яку вводить користувач у рядок пошуку. Для формування різних запитів використовують спеціальні символи ("", ~), математичні символи (*, +, -).

    Схема пошуку інформації проста. Користувач набирає ключову фразу та активізує пошук, тим самим отримує добірку документів за сформульованим (заданим) запитом. Цей перелік документів ранжується за певними критеріями те щоб вгорі списку опинилися ті документи, які найбільше відповідають запиту користувача. Кожен із пошукових інструментів використовує різні критерії ранжирування документів, як під час аналізу результатів пошуку, і під час формування індексу (наповнення індексної бази даних web-страниц).

    Якщо вказати в рядку пошуку для кожного пошукового інструменту однакової конструкції запит, можна отримати різні результати пошуку. Для користувача має велике значення, які документи виявляться у перших двох-трьох десятках документів за результатами пошуку та наскільки ці документи відповідають очікуванням користувача.

    Більшість пошукових інструментів пропонують два способи пошуку. simple search(простий пошук) та advanced search(розширений пошук) з використанням спеціальної форми запиту та без неї. Розглянемо обидва види пошуку на прикладі англомовної пошукової машини.

    Наприклад, AltaVista зручно використовувати для довільних запитів, «Something about online degrees in information technology», тоді як пошуковий інструмент Yahoo дозволяє отримувати світові новини, інформацію про курс валют або прогноз погоди.

    Освоєння критеріїв уточнення запиту та прийомів розширеного пошуку, дозволяє збільшувати ефективність пошуку та досить швидко знайти необхідну інформацію. Насамперед, збільшити ефективність пошуку Ви можете за рахунок використання в запитах логічних операторів (операцій) Or, And, Near, Not, математичних та спеціальних символів. За допомогою операторів та/або символів користувач пов'язує ключові слова у потрібній послідовності, щоб отримати найбільш адекватний запит результат пошуку. Простий запит дає необхідну кількість посилань на документи, т.к. до списку потрапляють документи, що містять одне зі слів, введених при запиті, або просте словосполучення (див. таблицю 1). Оператор and дозволяє вказати на те, що у змісті документа повинні бути включені всі ключові слова. Тим не менш, кількість документів має бути все ще великою, і їх перегляд займе достатньо часу. Тому в ряді випадків набагато зручніше застосувати контекстний оператор near, що вказує, що слова повинні розташовуватися в документі в достатній близькості. Використання близько зменшує кількість знайдених документів. Наявність символу "*" у рядку запиту означає, що здійснюватиметься пошук слова за його маскою. Наприклад, отримаємо список документів, що містять слова, що починаються на gov, якщо в рядку запиту запишемо gov *. Це бувають слова government, governor тощо.

    Найбільш розвинений сервіс пошуку російськомовної інформації надає пошуковий сервер Яndex. В Яndex можна просто написати російською фразу, що описує те, що Ви хочете знайти, і система проаналізує та опрацює Ваш запит, а потім постарається знайти все, що відноситься до заданої теми. Ви можете, використовуючи спеціальні оператори, скласти рядок, що пояснює пошуковій системі, яким Вашим вимогам повинна відповідати інформація, що Вас цікавить. Деякі з операторів мови запитів Яndex можна переглянути тут: http://help.yandex.ru/search/ -id=481939

    Не менш популярна пошукова система Rambler веде статистику відвідуваності посилань з власної бази даних, підтримуються ті ж логічні оператори. зменшення значимості слів, що вводяться в запит.

    Давайте розглянемо найпопулярніші технології пошуку інформації в Інтернеті.

    Тема 3 Робота з пошуковими системами Інтернет


    Вивчивши цю тему, ви дізнаєтесь і повторіть:

    Навіщо потрібні пошукові сервери;
    - Призначення основних частин пошукових серверів;
    - які види пошуку інформації існують в Інтернеті;
    - основні правила формування запиту у пошуковій системі Яндекс.

    Пошук за адресами URL

    Найшвидший і найнадійніший вид пошуку інформації в Інтернеті – пошук за адресами URL. Багато хто з них наводиться в друкованих виданнях, спеціальних довідниках, звучить в ефірі популярних радіостанцій та з екранів телевізора.

    ♦ Фанати футбольного клубу «Зеніт» знають напам'ять адресу www.fc-zenit.ru.
    ♦ Прихильникам гурту «Король і блазень» добре відомий офіційний сайт цього гурту www.korol.spb.ru.
    ♦ Любителі телеканалу НТВ легко знайдуть його сайт за адресою www.ntv.ru. Для швидкого доступу до вищеназваних ресурсів достатньо запустити браузер, наприклад Internet Explorer, і набрати знайому адресу URL у рядку адреси.

    Пошукові системи

    В Інтернеті зосереджено безліч документів. Щоб полегшити пошук потрібної інформації, створюються спеціальні пошукові машини.

    Пошукові машини- це автоматичні системи, що опитують сервери, підключені до глобальної мережі, і зберігають у базі інформацію про наявних на серверах даних. По спеціально сформульованому запиту пошукові машини надають інформацію у тому, де можна отримати необхідні дані.

    Як правило, пошукові машини складаються з трьох частин: робота, індексу та програми обробки запиту.

    Робот (Spider, Robot або Bot)- це програма, яка відвідує веб-сторінки та зчитує (повністю або частково) їх вміст. Роботи пошукових систем відрізняються індивідуальною схемою аналізу вмісту веб-сторінки.
    Індекс пошукової системи- це сховище пошукових образів, відвіданих роботами сторінок. Пошуковий образ документа (у тому числі й веб-сторінки) - це опис змісту документа спеціальною інформаційно-пошуковою мовою. Цей опис містить коди ключових слів документа, що відображають його зміст та зміст. Індекси в кожній пошуковій системі розрізняються за обсягом та способом організації збереженої інформації. Бази даних провідних пошукових машин зберігають відомості про десятки мільйонів документів, а обсяг їх індексу становлять сотні гігабайт. Індекси періодично оновлюються і доповнюються, тому результати роботи однієї пошукової машини з тим самим запитом можуть відрізнятися, якщо пошук проводився в різний час.

    Програма обробки запиту- це програма, яка відповідно до запиту користувача «переглядає» індекс щодо наявності потрібної інформації та повертає посилання на знайдені документи. Багато посилань на виході системи розподіляється програмою в порядку зменшення релевантності у тобто від максимально відповідності посилання запиту до найменшої.

    В даний час найпопулярнішими для російських користувачів Інтернету є три великі пошукові системи індексного типу:

    Ці системи враховують граматичні особливості російської, тому результати їхнього пошуку в російськомовних ресурсах відрізняються вищою якістю, ніж у західних систем.

    Пошукові машини відрізняються за охопленням інформаційних ресурсів:

    ♦ пошукові машини загальної тематики мають базу даних за всіма напрямками знань і відрізняються великим індексом і великим обсягом інформації, що накопичується;
    ♦ пошукові машини спеціального призначення переглядають лише сайти за певною тематикою, наприклад, музичні або музейні.

    Основними характеристиками пошукових машин є:

    ♦ обсяг документів в індексі;
    ♦ частота оновлення інформації;
    ♦ інформаційний простір, що охоплює робот пошукової машини, та різноманітність типів документів, про які збирається інформація;
    ♦ швидкість обробки запиту;
    ♦ критерій визначення релевантності (відповідності знайденого документа пошуковому запиту);
    ♦ можливість деталізації та уточнення запиту.

    Пошук за рубрикатором пошукової системи

    Пошукові каталоги є систематизованою колекцією (підбіркою) посилань на інші ресурси Інтернету. Посилання організовані як тематичного рубрикатора, що є ієрархічну структуру, переміщаючись якою, можна знайти необхідну інформацію.

    Наведемо як приклад структуру пошукового інтернет-каталогу Яндекс. Це каталог загального призначення, оскільки у ньому представлені посилання ресурси Інтернету практично з усіх можливих напрямах. У цьому каталозі виділені такі теми:

    ♦ Бізнес та економіка;
    ♦ Довідники та посилання;
    ♦ Суспільство та політика;
    ♦ Дім та сім'я;
    ♦ Наука та освіта;
    ♦ Розваги та відпочинок;
    ♦ Комп'ютери та зв'язок;
    ♦ Культура та мистецтво.

    Кожна тема включає безліч підрозділів, які, своєю чергою, містять рубрики тощо.

    Припустимо, ви готуєте захід до Дня перемоги та хочете знайти в Інтернеті слова відомої військової пісні Булата Окуджави «Ви чуєте, гуркочуть чоботи». Пошук можна організувати так: Яндекс Каталог Культура та мистецтво Музика Авторська пісня.

    Такий спосіб пошуку є досить швидким та ефективним. Насамкінець вам пропонується всього 5 посилань, серед яких є посилання на сайти з піснями відомих бардів. Залишається лише знайти на сайті архів із текстами пісень Б. Окуджави та вибрати в ньому потрібний текст.

    Інший приклад. Припустимо, ви маєте намір придбати мобільний телефон і хочете порівняти характеристики апаратів різних фірм. Пошук міг би вестись за наступними рубриками каталогу: Яндекс Каталог Комп'ютери та зв'язок Мобільний зв'язок Мобільні телефони.

    Отримавши обмежену кількість посилань, можна досить оперативно їх переглянути та вибрати телефон, дослідивши характеристики по фірмам та модифікаціям апаратів.

    Пошук за ключовими словами

    Більшість пошукових машин мають можливість пошуку за ключовими словами. Це один із найпоширеніших видів пошуку. Для пошуку за ключовими словами необхідно ввести у спеціальному вікні слово або кілька слів, які слід шукати, та клацнути на кнопці Пошук. Пошукова система знайде у своїй базі та покаже документи, що містять ці слова. Таких документів може бути безліч, але багато в даному випадку не обов'язково означає добре.

    Проведемо кілька експериментів із будь-якою з пошукових систем. Припустимо, що ми вирішили завести акваріум і нас цікавить будь-яка інформація на цю тему.

    На перший погляд найпростіше – це пошук за словом «акваріум». Перевіримо це, наприклад, у пошуковій системі Яндекс. Результатом пошуку буде понад 460 000 сторінок на 3500 сайтах - величезна кількість посилань. Причому, якщо подивитися уважніше, серед них опиняться сайти, що згадують групу Б. Гребенщикова «Акваріум», торгові центри та неформальні об'єднання з такою самою назвою, та багато іншого, що не має відношення до акваріумних рибок.

    Неважко здогадатися, що такий пошук не може задовольнити навіть невибагливого користувача. Занадто багато часу доведеться витратити на те, щоб відібрати серед усіх запропонованих документів ті, що стосуються потрібного нам предмета, і особливо на те, щоб ознайомитися з їх вмістом.

    Можна відразу зробити висновок, що вести пошук за одним словом, як правило, недоцільно, адже за одним словом дуже складно визначити тему, якій присвячено документ, веб-сторінку або сайт. Виняток становлять рідкісні слова та терміни, які практично ніколи не використовуються поза своєю тематичною сферою.

    Спробуємо уточнити умови пошуку та введемо словосполучення «акваріумні рибки». Результатом пошуку будуть трохи більше 20 ТОВ сторінок та близько 650 сайтів. Як бачимо, кількість посилань зменшилася більш ніж у 20 разів. Цей результат нас влаштовує більше, але все одно серед запропонованих посилань можуть зустрітися, наприклад, російські сувенірні набори сірникових етикеток із зображеннями рибок, колекції заставок для Робочого столу комп'ютера, каталоги акваріумних рибок з фотографіями, магазини акваріумних аксесуарів.

    Очевидно, що слід продовжити рух у напрямку уточнення умов пошуку.

    Щоб зробити пошук більш продуктивним, у всіх пошукових системах існує спеціальна мова формування запитів зі своїм синтаксисом. Ці мови багато в чому схожі. Вивчити їх все досить складно, але будь-яка пошукова машина має довідкову систему, яка дозволить вам освоїти потрібну мову.

    Наведемо десять простих правил формування запиту у пошуковій системі Яндекс.

    1. Ключові слова у запиті слід писати малими (маленькими) літерами. Це забезпечить пошук всіх ключових слів, а не тільки тих, що починаються з великої літери.

    2. Під час пошуку враховуються всі форми слова за правилами російської мови, незалежно від форми слова у запиті. Наприклад, якщо в запиті було вказано слово «знаю», то умови пошуку задовольнятимуть і слова «знаємо», «знаєте» тощо.

    3. Для пошуку стійкого словосполучення слід укласти слова в лапки, наприклад «порцеляновий посуд».

    4. Для пошуку точної словоформі перед словом треба поставити знак оклику. Наприклад, для пошуку слова «вересень» у родовому відмінку слід написати «!вересня».

    5. Для пошуку всередині однієї пропозиції слова в запиті поділяють пробілом або знаком &: «пригодницький роман» або «пригодницький роман». Декілька набраних у запиті слів, розділених пробілами, означають, що вони повинні входити до однієї пропозиції шуканого документа.

    6. Якщо ви бажаєте, щоб були відібрані лише ті документи, в яких зустрілося кожне слово, вказане в запиті, поставте перед кожним із них знак плюс +. Якщо ви, навпаки, хочете виключити будь-які слова з результату пошуку, поставте мінус «-» перед цим словом. Знаки «+» і «-» треба писати через пробіл від попереднього і разом з наступним словом. Наприклад, за запитом "Волга-автомобіль" будуть знайдені документи, в яких є слово "Волга" і немає слова "автомобіль".

    7. При пошуку синонімів або близьких за значенням слів між словами можна встановити вертикальну межу «|». Наприклад, за запитом «дитина | малюк немовля» буде знайдено документи з будь-яким із цих слів.

    8. Замість слова в запиті можна підставити цілий вираз. Для цього його треба взяти в дужки, наприклад «(дитина | малюк | діти | немовля) + (догляд | виховання)».

    9. Знак *~» (Тільда) дозволяє знайти документи з пропозицією, що містить перше слово, але не містить друге. Наприклад, за запитом "книги ~ магазин" будуть знайдені всі документи, що містять слово "книги", поруч із яким (у межах пропозиції) немає слова "магазин".

    10. Якщо оператор повторюється один раз (наприклад, & або ~), пошук здійснюється в межах пропозиції. Подвійний оператор (&&, -) визначає пошук у межах документа. Наприклад, на запит «рак - астрологія» будуть знайдені документи зі словом «рак», що не стосуються астрології.

    Маючи певний набір найбільш уживаних термінів у потрібній області, можна використовувати розширений пошук. На рис. 3.3 показано вікно розширеного пошуку у пошуковій системі Яндекс. У цьому режимі можливості мови запитів реалізовані як форми. Подібний сервіс, що включає словникові фільтри, пропонується майже всіма пошуковими системами.

    Рис. 3.3. Приклад розширеного пошуку у системі Яндекс

    За умови правильного вибору бажаних та обов'язкових слів та виключення небажаних термінів такий пошук може дати непогані результати.

    Повернемося, наприклад, з акваріумними рибками. Після прочитання кількох запропонованих пошуковою системою документів стає зрозуміло, що пошук інформації в Інтернеті слід починати не з вибору акваріумних рибок. Акваріум - складна біологічна система, створення та підтримання якої потребує спеціальних знань, часу та серйозних капіталовкладень.

    На підставі отриманої інформації людина, яка здійснює пошук в Інтернеті, може кардинально змінити стратегію подальшого пошуку, прийнявши рішення вивчити спеціальну літературу, що стосується досліджуваного питання.

    Для пошуку літератури або повнотекстових документів можливий наступний запит:

    «+(акваріум | акваріуміст | акваріумістика) +початківцям +(поради | література) +(стаття | теза | повнотекстовий) -(ціна | магазин | доставка | каталог)».

    Після обробки запиту пошуковою машиною отримано наступний результат: сторінок – 195, сайтів – не менше 43.

    Як видно зі статистики пошуку, результат виявився дуже успішним. Вже перші посилання наводять до шуканих документів:

    Розміщення акваріума > Поради акваріумісту, що починає, >
    Статті > Aq uascope. ru
    http://aquascope.ru/modules/wfsection/article.php?page=l&articleid=49 (32КБ) - сувора відповідність.
    ПОРАДИ ПОЧИНАЮЧИМ АКВАРІУМІСТАМ. Як вибрати та встановити акваріум, як...
    http://www.aquariums.ru/sovna.htm (2КБ) 23.07.2002 - нечитка відповідність.

    Тепер можна підсумувати результати пошуку, зробити певні висновки та прийняти рішення про можливі дії:

    ♦ Припинити подальший пошук, оскільки з різних причин утримання акваріума вам не під силу.
    ♦ Прочитати запропоновані статті та розпочати влаштування акваріума.
    ♦ Пошукати матеріали про хом'яки або хвилясті папужки.

    Професійний пошук

    Для науковців та фахівців доведеться більш продумано підійти до організації пошуку. При професійному пошуку інформації в Інтернеті повинні дотримуватися таких вимог:

    ♦ висока швидкість проведення пошуку;
    ♦ достовірність одержуваної інформації;
    ♦ повнота охоплення ресурсів під час пошуку.

    Швидкість. Швидкість проведення пошуку залежить в основному від двох факторів: від грамотного планування пошуку (вибору пошукових сервісів та інструментів) та навичок роботи з уже вибраним ресурсом (уміння швидко розібратися у його структурі та способах навігації). Для забезпечення швидкості пошуку пошукових індексів недостатньо. Крім них в Інтернеті існує ще ціла низка пошукових ресурсів, використання яких забезпечує виконання професійного пошуку.

    Достовірність. Питання достовірності інформації, одержуваної з Інтернету, є дуже актуальним, оскільки будь-яка людина може розмістити там будь-яку інформацію без будь-якого контролю її відповідності дійсності. Це, у свою чергу, призводить до великої кількості недостовірних джерел, якими є, наприклад, реферати та курсові роботи, що затопили Інтернет.

    Існують спеціальні пошукові послуги, що дозволяють оцінити надійність джерела інформації в Інтернеті.

    Повнота. Необхідною умовою успішного повномасштабного збору інформації є знання основних існуючих на сьогоднішній день типів ресурсів та використання різноманітних пошукових сервісів. Жодна пошукова система не може охопити всі ресурси Інтернету.

    Як правило, для досягнення позитивного результату користувач повинен вдатися до послуг кількох пошукових систем. Можна зробити це самостійно, переходячи із системи в систему, а можна доручити цю роботу одній з метапошукових систем (meta - перша складова складних слів, що позначає системи для опису та дослідження інших систем).

    Рис. 3.4. Вікна метапошукових систем

    Метапошукові системи не мають власних пошукових баз даних і при пошуку використовують ресурси багатьох інших пошукових систем. За рахунок цього можливість знаходження необхідної інформації виявляється дуже високою. Робота в метапошукових системах проводиться за тими самими правилами, що й робота в пошукових системах. Це викликано тим фактом, що метапошукові системи є своєрідною надбудовою до пошукових систем і використовують у роботі їх індексні бази. Зовнішній вигляд метапошукових систем нагадує зовнішній вигляд відомих пошукових машин. На рис. 3.4 представлені вікна метапошукових систем myweb.ru та metabot.ru.

    Досвід показує, що у більшості випадків найкращий результат досягається при використанні декількох незалежних пошукових індексів, ніж при використанні однієї метапошукової системи.

    Контрольні питання та завдання

    1. Яким є призначення програми-браузера?

    2. Які програми-браузери вам відомі?

    3. Де користувач, який планує пошук в Інтернеті, може знайти URL-адреси?

    4. Якою є технологія пошуку за рубрикатором пошукової системи?

    5. Яка технологія пошуку за ключовими словами?

    6. Яких вимог слід дотримуватися під час професійного пошуку інформації в Інтернеті?

    7. Коли в критерії пошуку слід задавати знаки «+» чи «-»?

    8. Які критерії пошуку в Яндексі задані наступною фразою:

    (няня | вихователь | гувернантка) ++ (догляд | виховання | нагляд).

    9. Що означає подвоєння знака (~~ або ++) для формування складного запиту?

    10. Що таке релевантність пошуку?

    11. Яке призначення метапошукових систем?

    Лекція 4. Інструменти інформаційного пошуку

    Постійне оновлення інформаційного масиву у поєднанні з приростом обсягу даних вкрай ускладнює облік наявних документів і, відповідно, пошук, який умовно можна поділити на:

    • фактографічний пошук:в енциклопедіях, довідниках, словниках,
    • бібліографічний пошук:бібліотеки, каталоги, програми.
    • документальний пошук:електронні документи, електронні бібліотеки, електронні журнали.

    Важливість проблеми інформаційного пошуку призвела до утворення цілої галузі, завдання якої полягає саме у наданні допомоги користувачеві з навігації у кіберпросторі. Складають цю галузь спеціальніпошукові службиабо сервіси. Їх традиційно поділяють на:

    • довідники чи каталоги
    • пошукові системи

    Ці різновиди візуально дуже схожі, оскільки«Кожен довідник має власну пошукову систему, а кожна пошукова система - власний довідник». Проте принципи їхньої роботи базуються на абсолютно різних підходах та технологіях. При цьому кожен різновид пошукових сервісів застосовується у вирішенні певного типу задач. Інформаційний пошук має на увазі використання певних стратегій, методів, механізмів та засобів. Поведінка користувача, здійснює управління процесом пошуку, визначається як інформаційної потребою, а й інструментальним розмаїттям системи - технологіями і засобами, наданими системою. Вибором інструменту багато в чому визначаєтьсястратегія пошукової діяльності та пошукові технології.

    Пошукові технології- уніфіковані (оптимізовані у межах конкретної інформаційно-пошукової системи) послідовності ефективного використання окремих засобів пошуку у процесі взаємодії користувача із системою.

    За використовуваними пошуковими технологіямиінформаційні системи можна розбити на 3 категорії:

    • тематичні каталоги та спеціалізовані каталоги (онлайнові довідники);
    • пошукові машини (повнотекстовий пошук);
    • засоби мета-пошуку.

    Тематичні каталогипередбачають опрацювання документів та віднесення їх до однієї з кількох категорій, перелік яких заздалегідь заданий. Фактично це знайоме всім бібліотекаряміндексування на основі класифікації. Спеціалізовані каталогиабо довідники створюються за окремими галузями та темами.Пошукові машини(найрозвиненіший засіб пошуку в Інтернеті) реалізують технологію повнотекстового пошуку. Індексуються тексти, розташовані на серверах, що запитуються.При використанні коштівметапошуку запит здійснюється одночасно кількома пошуковими системами. Результат пошуку поєднується у загальний, упорядкований за рівнем релевантності, список.

    Засоби пошуку - взаємозалежний комплекс інформаційно-пошукових мов та мов визначення/управління даними, що забезпечує структурні та семантичні перетворення об'єктів обробки (документів, словників, сукупностей результатів пошуку).

    1. Довідники

    Пошукові засоби першої групи є електронні довідники, що мають чітку ієрархічну систематичну або логіко-тематичну структуру,багато в чому нагадує структуру систематичного каталогу бібліотеки. Робота з довідниками дозволяє орієнтуватися в Інтернет-ресурсах у межах окремих галузей знання, заглиблюючись від загального до приватного, змінюючи ієрархічні гілки, повертаючись на кілька кроків тому тощо.

    Серед російських розробок у цій галузі значаться:

    • Апорт (адреса: www.aport.ru),
    • List.ru (адреса: list.mail.ru ),
    • Weblist (адреса: www.weblist.ru ),
    • Іван Сусанін (адреса: www.susanin.net
    • Равлик (адреса: www.ulitka.ru).

    Головною відмінністю довідників є те, що вони зроблені вручну. Редакційні колегії кожного з довідниківза характером праці нагадують відділи каталогізації та систематизації великих бібліотек, регулярно переглядають вміст серверів, що знову з'явилися, і відстежують зміни на вже існуючих. Виявлені дані аналізуються та заносяться до розділів довідника відповідно до прийнятої класифікації. Опис сервера в цілому (або розділу, якщо він представляється цілком самостійним блоком) забезпечується короткою інструкцією, що містить загальні відомості про характер наявної інформації. У деяких випадках заносяться додаткові відомості про мову документів, відвідуваність ресурсу, його фізичне місцезнаходження тощо.

    Основними параметрами, що характеризують переваги довідників, є:

    • Об `єм;
    • оперативність відображення нових або ресурсів, що змінилися;
    • логічність та послідовність ієрархічної схеми класифікації;
    • перехресність структури.

    Обсягом довідника визначається ступінь його надійності чи «інформаційна міцність». У деяких системах існує спеціальний механізм, який періодично перевіряє доступність сайту і виключає його з переліку при довгому «відсутності» в Мережі. Логічністю (науковістю) застосовуваної схеми класифікації визначається міра простоти, з якою користувачі знаходять необхідні відомості. Системаперехресних посиланьдозволяє виявити інформацію, використовуючи різні підходи (наприклад, територіальний чи галузевий). У цьому випадку схема класифікації повинна автоматично виводити користувача на об'єкт, який шукає, який би шлях пошуку не був обраний.

    Можливості складання запиту цього виду пошукових засобів особливої ​​ролі не грають. Складні розшуки, які потребують деталізації запиту, за допомогою каталогів не проводяться.

    Довідники призначені для вирішеннятрьох типів завдань:

    • орієнтація у незнайомій галузі знання;
    • розшук великих об'єктів, якими є, наприклад, сервери організацій або значних проектів;
    • отримання готового переліку ресурсів, що мають розмитий пошуковий образ (бібліотек певного типу, транспортних розкладів або сайтів політичних партій тощо)

    Іншим прикладом є порівняння довідника ресурсів із систематичним каталогом бібліотеки, в якому від книги (в даному випадку цілого сайту) залишається лише опис та анотація.

    2. Пошукові системи

    В основу роботи пошукових систем (пошукових машин) закладено інші технологічні принципи. Завдання пошукових машин - забезпечити детальне розшук інформації, що може бути досягнуто тільки за рахунок обліку (індексування ) змісту максимально можливої ​​кількості веб-сторінок. На відміну від довідників, пошукові машини функціонують в автоматизованому режимі та мають однаковий принцип дії.

    Пошукові системи складаються із двох базових компонентів. Перший компонент єпрограму-робот , Завдання якого пересуватися з сервера на сервер і знаходити там нові (або змінилися) документи, завантажуючи їх на головний комп'ютер системи. Робот переглядає вміст документа, знаходить нові посилання - як на інші документи сервера, так і зовнішні сайти. Далі програма самостійно прямує за вказаними посиланнями, знаходить нові документи, після чого процес повторюється знову,нагадуючи добре відомий у бібліографії «метод сніжної грудки». Виявлені документи обробляються (індексуються) другим компонентом пошукової системи. При цьому зазвичай враховується весь зміст сторінки, включаючи текст, ілюстрації, аудіо- та відеофайли. Індексації піддаються усі слова в документі, що дає можливість використовувати пошукові системи для детального пошуку за вузькою тематикою. Утворенііндексні файли , що зберігають інформацію про те, яке ключове слово, скільки разів, у якому документі і на якому сервері використовується, становлять ту базу даних, до якої звертається бібліотекар, що вводить у рядок запиту поєднання ключових слів.

    Виведення результатів здійснюється за допомогою спеціального модуля, який виробляєінтелектуальне ранжування результатів . При цьому до уваги береться:

    • розташування терміна в документі (назва, заголовок, основний текст), частота його повторення,
    • відсоткове співвідношення шуканого терміну до тексту сторінки,
    • кількість та авторитетність зовнішніх посилань на цю сторінку з інших сайтів.

    До основним параметрам пошукових системвідносяться:

    • число проіндексованих серверів та окремих документів (обсяг індексних файлів);
    • ступінь оперативності оновлення бази даних за рахунок включення відомостей про нові матеріали та видалення застарілих;
    • можливості для складання запиту;
    • інтелектуальність системи ранжування результатів пошуку;
    • наявність додаткових сервісних функцій, що полегшують роботу користувача.

    Можливості пошукового механізму висловлювати запит максимально точно значною мірою визначають якість отриманих результатів. Кожна машина має власну лексику, яка по-різному дозволяє деталізуватипошукове розпорядження.

    Всі пошукові машини маютьмодулем ранжування результатів пошуку. Це другий базовий компонент усіх систем. Перелік факторів, що беруться до уваги при визначенні місця документа в переліку посилань, є надзвичайно широким: від розташування слова на сторінці до рейтингу (авторитету) сторінок, які мають посилання на знайдений документ.

    • Google (адреса: www.google.com ),
    • AlltheWeb (адреса: www.alltheweb.com ),
    • Alta Vista (адреса: www.altavista.com).

    Подібні пошукові засоби існують і в Росії. Всі вони призначені для роботи з російськомовними документами і мають потужний http://www.metabot.ru).

    Висновки на тему лекційного блоку

    Пошукова система робить вибірку сторінок з бази даних відповідно до запиту, потім сторінки впорядковуються за рівнем зменшення збігів (прим. А.А.)

    У разі спостерігається пряма аналогія з принципами роботи розподілених зведених каталогів бібліотеки. Ключовою можливістюмета-пошуку є здатність розсилати запити користувача одночасно з різних пошукових систем - з наступним підсумовуванням результатів. (Прим. А.А.)

    Звертаючись до довідників, бібліотекар може розраховувати на отримання лише дуже загальних відомостей на тематику, і ніколи - детальних даних: від сервера великої корпорації, що містить тисячі сторінок, у довіднику буде представлено лише найменування та кілька рядків інструкції.

    Завантаження...
    Top