Програма розрахунку релевантності певної сторінки. Кількісні оцінки релевантності. Чи треба говорити, як це надихнуло мене)

Здрастуйте, шановні читачі блогу сайт. Сьогодні я хочу поговорити про такі банальні для багатьох вебмайстрів та оптимізаторів поняття, як ранжування та релевантність (це ті терміни, які будуть присутні у більшості публікацій на тему SEO). Хоча для вебмастерів-початківців вони не відразу стають зрозумілими і очевидними.

Звичайно ж, нічого складного в цих термінах немає і головну проблему вони становлять саме для пошукових систем. Їм кров із носа потрібно максимально точно вибудовувати ієрархію сайтів та знайти ідеальні способи визначення відповідності документа (веб сторінки) запиту користувача.

Релевантність та ранжування - що це таке

Ці асесори виносять оцінки певній кількості сайтів за певною кількістю запитів. Таким чином здійснюється навчання алгоритму, який докладно вивчає помічені асесорами хороші та погані ресурси, виділяє фактори, за якими можна їх ранжувати і вже потім, спираючись на них, сам намагається відокремити зерна від полови в масштабах усього рунету.

Під час ранжування в Яндексі враховується понад 400 факторів. Причому можуть враховуватися як окремо, і у ролі мономів (твір кількох чинників). Отже, якщо один з них у мономі буде нульовим, то він може звести нанівець і вплив інших, не нульових факторів. Т.ч. ми повинні розуміти, що не можливе однобоке просування — зараз працює лише комплексне розкручування сайту за всіма можливими напрямками.

Примітно, що в Яндексі використовуються окремі формули для різних регіонів Росії, окремі формули для країн СНД (Білорусія, Казахстан та Україна) та Туреччини. Т.ч. алгоритм працює в автоматичному режимі, однак іноді використовуються напівавтоматичні та ручні дії, спрямовані на коригування пошукової видачі у бік підвищення її релевантності.

Інформації на кшталт використовуваної формули в Google набагато менше. Не зовсім зрозуміло, що використовується - ручний або самонавчається автоматичний алгоритм на зразок MatrixNet. За чутками, Google все ж таки використовує ручну формулу ранжирування, аргументуючи це тим, що результати видачі автоматичної іноді можуть бути непередбачуваними (чим, власне, славиться Яндекс).

За уривчастими відомостями можна зробити висновок, що пошук Google також використовує велику кількість факторів ранжирування, проте трохи менше, ніж лідер російського прокату. Йдеться про пару сотень факторів. І як я вже писав у статті про , він має окремі формули релевантності для різних країн. Усередині країн розбиття по регіонах (як в Яндексі) відсутня. Принаймні це можна з точністю сказати стосовно рунету.

Основні фактори ранжування в Яндексі та Гугле

Внутрішні фактори

Їх можна поділити на три категорії:

  1. Текстове ранжування — наскільки текст документа відповідає запиту користувача
  2. — наскільки цей текст унікальний (чи авторський), наскільки він грамотний з погляду російської мови і наскільки він близький до природного:
    1. Унікальний контент — чи скопійований текст з інших сайтів (читайте тут про способи його запобігання) або ж написаний вами або професійним
    2. Вторинність контенту — нещодавно Яндекс надав у режимі альфа тестування вебмайстрам можливість застовпити за собою авторство на контент шляхом додавання тексту у відповідну . Т.ч. вас визнають автором тексту, а всі дублі статті, що розійшлися інтернетом, будуть грати вже не на шкоду, а на користь вашому сайту. Тобто. копіювання вашої статті буде говорити про додавання вам авторитетності і, грубо кажучи, може бути прирівняне до посилання, що на вас настав. Ось як.
    3. Природність контенту — з допомогою математичної лінгвістики пошуковик вважає кількість входжень елементів мови та зіставляє його із середнім значенням у всій іншій основі текстів, що у нього є (по корпусу проіндексованих документів). Математика - найбільша з наук (і моя кохана), за допомогою неї легко можна буде визначити неприродність тексту, при спробі штучно підвищити його релевантність зайвими ключовими словами
    4. Ненормативна і адалт - краще за це уникати, бо текст може потрапити під відповідний фільтр
  3. Властивості самого сайту — чи входять ключові слова в назву домену, вік ресурсу та домену, кількість сторінок:
    1. Вік сайту (з моменту потрапляння в пошуковий індекс, а не з моменту реєстрації домену) та вік документа, релевантність якого оцінюється пошуковою системою. Це дуже важливий в Яндексі (якщо сайту менше року, то він не зможе пробитися в Топ за більш-менш конкурентними запитами, а повну силу ресурс набирає десь через три роки), та й у Google є схожий тимчасовий фактор, який називається пісочниця коли молоді сайти не можуть добре ранжуватися.
    2. Формат документа, релевантність якого оцінюється пошуковою системою. Найкраще і в Яндексі, і Google ранжуються звичайні Html документи, а формати Pdf, Doc та інші, хоч і індексуються, але просувати краще саме сторінки з ХТМЛ кодом.
    3. Використання ключових слів - пошуковики це до певного моменту дуже любили, але з деяких пір за це можна потрапити під фільтр Гугла, якщо він вважає це за потрібне.
    4. Наявність спливаючих банерів може призвести до песимізації ресурсу (зниження в позиціях результату пошуку за рахунок віднімання значення релевантності)
    5. Погані доменні зони і погані IP адреси хостингу - пошукові системи часто гребуть всіх під один гребінець і якщо вам не пощастило зареєструвати домен в запамленій доменній зоні, або ж не пощастило купити дешевий або отримати на IP адресі, де висить ще маса ГС ресурсів, то все може бути дуже і дуже сумно у плані поганих позицій вашого сайту. Також, якщо на вас зареєстровано багато ДС, а ви на ті самі дані потім реєструєте СДЛ, то його ранжування може бути занижено через аналіз пошуковиком даних.

Зовнішні або посилальні фактори ранжування

Їх можна розділити на дві категорії:

  1. Статичні фактори, що не залежать від того, за яким саме запитом, пошуковик повинен визначити релевантність даного документа. До них можна віднести і т.п.
  2. Динамічні фактори або посилання ранжування — наскільки релевантні тексти посилань, що ведуть на даний документ (треба додавати в) тому запиту, який вводить користувач у пошуковому рядку.

Користувальницькі або поведінкові фактори

Враховується, як поводиться користувач на сторінці видачі і як він поводиться після того, як перейшов на сайт:

  1. Клікабельність (CTR) вашого ресурсу в результатах пошуку — один із найвпливовіших поведінкових факторів і водночас один із найнеоднозначніших, бо якщо вашого сайту немає в Топі, то й кліків ніяких по ньому не буде, а якщо у вас нема кліків, то як ви потрапите у топ. Все це призводить до поступової стабілізації ресурсів, що знаходяться в Топі - їх дуже складно буде вибити звідти саме за рахунок високої клікабельності (CTR).
  2. - фактор, який може спиратися на аналіз та облік джерел трафіку на ваш сайт (пошуковий трафік, переходи із закладок та ін.). Значимість його не така висока, як у клікабельності.
  3. Поведінка користувачів на сторінці — можуть враховуватись активні дії, проведений на ній час, внутрішні переходи та переходи на інші ресурси.
  4. Пошуковики можуть робити окремі вибірки серед усіх користувачів, що відвідують цю сторінку. Наприклад, може окремо аналізуватися поведінка відвідувачів, що прийшли саме за тим запитом, за яким пошуковик зараз ранжує ваш сайт. Може окремо враховуватись поведінка користувачів окремого регіону, де ви намагаєтеся просуватися.
  5. Для того, щоб покращити поведінкові фактори, потрібно:
    1. Щоб цільова сторінка повністю відповідала на пошуковий запит, яким ви її просуваєте
    2. Бажано, щоб цільова сторінка спонукала користувача до подальших дій, будь то замовлення товару в магазині або перехід до прочитання іншої статті на інформаційному ресурсі
    3. Ваш сайт повинен викликати у користувачів довіру та розташування, для чого необхідно використовувати унікальний та приємний дизайн, а також прагнути до того, щоб якомога більше відрізнятися у вигідну сторону від ГС та сателітів.
    4. Ресурс має бути зручним для користувача, бо юзабіліті здатне кардинально впливати на подальшу поведінку відвідувача на вашому проекті
    5. Потрібно думати про те, що вони безпосередньо впливають на один із найбільш значущих поведінкових факторів ранжирування — клікабельність у результатах пошуку
    6. Сторінки вашого ресурсу повинні однаково добре відображатися у всіх, інакше ви втратите якусь частину поведінкових плюсів від тих відвідувачів, які юзають той браузер, про який ви не подумали при верстці
    7. На вашому сайті не повинно бути проблем з
    8. Ваш ресурс повинен працювати стабільно та безперебійно, що в основному визначається якістю хостингу. описаними за посиланням способами.

Регіональні фактори

Враховуються при визначенні релевантності — останнім часом вони дуже помітні в Яндексі, коли у видачах по якомусь регіону Росії віддається перевага ресурсам, що відносяться саме до цього регіону. Що ж впливатиме на ранжування документа в даному конкретному регіоні:

  1. Тут важливим є вибір правильної доменної зони, що відповідає регіону, в якому ви хочете успішно просуватися (для Росії — зона «ru» тощо).
  2. Присвоїти сайту відповідний регіон в Яндекс Вебмайстрі та
  3. Вживати назви необхідного регіону в текстах документів та анкорах вхідних посилань для кращого подальшого стану ресурсу саме у видачі даного конкретного регіону
  4. Намагатися отримувати вхідні посилання з сайтів, що належать до того ж регіону, де ви хочете високо ранжуватися
  5. Додати на сторінки свого проекту адреси, поштові індекси та телефони того регіону, де ви бажаєте потрапити Топ

Запитні фактори

Швидше за все, для комерційних та інформаційних запитів використовуються різні формули розрахунку релевантності. Також різна формула може використовуватися і для різних типів запитів (навігаційні, транзакційні тощо) і навіть кількість слів у запиті може впливати на тип формули, що використовується.

  1. Якщо зараз і не використовуються на повну котушку, то незабаром обов'язково будуть використовуватися так звані соціальні сигнали (особливо у світлі досягнутих домовленостей між Яндексом та ). У рунеті соціальні мережі (що впливають якщо не зараз, то незабаром) – це «В контакті» та Facebook.
  2. Чи стане такий можна почитати, поки не ясно, але я б радив встановлювати на кожну сторінку сайту разом з .

Удачі вам! До швидких зустрічей на сторінках блогу сайт

Вам може бути цікаво

СЕО термінологія, скорочення та жаргон
Пошукова оптимізація текстів - оптимальна частота вживання ключових слів та його ідеальна довжина
Як ключові слова впливають на просування сайту у пошукових системах
Розшифровка та роз'яснення Seo скорочень, термінів та жаргонізмів
Які фактори пошукової оптимізації впливають на просування сайту та якою мірою
Анкор - що це таке і наскільки вони важливі у просуванні сайту
Як працюють пошукові системи - сніпети, алгоритм зворотного пошуку, індексація сторінок та особливості роботи Яндекса
Облік морфологія мови та інші проблеми розв'язувані пошуковими системами, а також відмінність ВЧ, СЧ та НЧ запитів
Контент для сайту - як наповнення унікальним та корисним контентом допомагає у сучасному просуванні сайтів

Привіт, читачі сайт! Скажіть при написанні чергового посту, чи ви намагаєтеся зробити так, щоб вміст відповідав тим запитам, за якими його знаходитимуть у пошуковій видачі?

Думаю, ні для кого вже не секрет, що пошукові системи змістили свої алгоритми у бік корисності контенту сайту.

У зв'язку з цим власники все частіше почали замислюватися про те, як його оптимізувати та зробити цікавим користувачеві.

Звичайно, це породжує безліч проблем в оцінці того, наскільки заповнення сайту відповідає запитам користувачів.

Тому сьогодні йтиметься про те, як визначити релевантність сторінок сайту, що змінити, та залучити додатковий трафік.

Що являє собою релевантність

Все досить просто, і водночас складно.

Простота у визначенні релевантності: це оцінка того, наскільки інформація відповідає очікуванням.

Тобто, якщо користувач ввів пошуковий запит "морозиво", переходить на сторінку сайту, і отримує інструкцію ремонту трактора, то релевантність такого сайту вкрай низька.

Чинники релевантності поділяються на два типи:

внутрішні фактори.Від них залежить відповідність контенту сайту до ключового запиту.

За це відповідають ключові слова в тексті сторінки.

Найбільше впливають текст заголовка (Title), опис сторінки (Description), заголовок H1. Статті також враховуються, як і картинки.

Окреме місце займає релевантність зв'язку сторінок між собою у вигляді посилань та їх вагу.

Зовнішні фактори.Оцінка значущості вхідних посилань та зовнішніх поведінкових факторів.

Тут відіграють роль показники значущості та авторитетності, які залежать від зовнішніх посилань та рівня відмов користувачів.

Пошукові системи створили окремі продукти для оцінки таких факторів: Google – PageRank, а Яндекс – ТИЦ.

Основну складність представляє розрахунок релевантності, - кожної пошукової системи він індивідуальний, і є продуктом інтелекту професійних математиків.

А ось проблема, яка стоїть перед власником сайту – у визначенні, які сторінки відповідають запитам користувачів, а над якими слід попрацювати.

Як розрахувати рівень відповідності сторінки сайту запитам користувача

Існують послуги, які проводять оцінку релевантності сторінок сайту.

Вони використовують власні алгоритми для таких оцінок, тому питання довіри до результатів таких досліджень залишається відкритим.

Втім, такі ресурси ясно відображають загальну картину, виявляють проблеми і наводять шляхи їх вирішення. Тому не слід гидувати їх результатом роботи.

Перший сервіс, який я хочу розглянути називається Seolib(З ним ми вже знайомилися раніше, коли у ПС).

Він дозволяє перевірити щільність ключових слів у тексті, його обсяг, відсоток використання найуживанішого слова та інші показники.

Для цього реєструємо свій проект (для прикладу візьмемо сайт електротранспорту http://electric-wheels.ru), вводимо при цьому ключові слова, за якими він ранжується.

Після підтвердження реєстрації клацаємо у правому верхньому кутку по значку гайкового ключа, та вибираємо розділ "Релевантність текстів".

Отримуємо повний звіт за заданими параметрами.

Ці відомості допоможуть нам переосмислити юзабіліті сайту та рівень корисності контенту.

Інший сервіс, який аналізує релевантність тексту - Megaindex(З його допомогою ми раніше аналізували і конкурентів).

Після реєстрації свого сайту в системі, переходимо до розділу SEO-сервіси -> Аналіз релевантності.

Одноразово перевіряється одне ключове слово.

Вводимо його в рядок, а нижче URL, щодо якого перевіряємо релевантність.

Отримуємо загальну оцінку релевантності у %, а також зокрема за заголовками та тілом сторінки сайту.

Крім того, сервіс розбиває проблеми за рівнем пріоритетності, що дозволяє якісно розподіляти сили на ті чи інші помилки.

Наприклад, у нашому прикладі варто звернути увагу на форматування контенту та заголовок h1, у якому відсутній ключ.

Наступний сервіс, який проводить комплексний аналіз релевантності сторінки сайту Serpstat (Раніше він називався Prodvigator).

Цей інструмент автоматизує пошук ключових слів, що спрощує аналіз релевантності та покращує його результат.

Отже, вводимо ключовий запит (у нашому прикладі "електросамокат"), вибираємо пошукову систему, і натискаємо на кнопку "Пошук".

Входимо в розділ "Підбір фраз", і отримуємо всі ключові слова, які схожі з нашим запитом. Вибираємо ті, які нас цікавлять чи всі разом.

Додаємо їх до списку, яких зберігається у системі.

Переходимо до розділу “Схожі фрази” і отримуємо синоніми нашої ключової фрази.

Немає потреби створювати новий список під них, додаємо до того, який ми зробили у розділі “Підбір фраз”.

Потрапляємо на сторінку розрахунку релевантності.

Залишилося вибрати ключові слова, і ввести URL-адресу сторінки сайту (у прикладі це electric-wheels.ru), релевантність якої і буде розраховуватися за даними ключовими словами.

Бачимо, що більшість високочастотних слів рівень релевантності різний, але переважно вище середнього.

Також майже немає відсутніх слів. Це хороша ознака – за високочастотними запитами сайт високо ранжується у пошуку.

За середньо- та низькочастотним рівень релевантності нижчий, і відсутніх слів досить багато.

Над ними варто попрацювати, щоб підняти сайт вище у пошуковій видачі.

Адже, як відомо, за клієнтами, які перейшли за середньо- та низькочастотними запитами, найвищий рівень конверсії.

Також необхідно додати до семантичного ядра ті слова, з якими ключовики добре поєднуються. Знаходимо їх на кліку в правому верхньому кутку на значку ярлика.

Висновок

Тепер ви знаєте, що являє собою релевантність, і з чим її їдять. Вона важлива для оптимізації сайту, збільшення трафіку, і, зрештою, для зручності користувача.

Більше уваги приділяється внутрішнім чинникам релевантності, ніж зовнішнім.

Акцент було зроблено на аналізі сервісів, які проводять оцінку ступеня відповідності сторінок ключовим запитам.

Таким чином легко дізнатися, які проблемні тексти, слова та заголовки потрібно переробити, плюс отримали ключові слова, які варто додати на сайт у поєднанні з семантикою, що вже є.

Релевантність сторінки сайту— відповідність сторінки пошуковому запиту. Що означає релевантність — що більше сторінка відповідає пошуковому запиту, то вище в результатах пошуку має бути сайт, оскільки значення релевантності сторінкиістотно впливає на пошукове ранжування (сортування). Значення слова релевантність (визначення, дякую Вікіпедія) оцінка ступеня відповідності інформації та практичної застосовності результату, а також ступеня соціальної застосовності варіанта вирішення задачі.

Можна вважати, що синонім слова релевантність- Адекватність інформації. І саме до підвищення релевантності сторінок сайту за певними запитами повинен прагнути кожен власник сайту, або . Оскільки саме висока релевантність сайту дозволяє досягти високих позицій у результатах пошукової видачі. Одним SEO тут не обійтись і ось чому.

Ступінь застосування результату відіграє найважливішу роль у понятті релевантності, так як семантична відповідність сторінки пошуковому запиту - не єдиний критерій релевантності. Головне завдання релевантності — визначити корисність кожної сторінки сайту для відвідувача та вивести на підставі даних індекс, який буде враховуватись при ранжируванні сторінок сайту за пошуковими запитами. Корисність результату – ось що означає релевантність сторінок сайту.

Некорисні сторінки з високою семантичною відповідністю можуть утримувати високу релевантність пошуку, доки показника релевантності не додадуться поведінкові фактори ранжування. Де вже користувачі своєю поведінкою покажуть справжню користь сторінки, внаслідок чого текстова релевантність буде доповнена та скоригована. Підвищити релевантність сторінки, через щільність ключових слів тексту або підвищити релевантність через посилання — заходи, що працюють в умовах низької конкуренції, або високих показників юзабіліті.

Формула релевантності сторінки

Формули розрахунку релевантностідокументів складні і в кожної пошукової системи свої, чи то Яндекс, чи Google. Але базові принципи визначення релевантності контенту приблизно схожі. можна поділити на два типи: внутрішні та зовнішні. Комплекс внутрішніх та зовнішніх факторів безпосередньо використовується в формулі обчислення релевантностіта сортування сторінок у результатах пошуку за запитом.

Внутрішні фактори релевантності

Внутрішні фактори релевантностівідповідають визначення відповідності контенту сайту ключовому запиту. Тут перше місце виходить фактичне відповідність семантики сторінки запиту. Простіше кажучи, визначення релевантності, виходячи з наявності ключових слів тексту сторінки. Більше інших, на релевантність впливають такі критерії: ключові слова в , описі сторінки. Звичайно ж, релевантність тексту статті,текст опису товару або послуги, так само впливає на ступінь релевантності всієї сторінки.

До внутрішніх факторів релевантності сторінки можна віднести не тільки визначення релевантності даних самої сторінки, а й відповідність внутрішніх посилань ключовому запиту сторінки та тематичний зв'язок сторінки донора посилання стосовно сторінки акцептора. Тобто, оцінюється релевантність посилання, що веде на сторінку, а якщо говорити точніше, то оцінюється вага сторінки сайту, з якої передається посилання та вага, яку передає саме посилання. Сумарна вага всіх ваг посилань збільшує вагу самої сторінки, що позначається на релевантності сторінки пошуковому запиту.

Зовнішні фактори релевантності

Зовнішні фактори релевантності- Це оцінка значущості вхідних посилань та зовнішніх поведінкових факторів. Залежно від пошукової системи, технологія обробки зовнішніх посилань може бути різною, але, в основному, вони побудовані на цитованості або авторитетності. Яндекс визначає релевантність сторінкина підставі зовнішніх посилань, використовуючи тематичний індекс цитування. Крім авторитетності сайту, Яндекс враховує тематичну близькість джерела посилання на сайт, на який поставлене посилання.

У каталозі Яндекса, результати видачі відсортовані за релевантністюна основі ТИЦ. Google має власну технологію обліку зовнішніх посилань для визначення релевантності сторінки - PageRank. Google підсумовує авторитну вагу сайту донора і пердає його частину сайту акцептору і вважається загальна вага, яку принесла кожне зовнішнє посилання. В результаті більш релевантним вважає ресурс з великим авторитетом. Скінчено не тільки ПейджРанк керує пошуком, однак — один з основних факторів, на якому побудовано ранжування результатів пошуку.

Також до зовнішніх факторів можна віднести і зовнішню реакцію відвідувачів на сайт. Якщо сторінка сайту має високий авторитет та чудову семантичну відповідність, це все одно не допоможе, якщо у сторінки високий показник відмов та повернень до пошуку. Безумовно, релевантність впливає на ранжування сайту в пошуку, але без схвалення відвідувачів жоден сайт довго в топі не втримається. Сьогодні пошукові системи стали досить складними, для того, щоб розуміти, що потрібно користувачам і як, залежно від побажань відвідувачів, потрібно сортувати сайти в результатах пошуку.

Як підвищити релевантність сторінки

Щоб підвищити релевантність сторінки, необхідно п підвищення релевантності кожного елемента сторінки, а також робота над структурою сайту, внутрішніми посиланнями та юзабіліті всіх елементів сайту. Для кожного сайту критерії релевантності можуть мати свої. Наприклад, для одного сайту необхідною умовою є тривалість знаходження відвідувача на сторінці. Для іншого сайту критерієм релевантності є якнайшвидше досконала дія.

Для більшості сайтів існують загальні правила підвищення релевантності, які дають відповіді на основне питання: — «Як підвищити релевантність сторінки» по кожному з основних елементів сайту, починаючи з і закінчуючи . Нові сайти або сайти, сторінки яких мають погані позиції в пошуку та низьку релевантність гарантовано піднімуть свої показники, просто дотримуючись цих правил. Не бачу сенсу давати список статей тут, тому що список буде об'ємним. Читайте статті у розділі , якщо якоїсь статті ще немає, напишіть у коментарях і така стаття з'явиться. Статті оновлюються щодня.

Як перевірити релевантність сторінки сайту

Релевантність сторінки сайту змінюється в залежності від роботи алгоритмів пошукової системи. Тому намагатися дізнатися релевантність сторінкиабо перевірити релевантність сторінки- Завдання безглузде. Значення, які хоч скільки щось відбивали дійсність, є тільки у пошукової системи. Тим більше, що не може існувати будь-якого загального індексу релевантності, тому що релевантність сторінки в даний час різна в залежності від географічних факторів, налаштувань браузера, історії відвідувань і безлічі інших факторів.

Проте, перевірка релевантності сторінкиможлива. В деякій раді оцінкою релевантності сторінки є пошукова видача. Аналіз релевантності сторінкиможна проводити на підставі даних результату пошуку. Як дізнатися релевантність сторінки? Вибирайте ключові слова для пошуку, вводьте потрібні параметри і вперед. Якщо вам потрібна оцінка релевантності тексту або перевірка статті на релевантність, тут можна отримати лише незалежні дані від сторонніх програм та веб-сайтів.

На двох сайтах один і той же текст може бути оцінений пошуковою системою по-різному, залежно від багатьох факторів. Перевірити релевантність тексту статтіабо будь-якої іншої частини сайту окремо від загального контексту сторінки, так само безглуздо. Якийсь абстрактний аналіз релевантності тексту сторінки можна зробити, використовуючи різні онлайн сервіси. Тут вам і перевірка релевантності тексту онлайн, визначення релевантності сторінки, і перевірка сайту на релевантність. Як кажуть, на будь-який смак та колір.

Визначити та перевірити релевантність сторінки сайту онлайнпропонують ресурси на зразок seolib або мегаіндекс (megaindex), проте, наскільки ці дані виявляться корисними вирішувати вам. Сучасні пошукові системи досить непогано справляються для того, щоб аналізувати поведінку людей і на підставі людських переваг формувати пошукову видачу. Хороший сайт, зроблений для людей, великий, зручний та цікавий матиме високу релевантність. Думайте насамперед про те, чого хочуть ваші відвідувачі, а не про те, який показник релевантності тексту в цю хвилину на одній з ваших сторінок.

Робіть хороші сайти, ставте лайки і прийде релевантність.

Формальні оцінки релевантності можна отримати лише релевантності першого роду, тобто. для релевантності у вихідному розумінні в теорії інформаційного пошуку.

Для введення критерію релевантності слід задати процедуру визначення міри семантичної близькості пошукового образу документа пошукового образу запиту та деяке граничне значення цього заходу. Якщо міра перевищує граничне значення, то документ релевантний запиту.

ПІД і ПОЗ є безліччю ключових слів або дескрипторів залежно від виду інформаційно-пошукової мови. Для їхнього зіставлення використовують критерії смислової відповідності, які визначають на основі збігу ключових слів (дескрипторів) у ПІД та ПОЗ.

ПІД і ПОЗ можна у вигляді чітких і нечітких множин.

Для чітких множин вводять нормовану міру релевантності

Критерій смислової відповідності можна у вигляді

де μβ (а, b)- функція обчислення міри релевантності (або просто міра релевантності); α – граничне значення релевантності, таке, що

Змінюючи граничне значення а, можна організувати видачу різних сукупностей документів, яку теоретично інформаційного пошуку називають ешелонованою видачею.Кожен ешелон відповідає певною мірою семантичної близькості до сукупності документів запиту.

Вочевидь, що більше порогове значення а, тим більше жорсткі умови накладаються на смислову близькість документа запиту. У нормованих заходах при α = 1 для видачі документа потрібний повний збіг ПІД та ПОЗ.

Оцінку релевантності можна характеризувати повнотоювидачі (або втратами),тобто. числом не виданих релевантних документів та точністю (або шумом),тобто. числом або відсотком "зайвих" документів, виданих у результаті пошуку, але є релевантними.

Наприклад, в оцінці повноти Rта точності Твводяться так:

де a i число релевантних документів, формально виданих системою i-й запит; m i – число всіх формально виданих на i-запит системою документів; і – число всіх релевантних документів, що відповідають запиту.

= середні відносні оцінки;

-сумарні відносні оцінки, де N -кількість пошуків.

Величини (1-7) та (I – R)називаються відповідно шумом та втратами.

У роботах А. І. Михайлова, А. І. Чорного та Р. С. Гіляревського пропонується наочна матриця для визначення повноти та втрат, точності та шуму (табл. 6.5).

Таблиця 6.5

Матриця для визначення критеріїв релевантності

Повноту пошуку вимірюють відношенням кількості виданих релевантних документів ( а) до загальної кількості релевантних документів масиву (а+с):

Точність пошуку Г – відношення кількості виданих релевантних документів (а)до загального виданих документів ( а + b):

Відповідно, втрати Lі шум Sможна уявити так:

В пропонується, провівши серію експериментів ппо визначенню повноти та точності пошуку, визначити середню повноту та середню точність:

Використовуються інші способи усереднення (див., наприклад, в ). Наприклад, у зв'язку з оцінкою системи СМАРТ Селтон запровадив нормовану повноту R N та нормовану точність P N :

де N- Число документів у масиві; п- Число всіх релевантних документів у масиві; n i – кількість релевантних документів, виданих до i-го рангу включно;

де i- Номер рангу.

В пропонується також, користуючись табл. 5.4, ​​ввести (з певним ступенем наближення) показники в термінах теорії ймовірностей:

Пропонувалися й інші способи оцінки релевантності (див. огляд).

Наприклад, зі способами застосування для оцінки релевантності нечітких множин можна познайомитись у роботі Г. Ю. Максимовича, О. Г. Романенко, О. Ф. Самойлюк

До показників функціональної ефективності названі автори пропонують відносити також оперативністьпошуку; специфічність пошуку С –відношення числа не виданих нерелевантних документів ( d) до загальної кількості нерелевантних документів (d + b),де b –кількість виданих нерелевантних документів:

З урахуванням того, що на практиці при оцінці ІПС з великими масивами інформації точні вимірювання кількості релевантних та нерелевантних документів у загальному масиві або у масивах виданих документів утруднено, пропонують використовувати ентропійні показники.

Ентропійні заходи можна одержати з урахуванням дослідження вибірки з інформаційного масиву, тобто. можуть використовуватися ймовірнісні заходи невизначеності вихідного масиву р0, масиву виданих р 1 та масиву невиданих р 2 документи, обчислені на їх основі #0, Н B , Ннв та відповідні заходи W.

Зокрема, пропонується інтегральний ентропійний показник як міра упорядкованості пошукового масиву документів, що є результатом процесу пошуку за заданим запитом:

де Н 0 – допошукова (апріорна) ентропія; Нп післяпошукова (апостеріорна) ентропія.

При цьому для вимірювання апріорної та апостериорної ентропії пропонується використовувати заходи концентрації релевантних документів у загальному масиві, масиві виданих документів та масиві невиданих документів, у відносних одиницях:

де а– кількість релевантних документів, виданих у результаті пошуку; г –число релевантних, які не видані в результаті пошуку; g- Число нерелевантних документів, виданих в результаті пошуку; d –число нерелевантних документів, не виданих у результаті пошуку.

Ентропійний захід може бути представлений і в логарифмічній формі.

Наприклад, для оцінки ентропії використовуються натуральний логарифмічний захід (тобто невизначеність вимірюється в неперах Нп):

- Невизначеність вихідного масиву;

– невизначеність масиву виданих документів:

– невизначеність масиву невиданих документів:

При формуванні подібних заходів можуть бути використані інші логарифмічні шкали: двійкові логарифми (біти), вісімкові логарифми (байти), десяткові логарифми.

Визначення повноти системи пов'язані з визначенням змістовної видачі кожен запит.

Існує кілька способів (методів) визначення цієї видачі:

  • суцільний перегляд всього експериментального масиву. Перевагою цього є надійність, недоліком – трудомісткість;
  • метод документа-джерела ("метод Клевердона"). Полягає в тому, що за деякими документами масиву, обраними більш-менш випадково, складаються запити з таким розрахунком, щоб кожен документ-джерело був релевантний складеному по ньому запиту;
  • метод контрольних документів За запитом, отриманим за довільно вибраним джерелом, проводиться змістовий пошук шляхом суцільного перегляду масиву, починаючи, наприклад, з документа-джерела, до знаходження першого релевантного документа, який оголошується контрольним. Значення повноти системи вважається тепер як частка запитів, якими система видала контрольний документ у кількості запитів;
  • метод поєднання формальних видач. Застосовується при порівнянні декількох пошукових систем ("оцінка-шкала"), він полягає в тому, що по кожному запиту експерт переглядає ті документи, які видавалися хоча б однією з цих пошукових систем. Змістовною видачею вважається сукупність виявлених релевантних документів, і щодо неї визначається повнота, що відрізняється від істинної повноти кожної з систем, що розглядаються.

Питання представницькості масиву документів і масиву запитів, обраних визначення формальних оцінок, у загальному вигляді не вирішено. Вважається, що більш менш стійкі оцінки (коливання не перевищують 5%) можна отримати на масиві в 4000 документів, масив запитів при цьому повинен бути близько декількох сотень.

Таким чином, релевантність (формальна) характеризує властивості засобів логіко-семантичного апарату інформаційно-пошукової системи та залежить від можливості відображення ПІД та ПОЗ за допомогою інформаційно-пошукової мови, прийнятих в ІПС алгоритмів пошуку та системи індексування.

  • Максимович Р. Ю.Інформаційні системи/Г. Ю. Максимович, О. Г. Романенко, О. Ф. Самойлюк. М: Изд-во Ріс. екон. акад., 1999.
  • Максимович Г. Ю. Інформаційні системи / Г. Ю. Максимович, О. Г. Романенко, О. Ф. Самойлюк. М: Изд-во Ріс. екон. акад., 1999.

Добрий день друзі! Сьогодні черговий пост про найважливіші поняття пошукового просування для блогерів і сеошників-початківців. Що таке релевантність сторінок сайту — тема цієї статті, з якої ви дізнаєтесь визначення релевантності, основні її складові та як вона оцінюється пошуковими системами. Дозволю зауважити, що це досить важливе питання, на якому будується весь процес ранжування сайту під час підготовки документів у результат видачі. Від правильного розуміння цього терміну залежить успішне сео просування Вашого сайту в пошукових системах. Тому пропоную зазирнути в наш словничок та отримати необхідні відомості щодо центрального елементу ранжування.

Визначення релевантності

Що означає релевантність? Це процес, у якому перевіряється схожість отриманого результату від бажаного. Цей термін використовується в сучасних пошукових системах і під ним розуміється відповідність отриманої інформації до пошукового запиту, який задав користувач. Згідно з визначенням, коли відвідувач Яндекса або Гугла набирає своє питання, пошукова система намагається оцінити різні документи зі свого індексу і вибрати відповідні для відповіді. Таким чином, система обчислює міру відповідності - ступінь збігу документа та пошукового запиту. Відповідно, якщо вони збігаються, то значення міри найбільше (максимальне), а якщо ж ні — нулю.

За рівнем релевантності документів у результатах видачі судять про ефективність роботи будь-якої пошукової системи. Якщо користувач отримає на свій запит абсолютно невідповідну для нього відповідь, тобто велика ймовірність того, що він більше не користуватиметься таким ресурсом. Тому саме підбір найрелевантніших документів для своєї видачі — основне завдання пошукача. Це впливає і на популярність пошукової системи, і її прибуток.

Наскільки релевантним є той чи інший документ у мережі Інтернет, визначається спеціальним пошуковим алгоритмом. У Яндекса він один, у Гуґла він інший, але загальна схема його роботи у них однакова. Також і в інших пошукових системах певні релевантності своє, але має спільне коріння.

Пошуковий алгоритм

Це спеціальні математичні висловлювання і формули, якими пошукові системи вибирають різні сайти у результати пошуку. Кожен з цих веб-ресурсів містить один відповідний документ, в якому знаходиться відповідь на пошуковий запит користувача. Принцип роботи алгоритму дуже простий: спочатку вибираються всі сторінки сайтів, що містять запит, а потім йде планомірне відсіювання — відсікаються майданчики без чіткої інформації для користувача або недозволені у зв'язку з використанням заборонених методів оптимізації (чорне seo — клоакінг, дорвеї тощо). ). Вибрані сторінки аналізуються за контентом документів і приймається рішення про те, наскільки вони відповідають пошуковому запиту. І в залежності від ступеня відповідності кожному документу надається свій номер у пошуковій видачі. Чим він менший, тим швидше його побачить користувач пошукача.

Що таке релевантність сторінок сайту

Зазвичай кожен веб-ресурс має кілька сторінок, які містять відповідь на запит користувача пошукової системи. Завдання перед пошуковим алгоритмом ставиться таке - вибрати найбільш релевантний документ (сторінку сайту або пост блога). Це питання вирішується так. На релевантність кожної сторінки впливає багато факторів. Тому для оцінки відповідності документа веб-ресурсу запиту користувача пошукової системи обчислюється сумарний показник. Відповідно, сторінка з максимальним сумарним показником буде найкращою і саме її пошукова система покаже користувачеві. Наприклад, на наступній картинці можна побачити вибірку з пошукової системи Яндекс найрелевантніших сторінок мого блогу на запит «що таке видимість сайту». Перший документ має максимальний сумарний показник.

Від чого залежить релевантність сторінки? Кожна сторінка будь-якого сайту це цілий самостійний елемент мережі Інтернет. Він містить власний контент. В основному він унікальний, зі своїм текстом, картинками тощо. Цей елемент взаємодіє з іншими сторінками - від нього йдуть різні посилання на інші сторінки сайту або на чужі веб-ресурси. І по можливості він також отримує різні зовнішні посилання. Тому можна сказати, що релевантність сторінки по конкретному пошуковому запиту впливають як внутрішні параметри, і зовнішні. Плюс ще важливий і авторитет цієї сторінки. Давайте розглянемо докладніше кожну складову.

Внутрішня

Внутрішня або інакше текстова релевантність - це ступінь відповідності внутрішніх критеріїв сторінки веб-ресурсу вимогам пошукових систем. Якщо при пошуковому запиті слова на сторінці відповідають його формі і є найбільш уживаними, цей документ вважатиметься релевантним. Тобто можна сказати — що ближче до ідеального (кожної системи своє число) співвідношення кількості входження запиту до загальної кількості всіх слів у тексті, тим вище виявиться документ у результатах видачі. Перерахуємо основні параметри, за допомогою яких оцінюється.

  • Частота пошукового запиту у тексті . Мається на увазі обсяг та кількість повторень ключового запиту на сторінці сайту. Чим ближче до ідеального варіанту (повторюся, що кожна пошукова система має свою цифру), тим краще в плані оцінки релевантності документа.
  • Місце розташування слів у заголовках . Якщо пошуковий запит знаходиться в заголовку сторінки, то підвищується ймовірність кращої оцінки цього документа порівняно з іншими сторінками веб-ресурсу. Тобто тег title повинен містити у своєму реченні ключовий запит, що значно посилить релевантність сторінки.
  • Близькість до початку сторінки . Пошуковий робот при скануванні нової сторінки йде за кодом від початку. Тому чим раніше він зустріне пошуковий запит на ній, тим краще для оцінки релевантності. Тому ключові слова необхідно прописувати якомога раніше у статті сайту або пості блогу.
  • Наявність ключових слів у спеціальних місцях документа . Насамперед це йдеться про наявність пошукових запитів у заголовку статті (зазвичай у тезі h1) та у підзаголовках (у тезі h2 — не так важливо, як у h1, але наявність вітається). Плюс оформлення пошукових запитів у тексті у спеціальні теги (strong тощо). І звичайно ж наявність ключових слів у мета-тегах Description (опис сторінки) та Keywords.
  • Наявність синонімів ключових слів . Дуже важливий елемент. Наявність синонімів у контенті сторінки говорить пошуковим системам про те, що цей документ дійсно відноситься до тематики пошукового запиту, а значить, він буде найбільш корисним для користувача. Таким чином пошукові системи чистять результат видачі - не беруться до уваги сторінки, які міститиму ключові слова як доповнення до інших тем і документи, які є майданчиками для більшості автоматизованих систем просування (RooKee, SeoPult і т.д.)

Зовнішня (посилальна)

В основі цієї складової лежить принцип популярності сторінки сайту. Тут у розрахунок приймається кількість посилань зі своїми текстами (анкорами). Чим більше посилань, тим краще посилальна релевантність. І якщо текст посилання містить ключовий запит користувача, то значущою стає сторінка. Тому рекомендується завжди використовувати пошуковий запит у тексті посилань. Причому не важливо, це внутрішнє посилання або зовнішнє — слова анкорів мають значення. Також оцінюється навколоанкорний текст посилання, який містить зовнішню сторінку іншого веб-ресурсу. Якщо він не є тематичним на пошуковий запит, значимість тексту посилання буде меншою.

Авторитетність сайту

  • кількість та якість зовнішніх посилань, що ведуть на сайт. Важливий показник, який показує рівень значущості сайту та його сторінок серед інших веб-ресурсів. Чим якісніші зовнішні посилання (ключові слова в анкорі та тематичний навколопосилальний текст) і чим авторитетніший сайт-донор (веб-ресурс, який віддає зовнішнє посилання), тим більша вага може перейти на цільову сторінку.
  • зміст сайту та відповідність контенту пошуковим запитам. Чим більше сторінок, за якими просувається сайт, відповідають запитам користувачів пошукових систем, тим вища авторитетність сайту. Тому для будь-якого веб-ресурсу, який розкручується в пошукових системах, найважливіші два моменти — це правильне складання семантичного ядра і наявність унікального оптимізованого контенту. Навіть за наявності великої кількості зовнішніх посилань неможливо на тривалий термін просунути цільові сторінки сайту в топ-10 без хорошого тексту та грамотного набору ключових слів. Згодом пошукова система песимізує ці документи зі своєї видачі, зменшивши на порядок їхню релевантність через відсутність нормального контенту з урахуванням внутрішньої оптимізації.

Якщо блогер просуває свій веб-ресурс у пошукових системах, то йому можуть бути корисні наступні поради та рекомендації щодо покращення релевантності цільових сторінок:

  • Перед просуванням цільових сторінок обов'язково підберіть семантичне ядро ​​Вашого блогу. Якщо Ви просуватимете цільові сторінки за неякісними пошуковими запитами, Ваш блог отримає набагато менше цільових відвідувачів і більше відмов, що з часом зменшить якість цих сторінок. Перевіряйте всі параметри ключових слів (частотність, якість слова, його конкурентність) – це запорука отримання якісного трафіку з пошукових систем.
  • Нові сторінки перевіряйте у результатах видачі на свій ключовий запит. Наприклад, Ви просуваєте одну сторінку за певним пошуковим запитом. Але після індексації за цим ключовим словом у видачі пошукової системи є зовсім інша сторінка. Отже, Вам необхідно перевірити всі параметри, за якими розглядається релевантність цільової сторінки. Тут може бути наступна проблема — документ погано оптимізований та/або на нього надходить менша кількість вагомих зовнішніх та внутрішніх посилань — вага сторінки дуже мала порівняно з тією, що висить у видачі.
  • Збільшуйте авторитет свого блогу. З часом підвищення рейтингу Вашого сайту збільшиться і релевантність цільових сторінок, по яких просувається блог. Це все буде йти автоматично зі зростанням популярності вашого веб-ресурсу. Піднімається ВІЦ та ТИЦ Вашого сайту, зростають позиції сторінок Вашого сайту в Яндексі (аналогічно в інших пошукових системах).

На цьому мій черговий лікнеп закінчено. Насамкінець прохання до моїх читачів — у коментарях цієї посади, крім усього іншого, хотілося б дізнатися Вашу думку з наступних питань:

  1. Як часто ви перевіряєте на релевантність ваші цільові сторінки?
  2. Чого не вистачає на Ваш погляд у моїх уроках рубрики просування сайту?
  3. На яку тему Ви хотіли б отримати матеріал в одному з наступних уроків?

Спасибі друзі! До зустрічі!

Завантаження...
Top