Текстовая релевантность документа в результатах поиска

Текстовая релевантность документа

Вебинар из цикла «Введение в SEO» от Сергея Кокшарова (Devaka). Ведущий объясняет понятие термина «релевантность» – это соответствие полученного результата ожиданиям пользователя. Чем выше уровень соответствия документа, тем выше релевантность. Релевантность может включать актуальность, авторитетность или новизну документа.

В текстовой релевантности существует несколько подходов.
ТF/IDF – самый популярный метод, где TF – количество вхождений ключевого слова в тексте, а IDF – редкость ключевого слова. Недостаток – легко «накрутить» результаты. Второй подход – BM25. Функция выстраивания документов поисковиками по их релевантности.

Автор рассказывает о методике поиска в документе по его зонам, с перечислением зон:
- TITLE;
- Meta-description;
- H1-H6;
- текст с элементами форматирования;
- тексты исходящих ссылок;
- URL.

Также Кокшаров рассказывает о построении текстовой релевантности в зависимости от:
- количества ключевых слов;
- словоформ;
- весомости слов;
- позиции в текстовой зоне;
- близости слов из запроса;
- синонимов и тематических слов;
- спамности ключевых слов в тексте.