Текстовая релевантность документа в результатах поиска
Текстовая релевантность документа
Вебинар из цикла «Введение в SEO» от Сергея Кокшарова (Devaka). Ведущий объясняет понятие термина «релевантность» – это соответствие полученного результата ожиданиям пользователя. Чем выше уровень соответствия документа, тем выше релевантность. Релевантность может включать актуальность, авторитетность или новизну документа.
В текстовой релевантности существует несколько подходов.
ТF/IDF – самый популярный метод, где TF – количество вхождений ключевого слова в тексте, а IDF – редкость ключевого слова. Недостаток – легко «накрутить» результаты. Второй подход – BM25. Функция выстраивания документов поисковиками по их релевантности.
Автор рассказывает о методике поиска в документе по его зонам, с перечислением зон:
- TITLE;
- Meta-description;
- H1-H6;
- текст с элементами форматирования;
- тексты исходящих ссылок;
- URL.
Также Кокшаров рассказывает о построении текстовой релевантности в зависимости от:
- количества ключевых слов;
- словоформ;
- весомости слов;
- позиции в текстовой зоне;
- близости слов из запроса;
- синонимов и тематических слов;
- спамности ключевых слов в тексте.
Devaka Сергей (ещё 33 видео)
Решение проблем с почтой и рассылками после блокировки Яндекса и Mail.ru в Украине
Категория: Материалы из парсера
Этот вебинар Сергея Кокшарова проведен в соавторстве с Дмитрием Кудренко, руководителем сервиса eSputnik.comВедущие рассматривают блокировку почтовых...