Алгоритмы HITS и Hilltop.

Вебинар из цикла «Введение в SEO» от Сергея Devaka Кокшарова. В этом видео автор рассказывает о задачах алгоритмов HITS и Hilltop. Объясняет, что это одни из немногих запросо-зависимых алгоритмов.
Алгоритм HITS – задача алгоритма разделить узлы графа на две составляющих:
авторитеты – важные документы;
хабы – документы, ссылающиеся на авторитеты.
Начальное множество документов релевантно запросу, базовое множество расширяется на документы, ссылающиеся на начальное.
У алгоритма HITS широкое применение. К примеру, им можно классифицировать документ бинарным методом. Известный антиспам-алгоритм «Минусинск» в «Яндексе» работает на базе этого алгоритма.
Автор рассматривает алгоритм Hilltop. В этом алгоритме вводится понятие – экспертные документы. Это документы определенной тематики и имеющие много ссылок на неаффилированные документы по теме.

Алгоритм Hilltop – поиск экспертных документов:
определение аффилиатов:
одна подсеть или одинаковое имя доменов.
выбор экспертного документа;
индексация.

Алгоритм Hilltop – процесс ранжирования:
вычисление Target Score:
учитывается количество и релевантность ссылающихся экспертов;
Edge_Score(E,T)= Expert_Score(E)* Sum{query keywords w} occ(w, T)
Target_score = SUM (Edge_Score)
Автор рекомендует ссылки для детального изучения рассмотренных алгоритмов:
https://ru.wikipedia.org/wiki/Алгорит...
http://ftp.cs.toronto.edu/pub/reports...