Построение модели ранжирования поисковой выдачи Яндекс

Смоделируем процесс ранжирования Яндексом веб-ресурсов в поисковой выдаче по поисковой фразе «теплообмен».

Для эксперимента отбирается первых 50 сайтов в поисковой выдаче по вышеуказанному ключевому запросу . Матрица данных X содержит 42 переменных фактора, характеризующие численно каждый сайт. Столбцы матрицы X соответствуют значениям факторов, а строки — веб-сайту. Как и в случае модели ранжирования для Google, качество модели вычислялось как значение критерия регулярности AR при такой же пропорции разделения данных на две части А и В. Выходной переменной у является позиция веб-ресурса в поисковой выдаче.

С применением ОИА МГУА была построена нижеследующая модель, описывающая порядок ранжирования веб-сайтов в поисковой системе:

Качества модели описывается показателями: AR(A) = 3,12; AR(B) = 3,92, R2 =89%.

Таблица 1

Результаты ранжирования веб-сайтов в Яндекс.уа

Результаты ранжирования веб-сайтов в Яндекс.уа

Из структуры модели следует, что на ранжирование веб-сайтов в поисковой системе Yandex наибольшее влияние оказывают следующие 13 факторов: х3 — отношение общего числа слов и числа ключевиков на сайте; х4 — отношение общего числа слов и числа ключевиков на странице; х6 — популярность тематики; х7 — число запросов по ключевику в определённый интервал времени; х12 — возраст сайта; х14 — частота обновления информации на сайте; х15 — последнее обновление страниц сайта; х22 — размер шрифта, которым оформлены ключевики; х27 — наличие ключевиков в заголовке; х28 — наличие ключевиков в мета-тэгах; х35 — соответствие ключевиков сайта разделу регистрации в каталоге поисковой системы; х41— количество внешних ссылок, в названии которых встречается ключевое слова; х42 — индекс цитирования Яндекс.

Проанализировав эти факторы, можно прийти к выводу, что на ранжирование веб-сайтов в поисковой системе Яндекс влияют больше всего внешние факторы  (х6,x7,x12,x35,x41,x42).

Проверим правильность работы найденной формулы выше на других поисковых запросах:

  • «теория вероятности»;
  • «химчистка ковров»;
  • «отдых в Таиланде».

Таблица 2

Результаты ранжирования сайтов  в Яндекс.уа

Результаты ранжирования сайтов  в Яндекс.уа

Из таблицы 2 видно, что построенная модель с высокой точностью соответствует результатам ранжирования поисковой системы Yandex.

Сравнив полученные модели ранжирования для Google и Яндекс, видим, что из-за различных алгоритмов расчета авторитетности веб-страницы (PR для Google и ТИЦ для Яндекс) они отличаются только такими признаками: х40 — возраст домена; х5 — значение PR; х42 — значение ТИЦ.

Остальные признаки входят в обе модели, но с разными коэффициентами.

Читайте также:

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.