Построение модели ранжирования поисковой выдачи Яндекс

Хотите, чтобы сайт отвечал всем вашим требованиям? Закажите сайт под ключ, когда каждый элемент сайта будет выполнен исключительно с особенностью вашего бизнеса или проекта. Цена такой работы, конечно, будет высока, но при этом значительно ниже вероятность обращения за доработками в будущем.

Смоделируем процесс ранжирования Яндексом веб-ресурсов в поисковой выдаче по поисковой фразе «теплообмен».

Для эксперимента отбирается первых 50 сайтов в поисковой выдаче по вышеуказанному ключевому запросу . Матрица данных X содержит 42 переменных фактора, характеризующие численно каждый сайт. Столбцы матрицы X соответствуют значениям факторов, а строки – веб-сайту. Как и в случае модели ранжирования для Google, качество модели вычислялось как значение критерия регулярности AR при такой же пропорции разделения данных на две части А и В. Выходной переменной у является позиция веб-ресурса в поисковой выдаче.

С применением ОИА МГУА была построена нижеследующая модель, описывающая порядок ранжирования веб-сайтов в поисковой системе:

Качества модели описывается показателями: AR(A) = 3,12; AR(B) = 3,92, R2 =89%.

Таблица 1

Результаты ранжирования веб-сайтов в Яндекс.уа

Результаты ранжирования веб-сайтов в Яндекс.уа

Из структуры модели следует, что на ранжирование веб-сайтов в поисковой системе Yandex наибольшее влияние оказывают следующие 13 факторов: х3 – отношение общего числа слов и числа ключевиков на сайте; х4 – отношение общего числа слов и числа ключевиков на странице; х6 – популярность тематики; х7 – число запросов по ключевику в определённый интервал времени; х12 – возраст сайта; х14 – частота обновления информации на сайте; х15 – последнее обновление страниц сайта; х22 – размер шрифта, которым оформлены ключевики; х27 – наличие ключевиков в заголовке; х28 – наличие ключевиков в мета-тэгах; х35 – соответствие ключевиков сайта разделу регистрации в каталоге поисковой системы; х41– количество внешних ссылок, в названии которых встречается ключевое слова; х42 – индекс цитирования Яндекс.

Проанализировав эти факторы, можно прийти к выводу, что на ранжирование веб-сайтов в поисковой системе Яндекс влияют больше всего внешние факторы  (х6,x7,x12,x35,x41,x42).

Проверим правильность работы найденной формулы выше на других поисковых запросах:

  • «теория вероятности»;
  • «химчистка ковров»;
  • «отдых в Таиланде».

Таблица 2

Результаты ранжирования сайтов  в Яндекс.уа

Результаты ранжирования сайтов  в Яндекс.уа

Из таблицы 2 видно, что построенная модель с высокой точностью соответствует результатам ранжирования поисковой системы Yandex.

Сравнив полученные модели ранжирования для Google и Яндекс, видим, что из-за различных алгоритмов расчета авторитетности веб-страницы (PR для Google и ТИЦ для Яндекс) они отличаются только такими признаками: х40 – возраст домена; х5 – значение PR; х42 – значение ТИЦ.

Остальные признаки входят в обе модели, но с разными коэффициентами.

Добавить комментарий

Ваш адрес email не будет опубликован.

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.