Исследование алгоритмов поисковых систем (начало)

Мы уже давно привыкли находить почти любую, интересующую нас информацию в интернете. Это стало возможным во многом благодаря появлению и развитию поисковых систем, основная задача которых — сделать поиск информации в Интернете более эффективным. Для этого были разработаны алгоритмы ранжирования сайтов в поисковой выдаче, результатом работы которых является отсортированный по релевантности (наиболее точно удовлетворяющий условия поиска) список сайтов.

Современный Интернет все больше становится похож на огромную рекламную площадку, что значительно затрудняет поиск информации в сети. Алгоритмы работы поисковых систем развиваются вместе с Интернетом, они постоянно совершенствуются, но, не смотря на это, поиск нужной информации становится все более сложной задачей.

Далее описаны принципы работы программного комплекса, который позволит провести анализ существующих алгоритмов, используемых современными поисковыми системами и выявить основные факторы, которые влияют на ранжирование сайтов в результатах поисковой выдачи.

1. Основные известные факторы, влияющие на ранжирование сайтов. Поисковая оптимизация — комплекс мер для поднятия позиций сайта в результатах выдачи поисковых систем по определенным запросам пользователей. Обычно, чем выше позиция сайта в результатах поиска, тем больше заинтересованных посетителей переходит на него с поисковых систем. При анализе эффективности поисковой оптимизации оценивается стоимость целевого посетителя с учетом времени вывода сайта на указанные позиции, на который привлекаются целевые посетители.

Работа по оптимизации включает в себя работу с внутренними факторами (находятся под контролем владельца веб-сайта) — приведение текста и разметки страниц в соответствие с выбранными запросами, улучшение качества и количества текста на сайте, стилистическое оформление текста (заголовки, жирный шрифт), улучшение структуры и навигации, использование внутренних ссылок, а также внешними факторами — обмен ссылками, регистрация в каталогах и прочие мероприятия для повышения и стимулирования «ссылаемости» на ресурс.

Механизм ранжирования — это программа, которая определяет релевантность страницы (степень соответствия) поисковому запросу на основе семантического анализа документа, плотности и соответствия ключевых слов, ссылок с других Интернет-ресурсов и других параметров. От релевантности страницы зависит ее место при выводе результатов поиска.

Факторы, которые используют современные поисковые системы при ранжировании поисковой выдачи, делятся на внешние и внутренние.

Внешние факторы направлены на увеличение авторитетности сайта, его «общего веса». Их совокупность не влияет на релевантность сайта напрямую, но является важным коэффициентом при формировании поисковой выдачи.

К внутренним факторам относятся все внутреннее наполнение сайта. Поисковые системы в ходе индексации страниц сайта проводят семантический анализ его содержимого и на основе полученных данных определяют релевантность сайта тем или иным поисковым запросам.

2. Сбор данных о сайтах и приведение их к единому виду

Для проведение анализа эффективности работы алгоритмов ранжирования поисковой выдачи мы выбираем сайты с первых нескольких страниц поисковой выдачи и собираем значения всех внешних и внутренних факторов, которые могут повлиять на их ранжирование в поисковой выдаче.

Для контроля результата работы нашей программы мы вручную просматриваем анализируемые сайты и оцениваем, насколько они релевантны введенному нами поисковому запросу.

После того, как все значения внешних и внутренних факторов ранжирования выбранных нами сайтов были собраны, мы приступаем к приведению их к единому формату. Все данные формируются в таблицу, которая в последствии будет передана для анализа в следующую часть программного комплекса.

Читайте также:

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.