Разработка системы анализа и продвижения интернет-ресурсов

Разработка системы анализа и продвижения интернет-ресурсов

В последние годы наблюдается постоянный рост количества веб-ресурсов в рамках глобальной сети Интернет, что, с одной стороны, способствует доступности информации, а с другой-усиливает конкуренцию между сайтами. Результатом этой ситуации является постепенная потеря посещаемости и упадок отдельных интернет-источников. Описанная ситуация возникает довольно часто и не только из-за объективные факторы: отсутствие обновлений, устаревшая информация или медленный хостинг и, как следствие, потеря «интереса» со стороны поисковых систем, что способствует расположению ресурса на «удаленных» страницах поискового запроса. Подробнее про SEO и тенденции в нем читайте на http://e2epro.com/.

Позиция интернет-ресурса в результате поискового запроса является очень важным фактором и напрямую влияет на количество посетителей. При этом поисковая оптимизация способствует его отражению в верхних позициях рейтинга поисковой системы. Достижение указанной цели возможно лишь в случае совершенного знания алгоритмов ранжирования и умелого применения технологий оптимизации поисковых механизмов, что невозможно без детального осмотра проблематики этой отрасли, анализа основных методов работы и основных алгоритмов оценивания.

Особыми чертами современных поисковых систем является наличие определенных составных частей и этапов работы, которые необходимо учитывать при проектировании систем анализа и продвижения интернет-ресурсов, а именно:

  • Сбор и обработка данных – содержит средства анализа ресурса с помощью роботов. А именно, как только разработчик разместил веб-ресурс в глобальной сети интернет (добавил внешние ссылки, зарегистрировал в каталогах и т.д.), соответствующий робот-паук поисковой системы, в соответствии с приоритетами, переходит на созданный ресурс и осуществляет сбор данных. При этом для web-пауков существует некоторые ограничения на глубину проникновения (уровень вложенности) и максимальный размер сканируемого текста обычно равен 256 Кб. Управление доступом для поискового робота осуществляется с помощью файла инструкций robots.txt;
  • Индексация полученных результатов – составление для каждой страницы ресурса обратного (инвертированного) файла индекса. Индекс служит для осуществления процесса поиска информации и обычно состоит из списка слов и информации о них (позиции в тексте, размера и т.п.). Процесс индексации продолжается короткий промежуток времени, а его результатом является возможность осуществления поиска по ключевым словам
  • Поиск информации – анализ запроса, введенного пользователем. В результате этой процедуры вычисляется вес каждого слова и осуществляется поиск по инвертированными индексами, наиболее подходящие для данного запроса:

similatiry (Q, D) = SUM (wqk * wdk),
где similatiry (Q, D) – сходство запроса Q относительно документа D; wqk – вес k-го слова в запросе; wdk-вес k-го слова в документе.

  • Ранжирование ресурсов – заключается в расположении «полезных» интернет-ресурсов в верхних позициях поисковой выдачи. Эту процедуру осуществляют согласно формуле ранжирования и содержит следующие факторы: вес страницы (тИЦ, PageRank) авторитетность домена; релевантность текста запроса; релевантность текстов внешних ссылок.

Учитывая указанные факторы, важными задачами являются определение принципов построения системы анализа и продвижения интернет-ресурсов, а так же формирование рекомендаций по ее практической реализации с помощью современных технологий программирования. Об этом пойдет речь в следующих публикациях.

Добавить комментарий

Ваш адрес email не будет опубликован.

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.