Что такое парсеры и граббера и какими они бывают?

Что такое парсеры

Для начала давайте выясним, что такое parser.

Парсер – это программное средство (скрипт), основное назначение которого “собирать” информацию из посторонних источников с последующей обработкой и фильтрацией, например, контент чужого сайта для публикации на своем. Часто встречается термин “граббер”, который употребляется в том же значении, что и парсер, хотя на самом деле некоторые отличия все-таки есть. В отличии от парсера, граббер не умеет распознавать и фильтровать информацию, т.е. фактически является более простым по своему функционалу и назначению.

Применение парсеров и грабберов сегодня очень распространено на самых разнообразных сайтах и для самых разных целей. Можно привести такие примеры использования для:

  1. Поддержания актуальности информации. Например, если ваш сайт содержит информацию о курсах валют, то обновлять ее регулярно может быть накладно. Гораздо проще брать эту информацию с сайта Центробанка или другого актуального источника, обновляя ее с заданным интервалом времени. В целом же это справедливо для любой другой информации, которая имеет свойство быстро обновляться.
  2. Регулярности обновления информации. Для лучшей посещаемости сайт должен регулярно обновляться, иначе регулярные посетители сайта потеряют к нему интерес. А ведь часто бывает так, что обновить сайт вручную попросту некогда по различным причинам. В таких случаях так же актуально применение парсера данных, который будет публиковать информацию автоматически с заданной регулярностью.
  3. Быстро наполнения “новорожденных” сайтов. Каждый сайт изначально не содержит информации, а наполнение его информацией может быть длительным и трудоемким процессом. Для быстрого наполнения так же могут применяться парсеры.
  4. Централизации данных. В сети множество источников информации, которые часто разрознены. Это может быть неудобно, поэтому с помощью специальный парсеров и грабберов можно собрать всю необходимую информацию в одном месте, т.е. на одном сайте.

При использовании парсеров и грабберов не стоит забывать про авторские права на информацию и всегда обеспечивать их сохранение путем установки активной гиперссылки, если иное не предусмотрено соглашением об использовании на сайте автора.

Добавить комментарий

Ваш адрес email не будет опубликован.

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.