Semantic Web (Семантический Веб)

Semantic Web (Cемантический Веб)

Сегодня за огромных размеров, неустроенность и слабоструктурированность Веб-контента результаты поиска необходимой информации в Вебе средствами глобальных поисковых системы не всегда можно считать удовлетворительными и такой поиск часто требует значительных затрат времени пользователя. Вместе с этим, создание эффективных автоматических поисковых средств осложняется тем, что Веб был создан для обработки людьми, а не программными агентами (структура Веба, в частности HTML-код веб-страниц, имеет очень ограниченные средства классификации частей контента, хотя позволяет осуществлять его богатое визуальное представления).

«Семантический Веб» («Semantic Web») — термин, введенный изобретателем Веба Тимом Бернерс-Ли (Tim Berners-Lee). Семантика — это изучение значений. Семантический Веб — это подход к развитию Веба, который заключается в обогащении Веб-контента специализированными мета-данными и создании средств для автоматической обработки этих метаданных (интеллектуальных программных агентов), которые могли бы распознавать значение документов с целью выполнения сложных поисковых задач пользователей.

Сегодня Семантический Веб представлен следующими технологиями:

  • глобальная схема имен — URI (Uniform Resource Identifier) ​​

URI — это унифицированный идентификатор ресурсов в Вебе. Любой элемент контента, имеющий URI считается «присутствует в Вебе». Каждый объект данных и каждая схема / модель данных в семантическом Вебе должна иметь собственный URI.

  • стандартный синтаксис для описания данных — RDF (Resource Description Framework)

RDF (диалект XML) — это спецификация, которая определяет модель для представления мира и синтаксис для изменения этой модели. RDF обеспечивает стандартизированный подход к описанию различных Веб-ресурсов (Web-страниц, изображений, аудио-и видеофайлов и т.п.) и является базовым языком разметки для Семантического Веба, определяющая направленный граф отношений. Такой граф представлен тройкой «объект-атрибут-значение» (объект A имеет атрибут B со значением C). Альтернативой RDF XML является Notation3.

  • стандартный способ описания свойств данных — RDF Schema.

RDF Schema — это семантическое расширение RDF, которое обеспечивает механизм для описания групп связанных ресурсов и связей внутри этих групп.

  • стандартный способ описания связей между объектами данных — онтологии, описанные с помощью OWL Web Ontology Language

Синтаксическая взаимодействие заключается в корректном синтаксическом анализе данных и требует построения соответствий между терминами, которая в свою очередь требует анализа контента.

Анализ контента требует формальных явно заданных спецификаций моделей доменов, которые определяют использованы термины и связи между ними. Такие модели доменов называют онтологиями (ontologies). Онтологии определяют модели данных в терминах классов, подклассов и свойств.

Именно для выражения онтологий и был создан язык OWL (Ontology Working Language). OWL имеет больше средств для описания классов и свойств, чем RDF и RDF Schema, возможность описания связей между классами, количества элементов и т.п..

OWL предназначен для использования приложениями, целью которых будет проработка Веб-контента, и способствует предоставлению Веб-контента широких возможностей быть интерпретированным этими приложениями.

  • стандартный язык запросов к данным в формате RDF — SPARQL (рекурсивно: SPARQL Protocol and RDF Query Language)

Язык запросов SPARQL позволяет извлекать информацию из графов RDF. Она предоставляет средства для:

— Добыча информации в форме: URI, пустых вершин графа, типизированных или нетипизированных литералов;

— Добыча подграфов RDF;

— Создание новых графов RDF, основанных на информации из графов, в которых осуществлялись запросы.

Как язык запросов, SPARQL позволяет работать как с локальными, так и удаленными данными.

Читайте также:

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.