RDF и семантическая сеть

Resource Description Framework это формат описания данных сайта. Web 3.0 нацелен полностью на отрытость сайтов, а что такое сайт, как не база данных и удобная оболочка для их показа? Прикрывшись названием "семантики" таким образом ширится движение за открытые стандарты и информацию в виде моды. Конечно же это даёт большие возможности по анализу тех или иных данных на уровне смысла.

На самом деле задача RDF решалась уже давно в создании естественных языков (но под влиянием истории и культуры) и в языках программирования (под влиянием ограничений длины кода и понимания программистом). Однако до сих пор существуют проблемы понимания.

Сравнение RDF и естественных языков
RDF Русский язык
:Earth :revolvesAround :TheSun Земля крутится вокруг Солнца
:Automobile rdfs:subClassOf :Vehicle Автомобиль - транспортное средство

Данные

База данных как известно строится на множествах (таблицах), где каждый элемент этого множества (ряд), имеет свойство (колонку). Множества взаимосвязаны между собой отношениями множественности (1:n или 1:1 или проч.).

Проблема в том что БД закрытые и извлечение данных, поиск проходит только через оболочку сайта, или через дополнительные интерфейсы RSS, SOAP. Если выложить данные в открытый доступ, или хотя-бы часть данных, то это даст возможность более свободно ими оперировать данными из других сайтов, создание mashup-сайтов, использующих чужие сервисы ускорится. В качестве доступа к такой виртуальной БД сайта существует стандарт SPARQL.

Семантика

RDF идёт дальше чем просто хранилище, он описывает взаимосвязь между элементами множеств, т.е. имеет семантику (подлежащее, сказуемое и дополнение).
В качестве формата на данный момент существует визуальное представление, N3 формат и XML-формат.

Семантика - обязательно присуща человеческому языку, естественно что в искуственных языках человек тоже пытается внедрить её для большего понимания.

Структура N3-записи
RDF Русский язык
OOP
N1 Подлежащее Переменная или класс (Variable/Class)
N2 Сказуемое Функция (Function/Class extension)
N3 Дополнение Значение переменной
или функции

Децентрализованность

В RDF ко всему можно приписать URI, что в свою очередь даёт возможность узнать об элементе побольше (а-ля href)

Так вот RDF показывает любому посетителю некое подобие базы данных и их связи между собой. Отличия и особенности:

  • Таблицы, ряды.. всё доступно не по SQL, а из обычного текстового файла. Который разумеется надо программам-агентам парсить.
  • Формат файла может быть в XML, N3..

Минусы

Несмотря на кажущуюся инновацию, разработчики web-сайтов не спешат внедрять rdf (я уж не говорю про owl). Почему?

  1. Нет общей объединяющей силы типа Google, поддержка которой стимулировала бы прирост аудитории
  2. Обычный пользователь не станет создавать rdf формат своей статьи вручную.
  3. Наивная открытость того же FOAF может спокойно привести к тому, что данные тысяч людей будут использоваться спамерами.

Ссылки

Комментарии

  • Александр Петров
    avatar В ваших примерах используется русский язык,существует ли сейчас русскоязычная база знаний, описанная при помощи RDF?
    Ответить
  • Артём Курапов
    avatar До сих пор не встречал эффектного примера. Один раз на местной конференции некто из Латвии представлял всю эту тему и использовал для поиска по сайту. Если вы сможете создавать такие отношения, то можно использовать более сложную логику - отрицания, транзитивность и тп. Конечно с исключениями. Например если есть предложение "Артём работает в Элитеке", то обратный запрос мог бы дать моё имя в поиске работников Элитека. Транзитивность видна в примерах генеалогии. Найти сына двоюродного брата, если заданы только отцы и дети.
    Ответить