Я внедрил RDFa на сайте покупок.

Теперь, как создать тройное хранилище, используя эти структурированные данные?

На сайте тысячи товаров. Таким образом, посещение каждой страницы вручную и извлечение RDF - не лучшее решение. Есть ли для этого какие-нибудь автоматические инструменты?

1
sudin 9 Апр 2014 в 09:51

2 ответа

Лучший ответ

Ответ зависит от того, как вы «реализовали RDFa». Маловероятно, что большая часть вашего контента выражена как статическая информация, поэтому также маловероятно, что большая часть вашего контента требует очистки.

Существуют инструменты, такие как D2R Server, которые предоставляют вам возможности для отображения вашего базового хранилища данных как доступного только для чтения. Конечная точка SPARQL. Единственная уловка будет заключаться в том, что у вас действительно есть статический контент и вы хотите предоставить его как автоматически сгенерированный RDF. Это потребует некоторой ловкости.

0
Rob Hall 18 Апр 2014 в 16:00

Данные в формате RDFa на вашем веб-сайте, вероятно, поступают из базы данных, где они находятся в реляционной форме, поскольку вы, вероятно, не добавляли тройки RDF в HTML вручную. Таким образом, самый простой способ поместить данные в тройное хранилище - это не из HTML, а путем некоторого преобразования исходных данных в базе данных. В конце концов, тройки RDF можно рассматривать как троичное отношение, которое может храниться в любой реляционной базе данных.

GRDDL (Сбор описаний ресурсов из диалектов языков) - это способ использования XSLT для извлечения троек RDF из HTML, если у вас нет доступа к реляционной базе данных, в которой хранятся данные. Надеюсь это поможет.

0
user152468 9 Апр 2014 в 05:57