Sieć pełna znaczeń

DBpedia - semantyczna Wikipedia

Sieć pełna znaczeń

Przykład zapytania SPARQL do bazy DBpedia (hasło „luxury cars” – samochody luksusowe)

DBpedia to projekt, który powstał w celu przekształcenia do postaci ustrukturyzowanych informacji zebranych w ramach internetowej encyklopedii Wikipedia. Artykuły zgromadzone w Wikipedii oprócz tekstu zawierają obiekty osadzone, jak bloki informacyjne, skategoryzowane informacje, zdjęcia, linki do zewnętrznych źródeł oraz informacje o geolokalizacji. Twórcy projektu strukturyzują te wszystkie dane w ramach nowego semantycznego zbioru. Dane zapisywane są za pomocą RDF. DBpedia zawiera obecnie 3,77 mln opisów "rzeczy" z 400 mln "faktów" w języku angielskim. Dostępna jest w 111 językach, w tym także polskim. Co ważne, nasz język znajduje się w czołówce na liście pod względem liczby zgromadzonych obiektów. W polskiej DBpedii mamy 848 tysięcy "rzeczy" i 60 mln "faktów".

Dostęp do bazy DBpedia jest możliwy poprzez liczne interfejsy. Zostały one bardzo dobrze udokumentowane na stronie projektu. Znajduje się tam także praktyczne zestawienie narzędzi dla deweloperów. Obecnie zespół DBpedii pracuje nad projektem DBpedia Live. Problem przed jakim stoją jego twórcy polega na jak najszybszym udostępnianiu danych wpisywanych do Wikipedii w formie semantycznej. Aby zapewnić jak najszybszy transfer danych do formatu czytelnego dla komputerów, opracowano wiele narzędzi konwertujących informacje z Wikipedii na żywo.

Linked Data - dostęp do danych

Na bazie źródeł danych, takich jak DBpedia z wykorzystaniem frameworków można budować systemy agentowe, które będą odpowiedzialne za odpytywanie odpowiednich źródeł danych i ich wyświetlanie użytkownikowi lub przekazujące do kolejnych aplikacji, w celu np. połączenia z innymi danymi. Liczba źródeł danych udostępnianych w otwartej formie rośnie bardzo szybko, tak samo jak połączeń między nimi. Pozwala to budować na bazie zgromadzonych w nich danych oraz wiedzy coraz bardziej zaawansowane aplikacje. O istniejących już możliwościach łatwo się przekonać odwiedzając interaktywną mapę połączonych źródeł danych, która jest dostępna w ramach projektu linkeddata.org.

Mikroformaty - semantyczne rozszerzenie HTML

W istniejących witrynach łatwo zaimplementować mechanizmy semantyczne z wykorzystaniem tzw. mikroformatów. To rodzaj "atrapy" pozwalającej na częściowe strukturyzowanie treści w ramach formatu HTML.

Podejście z wykorzystaniem mikroformatów różni się od opisanego wcześniej - tutaj tworzy się standardowe witryny, które po pierwsze mają służyć ludziom. Drugim zadaniem jest wymiana informacji między maszynami. Najpopularniejsze mikroformaty przechowują dane o artykułach, autorach, wizytówkach, geolokalizacji czy też produktach oferowanych w sklepach. Niektóre z mikroformatów mają także określoną możliwą listę wartości. Oprócz mikroformatów możliwe jest także zapisywanie RDF w atrybutach XHTML i HTML5 (RDFA - Resource Description Framework in Attributes) i wykorzystywanie bardziej złożonych ontologii.


TOP 200