Sieć semantyczna lub semantyka sieciowa jest rozszerzeniem sieci Web ustandaryzowanym przez konsorcjum World Wide Web Consortium (W3C). Standardy te zachęcają do korzystania ze standardowych formatów danych i protokołów wymiany w Internecie, opartych na modelu Resource Description Framework (RDF).
Sieć semantyczna jest przez niektórych określana jako Web 3.0.
Według W3C, „Semantic Web dostarcza modelu , który umożliwia wymianę danych i ponownie między wieloma aplikacjami, firm i grup użytkowników . ” Fraza została ukuta przez Tima Berners-Lee (wynalazcę sieci i dyrektora W3C), który nadzoruje rozwój popularnych technologii sieci semantycznej. Definiuje to jako „sieć danych, które mogą być przetwarzane bezpośrednio i pośrednio przez maszyny, aby pomóc ich użytkownikom w tworzeniu nowej wiedzy” . Aby to osiągnąć, Sieć Semantyczna wdraża Sieć Danych która polega na łączeniu i porządkowaniu informacji w Internecie w celu prostego dostępu do wiedzy, którą już zawiera.
Podczas gdy jego krytycy kwestionują jego wykonalność, jego promotorzy twierdzą, że wnioski złożone przez naukowców z przemysłu , biologii i nauk humanistycznych dowiodły już słuszności tej nowej koncepcji. Oryginalny artykuł Tima Bernersa-Lee z 2001 roku w Scientific American opisał oczekiwaną ewolucję od istniejącej sieci do sieci semantycznej, ale to jeszcze się nie wydarzyło. W 2006 roku Tim Berners-Lee i jego koledzy powiedzieli: „Ten prosty pomysł… pozostaje w dużej mierze niewykorzystany. "
Pojęcie „modelowej sieci semantycznej ” zostało ukute w latach sześćdziesiątych przez kognitywisty Allana Collinsa , językoznawcę Rossa Quilliana (w) oraz psycholog Elizabeth Loftus i ujawnione w różnych publikacjach jako sposób przedstawiania ustrukturyzowanej wiedzy. Model ten, zastosowany w kontekście Internetu, rozszerza sieć hiperłączy stron internetowych czytelnych dla człowieka, umieszczając na stronach metadane odczytywane przez komputer. Te metadane są ze sobą powiązane, co pozwala agentom na bardziej inteligentny dostęp do sieci i wykonywanie zadań w imieniu użytkowników. Sieć semantyczna jest postrzegana jako brama dostępu do danych między różnymi aplikacjami i systemami. Jego zastosowania są liczne w publikacjach, blogach iw kilku innych dziedzinach.
Tim Berners-Lee pierwotnie wyraził pogląd na sieć semantyczną w następujący sposób:
Marzę o Sieci [w której komputery] będą zdolne do analizowania wszystkich danych w Sieci - treści, linków i transakcji między ludźmi a komputerami. „Sieć semantyczna”, która powinna to umożliwić, jeszcze się nie pojawiła, ale kiedy już się pojawi, codziennymi mechanizmami handlu, biurokracji i naszego codziennego życia zajmą się maszyny rozmawiające z maszynami. „Inteligentni agenci”, których ludzie zachwalali od wieków, w końcu się zmaterializują.
„Marzy mi się sieć [w której komputery] będą w stanie analizować wszystkie dane w sieci: treści, linki i transakcje między ludźmi a komputerami. „Sieć semantyczna”, która powinna to umożliwić, jeszcze się nie pojawiła, ale kiedy już się pojawi, codzienne funkcjonowanie handlu, administracji i naszego codziennego życia będą przetwarzane przez maszyny komunikujące się z innymi. „Inteligentni agenci”, o których mówiono od dawna, w końcu się zmaterializują. "
Większość technologii oferowanych przez W3C istniała już wcześniej. Są one używane w różnych kontekstach, zwłaszcza tych dotyczących informacji, które obejmują ograniczoną i zdefiniowaną domenę, i gdy udostępnianie danych jest powszechną koniecznością, np. badania naukowe lub wymiana danych między organizacjami, firmami. Ponadto pojawiły się inne technologie o podobnym przeznaczeniu, takie jak mikroformaty .
Głównym celem sieci semantycznej jest kierowanie ewolucją sieci, aby umożliwić użytkownikom bez pośredników łatwiejsze wyszukiwanie, udostępnianie i łączenie informacji. Ludzie mogą używać sieci do wykonywania zadań, takich jak znajdowanie słowa Paryż, aby zarezerwować książkę w bibliotece, znaleźć mapę i zarezerwować bilet na transport. Jednak maszyny nie mogą wykonać wszystkich tych zadań bez pomocy człowieka, ponieważ strony internetowe są przeznaczone głównie do czytania przez ludzi. Sieć semantyczna ma na celu umożliwienie indeksowania stron zarówno przez ludzi, jak i maszyny. Umożliwiłoby to żmudną i powtarzalną pracę związaną z wyszukiwaniem informacji w sposób zautomatyzowany, przy jednoczesnej poprawie i konsolidacji informacji w sieci dla jej użytkowników.
Sieć semantyczna, zgodnie z pierwotnym zamierzeniem, jest systemem, który pozwala maszynom „zrozumieć” i odpowiadać na złożone ludzkie żądania zgodnie z ich znaczeniem. Takie „zrozumienie” wymaga wcześniejszego ustrukturyzowania odpowiednich źródeł informacji. Ta struktura dostępna dla maszyn pozwala na znacznie większą zdolność wykrywania niż to, co jest możliwe po prostu w sieci dokumentów. Wykorzystanie RDF do strukturyzowania tych danych umożliwia wykorzystanie wydajności maszyny; ich zdolność do przetwarzania danych umożliwia badanie informacji uzyskanych z tych danych w celu wyciągnięcia nowych wniosków z istniejącej wiedzy. Za pomocą RDF dokumenty tworzone w HTML stają się danymi, które poprzez wspólną pracę maszyn i użytkowników wytwarzają nową wiedzę.
Często wyrażenia „ semantyka ”, „ metadane ”, „ ontologie ” i „Sieć semantyczna” są używane niekonsekwentnie. W szczególności są używane na co dzień przez badaczy i praktyków, których terminologia obejmuje szeroki krajobraz technologii, koncepcji i obszarów zastosowań. Ponadto istnieje zamieszanie między technologiami, które są rozważane w celu jego wdrożenia, a ruchem sieci semantycznej. W artykule przedstawionym przez Gerbera, Barnarda i Van der Merwe nakreślono krajobraz sieci semantycznej oraz przedstawiono krótkie podsumowanie powiązanych terminów i technologii wspomagających. Model architektoniczny zaproponowany przez Tima Berners-Lee służy jako podstawa do przedstawienia stanu obecnych i powstających technologii.
W poniższym przykładzie tekst „Paul Schuster urodził się w Dreźnie” na stronie internetowej zostanie opatrzony adnotacją poprzez połączenie osoby z jej miejscem urodzenia. Kawałek HTML kod wyświetlany poniżej pokazuje jak opisują mini-Graph użyciu standardu RDFa składni ze słownika schema.org i wikidane identyfikatora :
<div vocab="http://schema.org/" typeof="Person"> <span property="name">Paul Schuster</span> est né à <span property="birthPlace" typeof="Place" href="http://www.wikidata.org/entity/Q1731"> <span property="name">Dresde</span>. </span> </div>Ten przykład definiuje następujące pięć trójek ( in ), wyświetlanych w formacie Turtle . Każda trójka reprezentuje krawędź generowanego grafu: jej pierwszy element (temat) to nazwa węzła, od którego zaczyna się ta krawędź, drugi element (predykat) wskazuje rodzaj krawędzi, a ostatni (obiekt) jest nazwą węzła docelowego lub wartością literału (tekst, liczba itp.).
_:a <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://schema.org/Person> . _:a <http://schema.org/name> "Paul Schuster" . _:a <http://schema.org/birthPlace> <http://www.wikidata.org/entity/Q1731> . <http://www.wikidata.org/entity/Q1731> <http://schema.org/itemtype> <http://schema.org/Place> . <http://www.wikidata.org/entity/Q1731> <http://schema.org/name> "Dresde" .Wiele plików na komputerze można mniej więcej podzielić na dwie kategorie: dokumenty czytelne dla człowieka i dane czytelne dla komputera . Dokumenty takie jak e-maile , raporty czy broszury są czytelne dla człowieka. Z drugiej strony dane zawarte w kalendarzach, książkach adresowych, listach lektur czy arkuszach kalkulacyjnych są czytelne pod warunkiem korzystania z aplikacji, która umożliwia ich odczytywanie, przeszukiwanie i przekształcanie na różne sposoby.
Obecnie sieć WWW opiera się przede wszystkim na dokumentach napisanych w Hypertext Markup Language (HTML) , czyli konwencji znaczników używanej do kodowania tekstu przeplatanego obiektami multimedialnymi, takimi jak obrazy czy interaktywne formularze. Tagi metadanych zapewniają metodę, dzięki której komputery mogą kategoryzować zawartość stron internetowych; na przykład :
<meta name="keywords" content="computing, computer studies, computer" /> <meta name="description" content="Cheap widgets for sale" /> <meta name="author" content="John Doe" />Za pomocą kodu HTML i narzędzia do wyświetlania (którym może być przeglądarka internetowa lub inny „agent użytkownika” ) możesz utworzyć i zaprezentować stronę wyświetlającą przedmioty na sprzedaż. HTML dla strony katalogu można zrobić po prostu, dokument zawierający stwierdzenia takie jak "tytuł tego dokumentu to 'Gadgets Supermarket'", ale kod HTML nie jest w stanie jednoznacznie stwierdzić, że np. numer pozycji X586172 jest tabelą z ceną 199 USD , ani nie jest to produkt konsumencki. HTML może tylko powiedzieć, że zakres tekstu „X586172” to coś, co powinno znajdować się w pobliżu „Meble” i „199 € ” itp. Nie sposób powiedzieć, że „to jest strona katalogowa”, ani nawet powiedzieć, że „Meble” to rodzaj tytułu, ani nawet wiedzieć, że „199 € ” to cena. W żaden sposób nie można wyrazić, że te informacje są ze sobą połączone w celu opisania odrębnego elementu , który różni się od innych elementów, które mogą być wymienione na tej samej stronie.
Semantyczny HTML odnosi się do używania znaczników HTML do wstawiania dodatkowych informacji do dokumentu. Na przykład użycie elementu HTML deloznaczającego usuniętą zawartość, a nie striketylko wyświetlanie przekreślonego tekstu i określanie tylko jego formatowania. Semantyczny HTML pozostawia układ w przeglądarce, dodając kaskadowe arkusze stylów . Ale ta praktyka osiąga swoje granice, jeśli chodzi o precyzowanie semantyki przedmiotów, takich jak przedmioty na sprzedaż.
W mikroformaty są również nieoficjalne próby rozszerzenia HTML Składnia Urządzenie może odczytać semantycznych znaczników o obiektach w dokumencie, takich jak artykuły do sprzedania lub kontaktów (np hCard ).
Sieć semantyczna oferuje języki specjalnie zaprojektowane dla danych: RDF ( Resource Description Framework ), OWL ( Ontology Web Language ) i XML ( eXtensible Markup Language ). HTML opisuje dokumenty i powiązania między nimi. Z drugiej strony RDF, OWL i XML mogą również opisywać takie rzeczy, jak ludzie, spotkania lub części samolotu. Według Tima Bernersa-Lee „RDF jest dla danych tym, czym HTML dla dokumentów. RDF umożliwia łączenie danych z kategorią. "
Technologie te są łączone w celu dostarczenia opisów, które uzupełniają lub zastępują treść dokumentów internetowych. Treść może więc pojawiać się w postaci danych opisowych przechowywanych w bazach danych dostępnych w sieci lub poprzez znaczniki w dokumentach (poprzez HTML lub jego wariant XHTML - XML HTML -). Te dane mogą być następnie przeplatane z XML lub czasami publikowane tylko jako XML, z układem i danymi przechowywanymi oddzielnie. Opisy do odczytu maszynowego umożliwiają menedżerom treści nadawanie znaczenia ich treści, to znaczy opisywanie struktury wiedzy w treści. W ten sposób maszyna może:
Oto przykład tagu, którego można użyć na niesemantycznej stronie internetowej :
<item>cat</item>Zakodowanie podobnych informacji na semantycznej stronie internetowej może wyglądać tak:
<item rdf:about="http://dbpedia.org/resource/Cat">Cat</item>Tim Berners-Lee promuje pojawienie się powiązanej sieci danych ( dane połączone , w języku angielskim ) lub danych internetowych (w języku francuskim ) dla Giant Global Graph , w przeciwieństwie do sieci Web, która jest ogólnoświatowymi stronami HTML. Tim Berners-Lee zakłada, że jeśli w przeszłości udostępnialiśmy dokumenty, to w przyszłości będziemy udostępniać dane. Jego odpowiedź na pytanie „jak?” Opiera się na trzech filarach. Po pierwsze, adres URL musi wskazywać na dane. Po drugie, każdy, kto ma dostęp do adresu URL, powinien mieć możliwość pobierania danych. Po trzecie, relacje w danych muszą wskazywać na inne adresy URL z danymi.
Tim Berners-Lee opisał Semantic Web jako składnik Web 3.0:
Ludzie ciągle pytają, czym jest Web 3.0. Myślę, że jeśli masz nakładkę skalowalnej grafiki wektorowej – wszystko falujące, składane i wyglądające na mgliste – w Web 2.0 i dostęp do sieci semantycznej zintegrowanej na ogromnej przestrzeni danych, będziesz miał dostęp do niewiarygodnego zasobu danych .
„Ludzie cały czas pytają, czym jest Web 3.0. Wydaje mi się, że kiedy masz nakładkę rysunków wektorowych – wszystkie fale i zamglone fałdy – opisującą Web 2.0 i dostęp do sieci semantycznej osadzonej w ogromnej przestrzeni danych, będziesz miał dostęp do niesamowitego zasobu danych. "
„Sieć semantyczna” jest czasami używana jako synonim „Web 3.0”, chociaż definicja każdego terminu jest różna. Podobnie jak „Web 2.0”, „Web 3.0” to neologizm i modne hasło . W przypadku Web 2.0 użycie tego terminu jest przedmiotem dyskusji między tymi, którzy uważają, że jest to termin marketingowy bez prawdziwej zmiany, a tymi, którzy uważają, że nastąpiła prawdziwa ewolucja.
Niektóre z wyzwań Sieci Semantycznej to ogrom, niejasność, niepewność, niespójność i oszustwo. Zautomatyzowane systemy wnioskowania będą musiały odpowiedzieć na wszystkie te pytania, aby spełnić obietnicę sieci semantycznej.
Ta lista wyzwań jest bardziej ilustracyjna niż wyczerpująca, ponieważ koncentruje się na wyzwaniach warstwy „logiki unifikacji” i „dowodu” dla implementacji sieci semantycznej. Większość wymienionych tutaj technik będzie musiała rozszerzyć język OWL ( Język Ontologii Sieciowej ) na przykład, aby opisać warunkowe prawdopodobieństwo fragmentu informacji. To aktywny obszar badań.
Standaryzacja Sieci Semantycznej jest nadzorowana przez W3C .
Wyrażenie „sieć semantyczna” jest często używane bardziej konkretnie do określenia formatów i technologii, które pozwolą na jej istnienie. Zbieranie, strukturyzacja i wyszukiwanie powiązanych danych będzie działać przy użyciu technologii, które zapewnią formalny opis pojęć, terminów i relacji w danej dziedzinie wiedzy . Technologie te są standaryzowane przez W3C i obejmują w szczególności:
Semantic Web Stos jest ilustracją do reprezentowania architekturę sieci semantycznej. Funkcje i relacje komponentów można podsumować w następujący sposób:
Nadal potrzebne do wdrożenia sieci semantycznej przejść przez normy zalecenia procesie z W3C ( World Wide Web Consortium ) grup roboczych. Oznacza to, że każda nowa rekomendacja została poddana publicznej ocenie. Wówczas rekomendacje W3C, które zostaną powszechnie przyjęte, w naturalny sposób staną się standardami „Sieci semantycznej”.
Oto lista standardów i głównych zaleceń, na których opiera się Sieć Semantyczna:
Oto aktualne aktywne rekomendacje:
Z drugiej strony, wiele kroków do wdrożenia „sieci semantycznej” wciąż wymaga wyobrażenia, wyjaśnienia i sprecyzowania. Tim Berners-Lee , za pośrednictwem swojego stosu sieci semantycznej , podsumowuje te kroki w następujących warstwach:
Czekając na wdrożenie wszystkich tych warstw, już dostępne technologie, takie jak SPARQL , już umożliwiają oferowanie interoperacyjności z lepszą granulacją danych niż ta oferowana przez usługi sieciowe (W3C wycofało ponadto standaryzację usług internetowych jego priorytety ).
Zbiór źródeł danych, które udostępniają swoje dane za pomocą standardów sieci semantycznej, został nazwany Web of data (lub w języku angielskim „ Linked Open Data ”), aby ułatwić przyjęcie go przez opinię publiczną. Sieć danych jest oparta na technologiach danych połączonych , które pokrywają się z technologiami sieci semantycznej, które zostały już powszechnie przyjęte. Związany danych jest jednym z podstawowych technologii wykorzystywanych w ruchu „ otwartych danych ” w Anglii, której celem jest udział masowo danych publicznych w celu przyspieszenia badań i handlu. Pojawienie się Sieci Semantycznej jest uważane przez niektórych za kolejny przełom technologiczny, a zatem ekonomiczny, który już nazywają Siecią 3.0 .
Celem będzie zatem w przyszłości poprawa dostępu i użyteczności sieci oraz zasobów połączonych za jej pośrednictwem, takich jak:
Główna krytyka dotyczy pełnej lub nawet częściowej wykonalności sieci semantycznej. Cory Doctorow mówi o „ metacrapie ” ( portmanteau uformowane słowa metadane i bzdury , które możemy spróbować doprowadzić do władzy francuskiej przez „métamerde”), krytykę, która opiera się na sarkastycznej obserwacji ludzkiego zachowania. Na przykład ludzie mogą umieszczać pasożytnicze mikrodane na stronach internetowych, aby oszukać silniki sieci semantycznej, które będą „naiwnie” ufać prawdziwości wszystkich danych. Zjawisko to jest powszechnie znane z oszukiwania: silniki indeksujące, takie jak Google , starają się wykryć tego typu manipulacje. Peter Gärdenfors i Timo Honkela (en) zauważyli, że logika technologii sieci semantycznej obejmuje tylko ułamek zjawisk, które będą miały wpływ na semantykę sieci.
W 2001 roku Cory Doctorow sporządził listę siedmiu rzekomo niemożliwych do pokonania przeszkód w uzyskaniu metadanych wystarczająco niezawodnych, aby uruchomić możliwą sieć semantyczną. Według niego :
Obejmuje również inne przyczyny związane z dezaktualizacją metadanych:
Cory Doctorow wnioskuje, że badania nad takim systemem mogą zwracać tylko dane, które są przestarzałe i częściowo lub całkowicie niepoprawne.
Architektura, narzędzia i bardzo koncepcje Semantic Web często krytykowane, powołując się, że technologie lub procesów utrzymania jakości danych, włożonego przez człowieka i dlatego omylny, nie może jednak działać na dużą skalę. Web . Te ograniczenia to wszystkie nowe problemy, które badacze próbują obecnie rozwiązać poprzez wyzwania sieci semantycznej . Nauka internetowej (w) to nazwa dajemy do „dyscypliny”, który ma na celu rozwiązanie nowych problemów naukowych, które wydobywa z sieci. Jednak technologie sieci semantycznych zostały zaadoptowane w społecznościach specjalizujących się we wdrażaniu systemów informatycznych, ale głównie w systemach zamkniętych (np. intranet ), takich jak firmy czy biblioteki.
Entuzjazm dla Sieci Semantycznej może być łagodzony względami takimi jak odmowa cenzury i chęć ochrony prywatności . Na przykład, obecnie można łatwo nakłonić analizatorów tekstu do używania innych słów, metafor lub używania obrazów zamiast słów. Rządom o wiele łatwiej jest wizualizować, a tym samym kontrolować, tworzenie informacji online, jeśli wykorzystuje ona strukturę semantyczną, ponieważ informacje są wtedy znacznie łatwiejsze do interpretacji i ewentualnie blokowania za pomocą zautomatyzowanego systemu. Dodatkowo problem został podniesiony przez wykorzystanie metadanych, takich jak FOAF czy Geolokalizacji API (as) , które kwestionują anonimowość World Wide Web . Obawy te sprawiają, że bezpieczeństwo danych osobowych jest aktywnym tematem badań, jak w projekcie „ Policy Aware Web ”.
Inny recenzent mówi o wydłużeniu czasu potrzebnego na tworzenie i publikowanie treści ze względu na konieczność wytworzenia dwóch jej wersji: jednej do oglądania przez ludzi, a drugiej do maszyn. Jednak wiele aplikacji internetowych już boryka się z tym problemem, tworząc czytelny format dla przeglądarki internetowej lub na żądanie czytnika RSS, takiego jak blog . Reakcją na tego rodzaju krytykę był rozwój mikroformatów . W swojej obronie sieć semantyczna prawdopodobnie zmniejszy wysiłek związany z zadaniami wyszukiwania informacji, a tym samym zrekompensuje dodatkowy koszt zapewnienia kompatybilnego formatu dla maszyn.
Jednym z pierwszych rozwiązań było wykorzystanie języka GRDDL , mechanizmu, który wykorzystuje tylko zawartość już obecną na stronie HTML (z potencjalnie mikroformatami) do wyodrębnienia z niej RDF. Jednak wielość i niestabilność mikroformatów, a także trudności w stworzeniu konwertera XSLT dla GRDDL doprowadziły do określenia RDFa w celu prostej i wyraźnej integracji RDF ze stronami HTML . Metoda RDFa zostanie również zintegrowana bezpośrednio ze standardem HTML5 poprzez mikrodane , co jeszcze bardziej uprości wstawianie danych RDF do dokumentu.
W tej sekcji wymieniono niektóre z wielu projektów i narzędzi, które istnieją w ramach ruchu Semantic Web.
Rozwój sieci semantycznej na całym świecie jest monitorowany przez W3C w ramach projektu Semantic Web Advanced Deployment ( SWAD ). Projekt SWAD -Europe odbył się zmaj 2002 w październik 2004.
Europejską organizacją goszczącą projekty W3C i monitorującą postęp sieci semantycznej jest ERCIM ( Europejskie Konsorcjum Badawcze ds. Informatyki i Matematyki ).
Biblioteka Narodowa Francji wprowadzeniu Semantic Web poprzez data.bnf.fr projektu . Projekt ten integruje dane wytworzone w różnych formatach, w tym Intermarc, XML-EAD i Dublin Core , na potrzeby biblioteki cyfrowej. Dane są modelowane i pogrupowane według automatycznym przetwarzaniem i publikowane w różnych RDF normami : RDF-XML, RDF-N3 i RDF-NT. Istnieje również publikacja danych w formacie JSON . Projekt wykorzystuje semantyczną platformę programistyczną CubicWeb .
Biblioteka Narodowa Francji zapewnia zatem:
W 2013 roku, projekt wspólny Nagrodę Stanford innowacji w Bibliotek Naukowych (SPIRL) z galijskiego .
Od 2017 roku model danych data.bnf.fr opiera się na koncepcyjnym modelu referencyjnym IFLA LRM , co pozwala na nawigację po relacjach między podmiotami.
DBpedia jest pierwszą historyczną próbą publikowania uporządkowanych danych pochodzących z Wikipedii : dane są pobierane ze stron, a w szczególności z pól informacyjnych Wikipedii publikowanych w RDF i udostępnianych w Internecie danych za pośrednictwem HTTP i SPARQL na licencji GFDL . .
SemanticPedia to platforma do publikowania danych z różnych projektów Wikimedia w języku francuskim, wspierana przez Ministerstwo Kultury i Komunikacji , Inria i Wikimedia France . Francuska wersja DBpedia została opracowana przez zespół Wimmics pod kierownictwem Fabiena Gandona w centrum badawczym Inria Sophia Antipolis. Ten francuskojęzyczny rozdział nosi nazwę DBpedia.fr i przyczynia się do umiędzynarodowienia inicjatywy DBpedia, wydobywając i publikując dane z różnych rozdziałów językowych Wikipedii . Ten francuski rozdział DBpedii obsługuje wiele aplikacji. Minister Kultury Francji Aurélie Filippetti ogłosiła announced19 listopada 2012 r. że następny projekt będzie dotyczył Wikisłownika i jego dwóch milionów terminów.
Wikidata to jeden z projektów Fundacji Wikimedia. Jego celem jest bezpłatne udostępnienie wszystkich ustrukturyzowanych danych wszystkich projektów fundacji współpracownikom bez żadnego pośrednika.
Wikipedia jest jednym z projektów powiązanych z Wikidata. Każdy artykuł Wikipedii ma teraz unikalny identyfikator w postaci IRI i jest podmiotem w społeczności Wikidata. Każda jednostka składa się z kilku właściwości z jedną lub większą liczbą wartości (trójek). Te jednostki i właściwości są oznaczone unikalnym identyfikatorem (na przykład: Q90 jest unikalnym identyfikatorem Paryża), dzięki czemu baza danych jest niezależna od używanego języka. Wartością tych właściwości może być inna jednostka, ale także ciąg, liczba, data itp. Dane ustrukturyzowane w ten sposób mogą być ponownie wykorzystywane w różnych formatach (XML, JSON, Turtle itp.) i ostatecznie mogą być wykorzystane do zasilania infoboksów Wikipedii, dzięki czemu unika się konieczności ich ręcznego modyfikowania we wszystkich językach, ponieważ za każdym razem, gdy Wikidane są modyfikowane , wszystkie infoboksy są modyfikowane w tym samym czasie.
Dane Wikidata są objęte licencją CC0 . Wszystkie udostępniane dane są zatem bezpłatne i otwarte dla wszystkich rodzajów użytkowania.
W przypadku sieci semantycznej Wikidata jest jednym z niewielu punktów końcowych SPARQL połączonych w czasie rzeczywistym z producentami danych. Oznacza to, że zmiany w Wikidanych natychmiast wpływają na bazę danych RDF, a tym samym pozwalają na ponowne wykorzystanie tych danych w innych aplikacjach za pośrednictwem SPARQL. Pod względem ontologicznym struktura jest budowana w czasie w sposób zgodny między współtwórcami. Struktura tej ontologii może zatem zmieniać się w dowolnym momencie, zgodnie z potrzebami współtwórców.
AKSW ( Agile wiedzy inżynierskiej i Semantic Web ) to grupa badawcza, która jest prowadzona przez betriebliche Informationssysteme ( BIS ) Krzesłoz Institut für Informatik ( IFI ) na Uniwersytecie w Lipsku, jak również przez Institute for Applied Computing ( INFAI ) . Grupa badawcza AKSW uruchomiła szereg projektów, takich jak DBpedia.
Datalift to oryginalna platforma przeznaczona do eksploatacji danych, która integruje w jednym rozwiązaniu open source wszystkie funkcje przydatne do łączenia danych, od ich przechwytywania do ostatecznej publikacji. W Datalift dane wejściowe to surowe dane pochodzące z heterogenicznych formatów (bazy danych, CSV, XML, RDF, RDFa, GML, Shapefile ...). Wytworzone dane są danymi połączonymi. Platforma Datalift aktywnie uczestniczy w transformacji z sieci do sieci danych .
FOAF (ang. Friend Of A Friend ) to słownictwo, które wykorzystuje RDF do opisania relacji, jakie ludzie mają z innymi ludźmi oraz „rzeczy” wokół nich. FOAF jest przykładem próby wykorzystania przez sieć semantyczną relacji w kontekście społecznym.
Semantycznie połączone społeczności internetowe (SIOC)SiOC jest słownictwo opisujące obiekty powszechnie używane w serwisach społecznościowych i ich związkach.
Sieć danych oferuje rozwój nowych zastosowań, które ukonkretniają pojęcie inteligencji zbiorowej, takie jak: