Poprzednia

ⓘ Semantic Web




Semantic Web
                                     

ⓘ Semantic Web

Semantic Web – projekt, który ma przyczynić się do utworzenia i rozpowszechnienia standardów opisywania treści w Internecie w sposób, który umożliwi maszynom i programom przetwarzanie informacji w sposób odpowiedni do ich znaczenia. Wśród standardów sieci semantycznych znajdują się m.in. OWL, RDF, RDF Schema. Znaczenia zasobów informacyjnych określa się za pomocą tzw. ontologii.

Sieć semantyczna jest wizją Tima Bernersa-Lee twórcy standardu WWW i pierwszej przeglądarki internetowej, a także przewodniczącego W3C. W swoich założeniach sieć semantyczna ma korzystać z istniejącego protokołu komunikacyjnego, na którym bazuje dzisiejszy Internet. Różnica miałaby polegać na tym, że przesyłane dane mogłyby być rozumiane także przez maszyny. Owo rozumienie polegałoby na tym, że dane przekazywane byłyby w postaci, w której można by powiązać ich znaczenia między sobą a także w ramach odpowiedniego kontekstu.

Informacje przekazywane w ramach sieci semantycznej wymagałyby nie tylko samych danych, ale także informacji o tychże tzw. meta-danych. To właśnie meta-dane zawierałyby sformułowania dotyczące relacji między danymi oraz prawa logiki, które można do nich zastosować. Dzięki temu można by:

  • przeprowadzać na tychże danych wnioskowania, tzn. otrzymywać informacje na ich temat, które nie są zawarte explicite
  • rozróżnić dane, które dla maszyn są w tej chwili nierozróżnialne ze względu na identyczny zapis tekstowy np. zamek - urządzenie do zamykania drzwi; urządzenie do łączenia w ustalonym położeniu elementów ubrania; okazała budowla mieszkalno-obronna
  • powiązać różne dane znajdujące się w Internecie w ramach wspólnych jednostek znaczeniowych
                                     

1. Techniczne podstawy sieci semantycznych

Semantic Web zbudowany ma być na bazie już istniejących, wykorzystywanych i sprawdzonych standardów internetowych, nadbudowanych przez kilka kolejnych standardów. Ponieważ każdy kolejny standard nakłada się na kolejny, dotycząc innego poziomu abstrakcji, toteż ochrzczone zostały one mianem warstwowego placka ang. layer cake. Inne popularne ich określenie to semantyczny stos ang. semantic stack.

Kolejne warstwy placka prezentują się następująco od dołu:

  • RDF i RDF Schema
  • XML i XML Schema
  • mechanizmy wnioskowania
  • URI
  • OWL
  • Unicode
  • mechanizmy certyfikacji i zaufania
                                     

1.1. Techniczne podstawy sieci semantycznych Unicode

Unicode jest standardem pozwalającym na wyrażenie w języku maszyn dowolnego znaku pisanego, dowolnego języka znanego na Ziemi. Standard ten rozwiązuje problem niedogodności związanych z prymatem w świecie komputerów podstawowego alfabetu łacińskiego

                                     

1.2. Techniczne podstawy sieci semantycznych URI

URI jest standardem zapewniającym unikatowość zasobów internetowych. Ponieważ wszystkie dane przesyłane w ramach Semantic Web będą zasobami internetowymi, będą one wymagały także określenia dla nich identyfikatora. Identyfikator będzie mógł składać się właśnie z zestawu znaków Unicode.

                                     

1.3. Techniczne podstawy sieci semantycznych XML i XML Schema

XML jest standardem pozwalającym w ogólności na zapis danych.

Schematy XML wprowadzają ograniczenia dotyczące typu i struktury danych. Zachowanie typu i struktury daje gwarancję, że dane XML są poprawne w sensie syntaktycznym

                                     

1.4. Techniczne podstawy sieci semantycznych RDF i RDF Schema

RDF jest standardem, który pozwala na zapis danych w postaci grafu skierowanego. W grafie tym dane zawarte są w wierzchołkach a relacje pomiędzy nimi i własności tychże znajdują się w krawędziach.

Schematy RDF wprowadzają do grafów takie pojęcia jak klasy i podklasy, pozwalające na wspólne grupowanie danych mających cechy wspólne. Dowolna dana może znajdować się w wielu klasach.

                                     

1.5. Techniczne podstawy sieci semantycznych OWL

OWL jest standardem pozwalającym na definiowanie klas na podstawie własności danych, a także na definiowanie logicznych charakterystyk relacji. OWL jest więc standardem formalnie zapisującym ontologię.

Przykład:

Mając daną klasę Człowiek, a także posiadając w jej zbiorze relację jest mężem, chcielibyśmy określić klasę Małżonek dla czytelności przykładu, uznajemy definicję męża zgodną z polskim stanem prawnym.

Otóż małżonkiem jest zarówno dana, której podmiotem jest relacja jest mężem, jak i dana, której przedmiotem jest dana relacja.

Relację jest mężem możemy też dość dokładnie określić. Jest to relacja funkcjonalna. Jest ona też odwrotnie funkcjonalna przedmiot tej relacji ma co najwyżej jeden podmiot. Nie jest ona przechodnia tzn. nie ma takiej własności, że jeśli A jest mężem B a B jest mężem C to A jest mężem C, posiada natomiast relację odwrotną. Tą relacją jest żoną każdy A, który jest mężem B będzie spełniać następującą relację: B jest żoną A.



                                     

1.6. Techniczne podstawy sieci semantycznych Mechanizmy wnioskowania

Język OWL pozwala na definiowanie zależności między danymi, dzięki czemu można przeprowadzać wnioskowanie. Jednakże osobną sprawą jest przygotowanie odpowiednich mechanizmów, które takie wnioskowanie przeprowadzą poprawnie, a jednocześnie w odpowiednio szybkim czasie. Program, przeprowadzający wnioskowanie nosi miano reasonera brak polskiego odpowiednika - w wolnym tłumaczeniu wnioskujący. W tej chwili zaawansowanie techniczne reasonerów jest wciąż ograniczone i przeprowadzanie wnioskowań nawet na nieskomplikowanych ontologiach trwa zbyt długo jak na uwarunkowania Internetu.

                                     

1.7. Techniczne podstawy sieci semantycznych Mechanizmy certyfikacji i zaufania

Istnieją w tej chwili w sferze rozważań teoretycznych. Mechanizmy te pozwoliłyby na zestandaryzowanie i rozwiązanie problemów autoryzacji użytkowników, identyfikacji ich zasobów, a także określenia praw, na jakich te zasoby są przesyłane i mogą być udostępniane.

Koncepcja projektu została opisana m.in. w książce pt. "Semantic Web" autorzy: Michael C. Daconta., Leo Obrst, Kevin Smith.

                                     

2. Korzyści z takiej reprezentacji wiedzy

Dzięki standaryzacji możliwa stanie się swobodna wymiana danych oraz formalizacja i unifikacja dotychczasowej już zelektronizowanej wiedzy. Dzięki dobrze określonym strukturom reprezentacji komputer będzie mógł w łatwiejszy oraz bardziej trafny sposób wyszukiwać informacji lub nawet wnioskować w poszukiwaniu nowych faktów i powiązań.

Wyobraźmy sobie, że szukamy w Internecie informacji o jakiejś konkretnej grupie ludzi. Standardowym zachowaniem jest wpisanie w wyszukiwarkę internetową nazwiska tych osób oraz analiza wyników wyszukiwania pod kątem oceniania czy znaleźliśmy rzeczywiście szukane osoby. Jeśli jednak wyszukujemy w informacjach opisanych siecią semantyczną możemy pytać o osoby wskazując jakiś konkretny, bardzo szczegółowy fakt, np. "dyrektorzy przychodni lekarskich" i w wyniku otrzymamy kompletną listę spełniającą zapytanie.