Ontologije in tehnologije semantičnega spleta

Dejan Lavbič
Univerza v Ljubljani
Fakulteta za računalništvo in informatiko

Vsebina predstavitve (1)

 Uvod
 Dilema Web 1.0, Web 2.0, Web 3.0
 Semantični splet
 Različni pogledi in pričakovanja
semantičnega spleta
 Najbolj odmevni produkti semantičnega
spleta v letu 2008
 Ogrodja in orodja


 Jeziki semantičnega spleta
 RDF
○ Porazdelitev podatkov na svetovnem spletu
○ RDF sintaksa
○ Arhitektura aplikacij semantičnega spleta
○ Poizvedovanje po RDF s pomočjo SPARQL
○ Sklepanje v RDF


 Jeziki semantičnega spleta
 RDF/S
○ Funkcija sheme
○ Prenos razmerij
○ Tip podatkov
○ Vzorci modeliranja
 OWL
○ Osnovni gradniki (RDF/S Plus)
○ Ostale funkcionalnosti
○ Uporaba


 Dobre in slabe prakse modeliranja
 Kam naprej?

Uvod
Dilema Web 1.0, Web 2.0, Web 3.0, Semantični splet

 Je splet eden ali jih je več?
 Ali je številčenje različic spleta zgolj
marketinška poteza?

Uvod
Enostavna opredelitev (1)

 Web 1.0
 branje
Web
 Web 2.0 3.0
 branje
Web
 pisanje 2.0
 Web 3.0 Web
 branje 1.0
 pisanje
 izvajanje

Uvod
Yahoo-jeva formula 4 C-jev (2)

 Web 3.0 = (4C + P + VS)
 kjer velja …
○ 3C = Content, Commerce, Community
(vsebina, trgovanje, skupnost)
○ 4. C = Context (kontekst)
○ P = Personalization (personifikacija)
○ VS = Vertical Search (vertikalno iskanje)

Uvod
Enostaven primer

 Web 1.0  nakup juhe Cao Lâu
 Web 2.0  juho kuhamo sami doma in
povabimo prijatelje
 Semantični splet 
planirana večerja in
upoštevanje dejstev, da je
Pia alergična na gluten,
Vasilij je do četrtka
nedosegljiv in Andrej je
vegetarijanec

Semantični splet
 Trenutna različica svetovnega spleta:
 mnoţica med seboj povezanih dokumentov.
 Ideja semantičnega spleta:
 izboljšati trenutni splet,
 računalniki podatke procesirali,
interpretirali in povezovali,
 pomagali ljudem pri iskanju
znanja,
 vzpostavitev skupnega ogrodja.

Semantični splet
Sklad tehnologij
Uporabniški vmesniki in aplikacije

Zaupanje

Sklepanje, dokazovanje

Poenotena logika

Ontologije (OWL) Pravila (RIF/SWRL)

Kriptografija
Poizvedovanje
(SPARQL)
Taksonomije (RDF/S)

Izmenjava podatkov (RDF)

Sintaksa podatkov (XML) Imenski prostor (XML shema)

Identifikatorji (URI) Nabor znakov (UNICODE)

Različni pogledi in pričakovanja
 Splet podatkov, predstavljenih v RDF ali
OWL,
 RDF zamenjajo mikroformati,
 Spletne storitve –
umetna inteligenca,
 uporabniška
vrednost.

Potrošnik in organizacija

 Potrošnik – išče se “killer application”
 otipljiva, enostavna aplikacija, ki
prinaša dodano vrednost,
 akademsko okolje  gospodarstvo.
 Organizacije – bolj tehnična usmeritev
 semantične tehnologije  inteligenca 
trţenje  “naši produkti so boljši in
pametnejši, ker uporabljamo semantični splet”
 standardizacija komunikacije (RDF), temelji na
XML in ima dobro osnovo za opredelitev
semantike

Iskalne tehnologije

 Eden večjih potencialov uporabe
semantičnega spleta.
 Napredek opazen pri dveh konkurentih:
○ Hakia,
○ Powerset.

 A ni dovolj že Google?
 Zmagovalna kombinacija
 semantika + inovativna predstavitev + sledenje
uporabniku

Najboljši SW produkti 2008 (1)

Rešitev Opis
SearchMonkey Razvijalcem omogoča gradnjo aplikacij na podlagi
(Yahoo!) iskalne platforme Yahoo! ter objavljanje
strukturiranih podatkov, uporaba semantičnih
oznak (mikroformati, RDF), standardiziranih XML
virov, API-jev in luščenje podatkov iz spletnih
strani.

http://developer.yahoo.com/searchmonkey/
Powerset Spletni iskalnik, ki temelji na naravnem jeziku.
(Microsoft)
http://www.powerset.com/


Rešitev Opis
Open Calais Paket orodij, ki omogoča uporabnikom
(Thomson Reuters) vključevanje semantičnih funkcionalnosti znotraj
blogov, sistemov za obvladovanje vsebine,
spletnih strani ali aplikacij.

http://www.opencalais.com/

Dapper Opredeli področje na spletni strani, kjer se prikaţe
MashupAds naslov filma in sedaj prikazuje oglasno sporočilo,
ki je povezano s poljubnim filmom, ki je povezan z
omenjeno stranjo.

http://www.dapper.net/mashupads/


Rešitev Opis
Hakia Spletni iskalnik, ki temelji na procesiranju
naravnega jezika in poskuša vrniti smiselne
rezultate iskanja.

http://www.hakia.com/
TripIt Aplikacija za obvladovanje načrtovanja potovanj.

http://www.tripit.com/
BooRah Spletna stran z ocenami restavracij, ki temelji na
analizi blogov s področja prehrane. Iz opisov zna
prepoznati hvala in kritiko in na ta način oceniti
restavracijo.

http://boorah.com/


Rešitev Opis
BlueOrganizer Vrne dodatne informacije o spletni strani, ki jo
(AdaptiveBlue) pregledujemo in ponudi uporabne povezave glede
na temo spletne strani.

http://www.adaptiveblue.com/
Zemanta Orodje za pomoč pri pisanju blogov, kjer lahko
dodamo povezane podatke posameznim
zapisom.

http://www.zemanta.com/
UpTake Poenostavlja proces rezervacije potovanj preko
spleta.

http://www.uptake.com/

Ogrodja in orodja
Protégé

 Odprtokodni urejevalnik ontologij in
ogrodje za obvladovanje znanja.
 http://protege.stanford.edu
 Eden najbolj
priljubljenih orodij
 Razširljiv s pomočjo
zavihkov

Ogrodja in orodja
Jena

 Odprtokodno ogrodje za manipulacijo z
ontologijami
 http://jena.sourceforge.net
 Uporablja se tudi v orodju Protégé
 Podpora sklepanju:
 tranzitivno,
 RDF/S,
 OWL,
 generična pravila.

Jeziki semantičnega spleta

Zaupanje


Poenotena logika


Kriptografija
Poizvedovanje
(SPARQL)
Taksonomije (RDF/S)




RDF
Porazdelitev podatkov na svetovnem spletu (1)

 Različne strategije za porazdelitev
podatkov na svetovnem spletu
 Del podatkov predstavljen na enem
računalniku, ostali pa na drugih računalnikih.
 Strategije
 pristop po vrsticah,
 pristop po stolpcih in
 pristop po celicah.

RDF
Porazdelitev podatkov na svetovnem spletu (2)

ID Naslov Avtor Tip Leto
1 Otelo William Shakespeare tragedija 1603
2 Hamlet William Shakespeare tragedija 1604
3 Pohujšanje v dolini Ivan Cankar drama 1908
šentflorjanski
4 Bela krizantema Ivan Cankar esej 1910
5 Hlapec Jernej in Ivan Cankar povest 1907
njegova pravica
6 Čaša opojnosti Oton Ţupančič pesem 1899
7 Zdravljica France Prešeren pesem 1844
8 Sonetni venec France Prešeren pesem 1834

RDF
Pristop po vrsticah

 Vsak računalnik skrbi za določene vrstice.
 Porazdelitev prostorske zahtevnosti.

Potrebujemo skupno shemo,
da določimo stolpce.

6 Čaša opojnosti Oton Župančič pesem 1899

1 Otelo William Shakespeare tragedija 1603
4 Bela krizantema Ivan Cankar esej 1910

2 Hamlet William Shakespeare tragedija 1604
3 Pohujšanje v dolini šentflorjanski Ivan Cankar drama 1908
8 Sonetni venec France Prešeren pesem 1834

RDF
Pristop po stolpcih

 Vsak računalnik skrbi za določene stolpce.
 Enostavno dodajanje novih podatkov o entitetah.

Potrebujemo referenco na entiteto,
da povemo o kateri govorimo.

Avtor Leto Tip Naslov
William Shakespeare 1603 tragedija Otelo
William Shakespeare 1604 tragedija Hamlet
Ivan Cankar 1908 drama Pohujšanje v dolini šentflorjanski
Ivan Cankar 1910 esej Bela krizantema
Ivan Cankar 1907 povest Hlapec Jernej in njegova pravica
Oton Župančič 1899 pesem Čaša opojnosti
France Prešeren 1844 pesem Zdravljica
France Prešeren 1834 pesem Sonetni venec

RDF
Pristop po celicah (1)

 Vsak računalnik skrbi za določene celice.
 Zdruţitev prej omenjenih pristopov.

Potrebujemo tako skupno shemo kot
referenco na entiteto.

Tip
Vrstica 5 povest Naslov
Leto
Vrstica 5 Hlapec Jernej in njegova pravica
Vrstica 7 1844

Avtor
Vrstica 8 France Prešeren

Naslov
Vrstica 6 Čaša opojnosti

RDF
Pristop po celicah (2)

 Prilagodljivost pristopa po celicah je potrebna
za AAA slogan, ki je zelo pomemben del
semantičnega spleta:
 Moţnost vseh sodelujočih, da izrazijo svoje
mnenje o poljubni temi.
○ Anyone can say Anything about Any topic (AAA)

 Zato se pri jeziku RDF uporablja pristop po
celicah.

RDF
Sintaksa (1)

 Osnovni gradnik je trojček (ang. triple), ki je v
obliki (osebek, predikat, predmet).
 Dodana vrednost je pri mnoţici trojčkov, ki
opisujejo isto entiteto  Ivan Cankar

gradimo semantično naslov
naslov

Bela krizantema
mreţo. naslov

Hlapec Jernej in njegova pravica

Pohujšanje v dolini šentflorjanski

Osebek Predikat Predmet
LD:IvanCankar LD:naslov LD:BelaKrizantema
LD:IvanCankar LD:naslov LD:HlapecJernejInNjegovaPravica
LD:IvanCankar LD:naslov LD:PohujsanjeVDoliniSentflorjanski

RDF
Sintaksa (2)

 Imenski prostor in okrajšave:
 LD:IvanCankar
 http://amor.fri.uni-lj.si/dejan/SW/tutorial/
LiterarnaDela.owl#IvanCankar
 :IvanCankar
 Vnaprej opredeljeni imenski prostori (W3C):
 xsd, xlmns, rdf, rdfs, owl

RDF
Tabelarični podatki (1)

 Tabela literarnih del, ki jih ţelimo zapisati v
RDF obliki.
 Vsaka vrstica je enolična entiteta.
○ ID uporabimo za enolični identifikator.
○ Vsaka celica je svoj RDF zapis.
○ Poskrbimo za ustrezne tipe.

RDF

 Vsaka celica je svoj RDF zapis.
LD:LiterarnoDelo1 LD:naslov Otelo
LD:LiterarnoDelo1 LD:avtor William Shakespeare
LD:LiterarnoDelo1 LD:tip tragedija
LD:LiterarnoDelo1 LD:leto 1603
LD:LiterarnoDelo2 LD:naslov Hamlet
LD:LiterarnoDelo2 LD:avtor William Shakespeare
LD:LiterarnoDelo2 LD:tip tragedija
LD:LiterarnoDelo2 LD:leto 1604
… … …

RDF

 Poskrbimo za ustrezne tip.
LD:naslov rdf:type rdf:Property
LD:avtor rdf:type rdf:Property
LD:tip rdf:type rdf:Property
LD:leto rdf:type rdf:Property
LD:LiterarnoDelo1 rdf:type LD:LiterarnoDelo
LD:LiterarnoDelo2 rdf:type LD:LiterarnoDelo
… … …

RDF
Primer

 http://amor.fri.uni-lj.si/dejan/SW/tutorial/
LiterarnaDela.owl

RDF
Arhitektura aplikacij semantičnega spleta (1)

 Večino komponent je moţno dobiti v
komercialni ali odprtokodni različici:
 RDF razčlenjevalnik/serializator,
○ Razčlenjevalnik prebere podatke in jih predstavi v
obliki trojčkov.
○ Serializator izvaja obraten proces.
 RDF shramba podatkov,
○ Triplestore-i, ki so podatkovne baze, optimizirane za
shranjevanje in poizvedovanje po RDF trojčkih.
 RDF stroj za poizvedovanje,
○ Podatki na podlagi strukturiranih poizvedb.

RDF
Arhitektura aplikacij semantičnega spleta (2)

 Primeri RDF shramb:
 Jena SDB (SPARQL, 650 mil. trojčkov),
 Jena TDB (SPARQL, dodatki, 1,7 mrd. trojčkov),
 Joseki (HTTP, SPARQL),
 Sesame (fleksibilen, sklepanje)
 OWLIM (SAIL dodatek za Sesame)
○ SwiftOWLIM (interni spomin, zelo hiter),
○ BigOWLIM (neposredna persistenčna raven, 3 mrd.
trojčkov).

RDF
Poizvedovanje s SPARQL (1)

 Dostop do podatkov v aplikaciji semantičnega
spleta je s pomočjo poizvedovalnega jezika
SPARQL.
 Temeljili bomo na primeru literarnih del.
Otelo Hamlet Čaša opojnosti

naslov naslov naslov

Anne Hathaway .porocil. William Shakespeare Oton Župančič

France Prešeren Ivan Cankar
naslov
naslov naslov
naslov
Bela krizantema
Zdravljica Sonetni venec naslov

Hlapec Jernej in njegova pravica

Pohujšanje v dolini šentflorjanski

RDF

 Vprašajmo se naslednje:
 “Poišči osebo, ki je z nekom poročena in je med
drugim napisala Otelo”
 V obliki vzorca grafa je to:
{ ?oseba1 :porocil ?oseba2 .
?oseba1 :naslov :Otelo . }

Otelo Hamlet
:Otelo

naslov naslov naslov

?oseba2 .porocil. ?oseba1
Anne Hathaway .porocil. William Shakespeare

RDF

 Presenetljivo nam poizvedba vrne prazen
rezultat.
 Pojavi se zaradi
semantične neizraznosti Otelo Hamlet

jezika RDF (to bomo naslov naslov

popravili pri jeziku OWL). Anne Hathaway .porocil. William Shakespeare

Vzorec grafa SPARQL rezultat
{ ?oseba1 :porocil ?oseba2 . brez rezultatov
{{?oseba1 :porocil ?oseba2} UNION ?oseba1 = William Shakespeare
{?oseba2 :porocil ?oseba1} . ?oseba2 = Anne Hathaway

RDF
Primer SPARQL poizvedbe

LiterarnaDela.owl

RDF
Sklepanje (1)

 Mehanizem sklepanja
 lepilo, ki drţi skupaj semantični splet
 ob upoštevanju AAA slogana, je to način,
kako informacije poveţemo med sabo,
 predpostavka odprtega sveta.
 Več vrst trojčkov
 opredeljeni – zapisani v RDF modelu
 izpeljani – do njih pridemo z mehanizmom
sklepanja

RDF
Sklepanje (2)

 Primer
 Kupujemo srajco tipa Chamois.
 Iščemo po kategoriji srajca, a jo kasneje najdemo
v kategoriji tr:MoškoOblačilo

srajca tipa
tr:Srajca
Henley.
tr:SrajcaSKratkimiRokavi tr:SrajcaTipaHenley tr:SrajcaTipaOxford
 Kako naredimo
iskanje tr:SrajcaChamoisHenley tr:SrajcaKlasicniOxford

pametnejše?

RDF
Primer sklepanja v RDF

MoskaOblacila.owl

Kaj smo spoznali?

Zaupanje


Poenotena logika


Kriptografija
Poizvedovanje
(SPARQL)
Taksonomije (RDF/S)




RDF/S
Funkcija sheme (1)

 Številne uspešne sheme iz prakse:
 XML shema
○ Ugotoviti ali izbrani XML dokument ustreza shemi.
 Shema podatkovne baze
○ Podatki o glavi in ključni podatki o relacijskih tabelah.
○ Vsi podatki, ki nakazujejo pomen so v shemi in so
neodvisnih od relacij.
 Razredni diagrami
○ Opisujejo podatke in omogočajo sistematičen način
opisovanja podatkov in transformacij za te podatke.

RDF/S
Funkcija sheme (2)

 Vse sheme imajo skupno:
 povedo nekaj o podatkih, izraţenih v sistemu,
 predstavljajo podatke o podatkih.
 Namen RDF sheme (RDF/S):
 podatkom dodati pomen,
 način, s katerim to doseţemo, je mehanizem
sklepanja.

RDF/S
Prenos razmerij z rdfs:subClassOf (1)

 Najbolj osnoven prenos razmerij je z
gradnikom podrazred rdfs:subClassOf
 Primer
 Imamo igralca Union Olimpije, ki je tudi igralec lige
UPC in podatek, da je Miha Zupan igralec Union
Olimpije.
○ Pričakujemo, da bomo sposobni izpeljati, da je Miha
Zupan tudi igralec lige UPC.
○ Kako je to izvedljivo v RDF/S?

RDF/S
Prenos razmerij z rdfs:subClassOf (2)

 Zapišemo dejstva
:IgralecUnionOlimpije rdfs:subClassOf :IgralecLigeUPC .
:MihaZupan rdf:type :IgralecUnionOlimpije .

 Upoštevamo pravilo od prej
ČE (?A rdfs:subClassOf ?B) IN (?x rdf:type ?A)
POTEM (?x rdf:type ?B)

 S pomočjo mehanizma sklepanja ugotovimo
:MihaZupan rdf:type :IgralecLigeUPC .

RDF/S
Prenos razmerij z rdfs:subPropertyOf (1)

 Za povezovanje razredov uporabljamo
lastnosti, kjer nam RDF/S ravno tako
omogoča mehanizem za opredelitev hierarhije
s pomočjo rdfs:subPropertyOf
 Primer
 Zaposlovanje ljudi v večjem podjetju, kjer imamo
številna zaposlitvena razmerja.
 Kako lahko s pomočjo mehanizma sklepanja
ugotovimo izvedena zaposlitvena razmerja?

RDF/S

 Dejstva o :delaZa

zaposlitvenih :delaPogodbenoZa :jeZaposlenPri

razmerij lahko :delaNaCrnoZa :delaPrekoAHZa

zapišemo kot:

:delaNaCrnoZa rdfs:subPropertyOf :delaPogodbenoZa .
:delaPrekoAHZa rdfs:subPropertyOf :delaPogodbenoZa .
:delaPogodbenoZa rdfs:subPropertyOf :delaZa .
:jeZaposlenPri rdfs:subPropertyOf :delaZa .

RDF/S

:delaZa

 Dodajmo še nekaj :delaPogodbenoZa :jeZaposlenPri

primerov: :delaNaCrnoZa :delaPrekoAHZa

:Miha :jeZaposlenPri :UniverzaLjubljana .
:Anja :delaNaCrnoZa :Istrabenz .
:Jernej :delaPrekoAHZa :Krka .

 Rezultati sklepanja so:
:Miha :delaZa :UniverzaLjubljana .
:Anja :delaPogodbenoZa :Istrabenz .
:Jernej :delaPogodbenoZa :Krka .
:Anja :delaZa :Istrabenz .
:Jernej :delaZa :Krka .

RDF/S
Tip podatkov z rdfs:domain

 S pomočjo gradnika rdfs:domain lahko
točno opredelimo iz katerega razreda,
določena lastnost izhaja
 Analogija iz matematike: definicijsko
območje (ang. domain) funkcije
 Pri sklepanju velja naslednje pravilo:
ČE (?P rdfs:domain ?D) IN (?x P ?y)
POTEM (?x rdf:type ?D)

RDF/S
Tip podatkov z rdfs:range

 Podobno s pomočjo gradnika
rdfs:range opredelimo na kateri razred
lastnost kaţe
 Analogija iz matematike: zaloga vrednosti
(ang. range) funkcije
 Pri sklepanju velja naslednje pravilo:
ČE (?P rdfs:range ?R) IN (?x P ?y)
POTEM (?y rdf:type ?R)

RDF/S
Kombinacija rdfs:domain in rdfs:subClassOf

 Primer
:PorocenaZenska rdfs:subClassOf :Zenska .
:dekliskiPriimek rdfs:domain :PorocenaZenska .

 Če dodamo naslednje :Zenska

dejstvo, mehanizem rdfs:subClassOf

sklepanja vrne: :dekliskiPriimek .rdfs:domain. :PorocenaZenska

:Marija :dekliskiPriimek :Golez .

:Marija rdf:type :PorocenaZenska .
:Marija rdf:type :Zenska .

RDF/S
Vzorci modeliranja – ponovna uporaba

 Uporaba obstoječe ontologije, kjer je del naše
problemske domene ţe predstavljen:
 uporabimo prenos razmerij.
 Primer ontologije Dublin Core (opisovanje
bibliografskih podatkov)
:avtor rdfs:subPropertyOf dc:creator .

 vse logične omejitve iz Dublin Core se ohranijo,
 ko dodamo izjave o lastnosti :avtor, posredno
dodamo tudi za dc:creator.

RDF/S
Vzorci modeliranja – ne-načrtovalske lastnosti

 Ne-načrtovalske lastnosti se ne uporabljajo
pri sklepanju, so pa kljub temu pomembne za
uporabnike:
 rdfs:label za prikazovanje imen konceptov v
prijaznejši obliki,
 rdfs:comment za podrobnejši komentar
določenega koncepta,
 rdfs:seeAlso za opredelitev dodatnih virov
informacij (npr. Wikipedia zapis o modeliranem
konceptu).

RDF/S
Vzorci modeliranje – klasifikacija na podlagi def. obm. (1)

 Primer podatkov o ladjah
Naslednja Začetek
Ime ladje Prva plovba Uničenje Poveljnik
plovba neaktivnosti
Berengaria 16.06.1913 1938 Johnson
QEII 02.05.1969 04.03.2010 Warwick
Titanic 10.04.1912 14.03.1912 Smith
Constitution 22.07.1798 12.01.2009 Preble

 Samodejna klasifikacija ladij, glede na podatke?
 Ţeleli bi imeti 3 skupine ladij: izpluta ladja, ladja v
popravilu in neaktivna ladja.

RDF/S
Vzorci modeliranje – klasifikacija na podlagi def. obm. (2)

 Rešitev:
 uporaba gradnikov rdfs:domain,
 zgolj zapišemo podatke iz tabele, pripadnost
razredom se določi samodejno s sklepanjem.
:QEII
rdf:type
:datumNaslednjePlovbe :datumPrvePlovbe = 02.05.1969
:datumNaslednjePlovbe = 04.03.2010
rdf:type
.rdfs:domain.
.rdf:type :Constitution
:LadjaVPopravilu
:datumPrvePlovbe = 22.07.1987
rdfs:subClassOf rdf:type :datumNaslednjePlovbe = 12.01.2009
:Ladja rdfs:subClassOf :IzplutaLadja
rdfs:subClassOf rdf:type :Titanic

.rdfs:domain. :NeaktivnaLadja .rdf:type.
:datumUnicenja = 14.04.1912
:datumPrvePlovbe .rdfs:domain. .rdfs:domain. rdf:type
:Berengaria
:datumPrenehanjaPlovbe :datumUnicenja rdf:type
:datumPrenehanjaPlovbe = 1938

Kaj smo spoznali?

Zaupanje


Poenotena logika


Kriptografija
Poizvedovanje
(SPARQL)
Taksonomije (RDF/S)




OWL
Osnovni gradniki

 Osnovne gradnike jezika OWL včasih
poimenujemo tudi RDF/S Plus:
 inverzna lastnost,
 simetrična lastnost,
 tranzitivna lastnost,
 ekvivalenca (razredov, lastnosti in
primerkov),
 funkcijska lastnost,
 inverzna funkcijska lastnost.

OWL
Inverzna lastnost

 Primer opredelitve nad-razreda:
:nadRazred owl:inverseOf rdfs:subClassOf .

 za vsako relacijo B :nadRazred A, velja tudi
A rdfs:subClassOf B.
 Primer relacije “poročen z”
 relacija je inverzna sama sebi
:porocenZ owl:inverseOf :porocenZ .
:Shakespeare :porocenZ :AnneHathaway .

:AnneHathaway :porocenZ :Shakespeare .

OWL
Simetrična lastnost

 Relacija “poročen z” je tudi simetrična
lastnost, za katero velja:
ČE (P rdf:type owl:SymmetricProperty)
POTEM (P owl:inverseOf P)

 Isto funkcionalnost prejšnjega primera
lahko tako doseţemo z:
:jePorocenZ rdf:type owl:SymmetricProperty .

OWL
Tranzitivna lastnost

 Za tranzitivno lastnost velja
ČE (P rdf:type owl:TransitiveProperty) IN
(X P Y) IN (Y P Z)
POTEM (X P Z)

 Primer:
:imaPrednika rdf:type owl:TransitiveProperty .
:Marija :imaPrednika :Janez .
:Tone :imaPrednika :Marija .

Tone

.imaPrednika.

:Tone :imaPrednika :Janez . Marija .imaPrednika.

.imaPrednika.

Janez

OWL
Ekvivalenca (1)

 Ekvivalenco razredov lahko doseţemo
tudi z naslednjo zvijačo:
:Analitik rdfs:subClassOf :Raziskovalec .
:Raziskovalec rdfs:subClassOf :Analitik .

 za isto funkcionalnost obstaja OWL gradnik
:Analitik owl:equivalentClass :Raziskovalec .

 Primerki enega ekvivalentnega razreda
pripadajo tudi drugemu in obratno.

OWL
Ekvivalenca (2)

 Ekvivalenco lastnosti zapišemo kot
:izposodil owl:equivalentProperty :prevzel .

 Zelo uporaben je gradnik za ekvivalenco
med primerki
 več primerkov, ista stvar, različna poimenovanja
 zdruţevanje podatkov iz različnih virov
:Preseren owl:sameAs :FrancePreseren .

OWL
Funkcijska lastnost

 Funkcijska lastnost ima pri istem definicijskem
območju vedno isto zalogo vrednosti
ČE (P rdf:type owl:FunctionalProperty) IN
(X P A) IN (X P B)
POTEM (A owl:sameAs B)

 Primer
lit:Shakespeare :imaOceta bio:JohannesShakespeare .
lit:Shakespeare :imaOceta bio:JohnShakespeare .

:imaOceta rdf:type owl:FunctionalProperty .

bio:JohannesShakespeare owl:sameAs bio:JohnShakespeare .

OWL
Inverzna funkcijska lastnost

 Inverzna funkcijska lastnost je eden
najpomembnejših konstruktov jezika OWL
 integracija podatkov iz različnih virov,
 ima podobno vlogo kot identifikator pri relacijskih
podatkovnih bazah,
○ za razliko od PB pri istem identifikatorju ne dobimo
napake, ampak OWL sklepa, da gre za isti entiteti
 Pravilo
ČE (P rdf:type owl:InverseFunctionalProperty) IN
(A P X) IN (B P X)
POTEM (A owl:sameAs B)

OWL
Inverzna funkcijska lastnost (2)

Podatki iz 1. vira Podatki iz 2. vira
p:Izdelek1 p:stModela »B-1430« . mfg:Produkt1 mfg:stevilka »ZX-3« .
p:Izdelek2 p:stModela »B-1431« . mfg:Produkt2 mfg:stevilka »ZX-3P« .
p:Izdelek3 p:stModela »M13-P« . mfg:Produkt3 mfg:stevilka »ZX-3S« .
p:Izdelek4 p:stModela »ZX-3S« . mfg:Produkt4 mfg:stevilka »B-1430« .
p:Izdelek5 p:stModela »ZX-3« . mfg:Produkt5 mfg:stevilka »B-1430X« .
p:Izdelek6 p:stModela »TC-43« . mfg:Produkt6 mfg:stevilka »B-1431« .
p:Izdelek7 p:stModela »B-1430X« . mfg:Produkt7 mfg:stevilka »DBB-12« .
p:Izdelek8 p:stModela »SP-1234« . mfg:Produkt8 mfg:stevilka »SP-1234« .
p:Izdelek9 p:stModela »1180-M« . mfg:Produkt9 mfg:stevilka »SPX-1234« .

mfg:stevilka rdf:type owl:InverseFunctionalProperty .
p:stModela owl:equivalentProperty mfg:stevilka .

p:Izdelek1 owl:sameAs mfg:Produkt4 .

OWL
Ostale funkcionalnosti (1)

 Ostale funkcionalnosti si oglejmo na primeru
vprašanj in odgovorov pri vprašalniku:
 Imamo številna vprašanja, kjer ima lahko vsak
določeno število odgovorov.
 Shema problemske domene v ontologiji:
:Vprasanje :Odgovor

.rdfs:domain. .rdfs:domain.
rdfs:range .rdfs:domain.

:besediloVprasanja :besediloOdgovora
:jeMozenZa

owl:inverseOf

:imaMoznost rdfs:subPropertyOf :imaIzbranoMoznost

OWL

 Podpora uporabnikom kabelskega operaterja:
 Pri katerih sistemih se vam pojavljajo teţave?
○ kabelska TV
○ širokopasovni internet
○ oboje
 Kakšni simptomi se pojavljajo na televiziji?
○ ni slike
○ ni zvoka
○ inicializacija
○ slab sprejem

OWL

 Vprašalnik :KaksnaTezava
:besediloVprasanja = »Pri katerih ...«

zapišemo v :imaIzbranoMoznost :imaMoznost :imaMoznost

ontologijo v :CTV
:besediloOdgovor =
:Internet
:besediloOdgovor =
:Oboje
:besediloOdgovor = »oboje«
»kabelska TV« »širokopasovni internet«
obliki
primerkov:
:TVSimptom
:besediloVprasanja = »Kakšni simptomi ...«

:imaMoznost :imaMoznost

:NiSlike :imaMoznost :imaMoznost :SlabSprejem
:besediloOdgovor = :besediloOdgovor =
»Na televiziji ni slike.« »Na zasloni sneži.«

:NiZvoka :Inicializacija
:besediloOdgovor = :besediloOdgovor =
»Slika je, vendar ni zvoka.« »Peščena ura, ki ne izgine.«

OWL
Omejitve z owl:someValuesFrom

 Omejitev, kjer imajo vsi primerki vsaj eno
vrednost lastnosti P iz razreda C.
:OdgovorjenoVprasanje owl:equivalentClass
[rdf:type owl:Restriction;
owl:onProperty :imaIzbranoMoznost;
owl:someValuesFrom :Odgovor].

:imaIzbranoMoznost

owl:onProperty

:imaIzbranoMoznost nekaj :Odgovor .owl:someValuesFrom. :Odgovor

owl:equivalentClass

:OdgovorjenoVprasanje rdf:type

rdf:type

:CTV
:KaksnaTezava
.:imaIzbranoMoznost. :besediloOdgovor =
»kabelska TV«

OWL
Omejitve z owl:allValuesFrom (1)

 Omejitev, kjer imajo vsi primerki vse
vrednosti lastnosti P iz razreda C.
 Primer:
 Uporabnik odgovori na vprašanje.
 Vsa odvisna vprašanja postanejo
omogočena.

OWL

 Posodobimo ontologijo
:OmogocenoVprasanje :omogoca

rdfs:range rdfs:domain

rdfs:subClassOf. :Vprasanje :Odgovor .rdfs:subClassOf.

rdfs:domain rdfs:domain
rdfs:range rdfs:domain

:besediloVprasanja :besediloOdgovora :IzbranOdgovor
:jeMozenZa
.rdfs:range.
owl:inverseOf

:imaMoznost .rdfs:subPropertyOf. :imaIzbranoMoznost

 in dodamo :CTV
:besediloOdgovor =
:Oboje
»kabelska TV«
primerke :omogoca
:omogoca

:TVSimptom

OWL

:IzbranOdgovor rdfs:subClassOf
owl:onProperty :omogoca;
owl:allValuesFrom :OmogocenoVprasanje].

:omogoca :OmogocenoVprasanje

owl:onProperty owl:allValuesFrom

:omogoca vsi :OmogocenoVprasanje
Dodamo
rdfs:subClassOf
rdf:type
omejitev
:Odgovor .rdfs:subClassOf. :IzbranOdgovor
za razred
rdf:type rdf:type
rdf:type

:CTV
:TVSimptom
:besediloOdgovor = .:omogoca.
»kabelska TV«
:omogoca

:Oboje

OWL

 Odvisnosti med odgovori in vprašanji v
našem kratkem vprašalniku:
:KaksnaTezava

:imaIzbranoMoznost :imaMoznost :imaMoznost

:CTV :Oboje :Internet
:besediloOdgovor = :besediloOdgovor = »oboje« :besediloOdgovor =
»kabelska TV« »širokopasovni internet«

:omogoca :omogoca
:omogoca :omogoca

:TVSimptom :InternetSimptom

OWL
Omejitve z owl:hasValue

 Omejitev, kjer imajo vsi primerki vrednost A
lastnosti P.
 Poseben primer uporabe owl:someValuesFrom.
:VprasanjeZVisokoPrioriteto owl:equivalentClass
owl:onProperty :imaPrioriteto;
owl:hasValue :Visoka].

:VprasanjeZVisokoPrioriteto

owl:equivalentClass

:imaPrioriteto ima :Visoka :Prioriteta

owl:onProperty .owl:hasValue. rdf:type rdf:type rdf:type

:imaPrioriteto :Visoka :Srednja :Nizka

OWL
Primer omejitev

VprasanjaOdgovori.owl

OWL
Mnoţice

 Teorija mnoţic – zelo močno orodje pri
jeziku OWL
A owl:unionOf B

A B

A owl:intersectionOf B owl:complementOf A

OWL
Štetje in zapiranje sveta (1)

 Pri semantičnem spletu operiramo s
predpostavko odprtega sveta
 štetje elementov mnoţice je zelo teţko,
 ţe vprašanje ali primerek pripada razredu je
problematično,
○ Kaj če v naslednjem trenutku odkrijemo
trojček, ki trdi ravno to?

OWL
Štetje in zapiranje sveta (2)

 Primer dialoga med dvema ljubiteljema
filmov (Pia in Vasilij):
Oseba Vprašanje ID
Pia Zadnjič sem gledala film od James Dean-a. (1)
Vasilij Prav gotovo si gledala film »Giant«. (2)
Pia Ne. (3)
Vasilij Potem pa mogoče »East of Eden«? (4)
Pia Ne. (5)
Vasilij Glede na to, da obstajajo samo trije filmi od James Dean-a, (6)
si morala gledati »Rebel without a cause«.
Pia Res je. (7)

OWL
owl:oneOf (1)

 To sklepanje je moţno le pri predpostavki, da
je James Dean igral v le 3 filmih.
 V jeziku OWL imamo za to na voljo gradnik
owl:oneOf.
:JamesDeanFilm owl:Class;
owl:oneOf (:Giant :EastOfEden :Rebel ).

:Giant rdf:type :JamesDeanFilm .
:EastOfEden rdf:type :JamesDeanFilm .
:Rebel rdf:type :JamesDeanFilm .

OWL
owl:oneOf (2)

 Vnesimo film, ki si ga je ogledala Pia:
:FilmOdPie rdf:type JamesDeanFilm .

 Ko Vasilij predvideva “Prav gotovo si gledala
film Giant”, se v ontologijo doda trditev:
:FilmOdPie owl:sameAs :Giant .

 Pia to negira, tako da popravimo prejšnjo trditev
:FilmOdPie owl:differentFrom :Giant .

OWL
owl:oneOf (3)

 Vasilij znova poskusi z vprašanjem “Potem pa
mogoče East of Eden”, vendar Pia to znova
zanika.
:FilmOdPie owl:differentFrom :EastOfEden .

 Mehanizem sklepanja nam ponudi odgovor
:FilmOdPie owl:sameAs :Rebel .

OWL
owl:oneOf (4)

 Dialog o filmih James Dean-a z rezultati
sklepanja

[:Giant, :EastOfEden, :Rebel]

owl:oneOf

:JamesDeanFilm

rdf:type rdf:type rdf:type

rdf:type
:EastOfEden :Giant :Rebel

owl:differentFrom
owl:differentFrom
.owl:sameAs.

:FilmOdPie

OWL
Kardinalnost (1)

 Nadaljevanje filmskega dialoga
Oseba Vprašanje ID
Pia Ali imaš ti kupljen kakšen film od James Dean-a? (8)
Vasilij Njegovi filmi so edini filmi, ki sem jih kdaj kupil. (9)
Pia Potem verjetno nimaš veliko filmov. Nič več kot 3. (10)
:Vasilij

rdf:type rdf:type

:EkskluzivniLastnikJamesDeanFilmov :LastnikMajhnegaStevilaFilmov

owl:equivalentClass owl:equivalentClass
ugotovitev
:imaVLastiFilm vsi :JamesDeanFilm :imaVLastiFilm max 3 Pie (10)
owl:allValuesFrom owl:onProperty owl:onProperty

:JamesDeanFilm :imaVLastiFilm

:Vasilij rdf:type :LastnikMajhnegaStevilaFilmov .

OWL
Kardinalnost (2)

 Dialog se nadaljuje
Oseba Vprašanje ID
Pia Koliko filmov imaš torej v lasti? (11)
Vasilij 3. (12)
Pia Potem imaš vse :EastOfEden (13)
filme od James :imaVLastiFilm :Giant
:imaVLastiFilm
Dean-a in tudi :Vasilij .:imaVLastiFilm. :Rebel
tistega, ki sem ga rdf:type rdf:type

gledala včeraj, :LastnikTrehFilmov :EkskluzivniLastnikJamesDeanFilmov

“Rebel without a owl:equivalentClass owl:equivalentClass

cause”. :imaVLastiFilm natanko 3 :imaVLastiFilm vsi :JamesDeanFilm

owl:onProperty owl:onProperty owl:allValuesFrom

:imaVLastiFilm :JamesDeanFilm

owl:oneOf

[:Giant, :EastOfEden, :Rebel]

OWL
Komplement mnoţice (1)

 Komplement mnoţice so tisti elementi, ki v
prvotni mnoţici niso vsebovani.
:Razred1 owl:complementOf :Razred2 .

 Dialog z Vasilijevim prijateljem Andrejem
Oseba Vprašanje ID
Andrej Ali se pogovarjate o James Dean-u? Meni je zelo všeč! (14)
Imam vse njegove filme.
Pia Nisi pa obseden z njim? Imaš vse njegove filme, ampak prav (15)
gotovo imaš še kakšen drug film?
Vasilij Jaz nisem obseden z James Dean-om! (16)
Andrej Seveda imam tudi nekaj filmov, ki niso od James Dean-a. (17)
Vasilij Torej moraš imeti vsaj 4 filme. (18)

OWL

 Potrebujemo novo inverzno lastnost
:jeVLastiOsebe owl:inverseOf :imaVLastiFilm .

 in opredelimo Andrejev film
[Film,
:AndrejevFilm .owl:intersectionOf.
jeVLastiOsebe ima Andrej]
rdfs:subClassOf

:JamesDeanFilm

 in za primerek Andrej zahtevamo
:Andrej rdf:type
owl:onProperty :imaVLastiFilm;
owl:someValuesFrom
[owl:complementOf :JamesDeanFilm]] .

OWL

 Opredelimo lastnika večjega števila
filmov
:Andrej

rdf:type rdf:type

:LastnikVecjegaStevilaFilmov :imaVLastiFilm nekaj ne :JamesDeanFilm

owl:equivalentClass

:imaVLastiFilm min 4

 S sklepanjem pridemo do potrditve, da
ima Andrej v lasti najmanj 4 filme:
:Andrej rdf:type :LastnikVecjegaStevilaFilmov .

OWL
Razdruţene mnoţice (1)

 Nadaljujmo naš dialog
Oseba Vprašanje ID
Andrej Sem velik ljubitelj filmov. Ne samo, da imamo vse James (19)
Dean-ove filme, ampak imam tudi filme, kjer igrajo Judy
Garland, Tom Cruise, Dame Judi Dench in Antonio
Banderas!
Vasilij Potem moraš imeti vsaj 7 filmov! (20)
Andrej Kako si pa to vedel? (21)
Vasilij Zato ker noben od teh igralcev ni igral skupaj v kakšen filmu. (22)

OWL

 Od Andreja izvemo, da ima tudi filme drugih
igralcev in Vasilij pripomni, da omenjeni igralci
niso nikoli igrali skupaj, lahko zapišemo:
:JamesDeanFilm owl:disjointWith :JudyGarlandFilm .
:JamesDeanFilm owl:disjointWith :TomCruiseFilm .
:JamesDeanFilm owl:disjointWith :DameJudiDenchFilm .
:JamesDeanFilm owl:disjointWith :AntonioBanderas .
:JudyGarlandFilm owl:disjointWith :TomCruiseFilm .
:JudyGarlandFilm owl:disjointWith :DameJudiDenchFilm .
:JudyGarlandFilm owl:disjointWith :AntonioBanderas .
:TomCruise owl:disjointWith :DameJudiDenchFilm .
:TomCruise owl:disjointWtih :AntonioBanderas .
:DameJudiDenchFilm owl:disjointWith :AntonioBanderas .

OWL

 Opredelimo še lastnika 7 filmov:
:LastnikSedmihFilmov rdf:type owl:Restriction;
owl:onProperty :imaVLastiFilm;
owl:minCardinality 7 .

:JudyGarlandFilm
.owl:someValuesFrom.

:imaVLastiFilm nekaj :JudyGarlandFilm

rdf:type
:imaVLastiFilm nekaj :DameJudiDenchFilm
rdf:type
owl:disjointWith
:Andrej rdf:type :imaVLastiFilm nekaj :AntonioBanderasFilm
rdf:type
.owl:someValuesFrom.
rdf:type :imaVLastiFilm nekaj :TomCruiseFilm

:LastnikSedmihFilmov :AntonioBanderasFilm

 Rezultat sklepanja:
:Andrej rdf:type :LastnikSedmihFilmov .

OWL
Primer uporabe mnoţic

JamesDean.owl

OWL
Uporaba

 owl:import – vse ontologije, ki so poleg
osnovne, se tudi naloţijo
 večkratni uvoz (naloţimo samo 1x)
 Primer
 FEARMO ontologija
srm: brm2prm:

owl:imports
owl:imports
owl:imports owl:imports prm:
owl:imports
trm: owl:imports brm:
owl:imports
owl:imports

feac:

Prakse modeliranja
 Več pristopov:
 iskanje obstoječega modela na internetu,
ki ustreza zahtevam,
 uporaba informacijskih virov, ki ţe imajo
vrednost za organizacijo (sheme, slovarji,
podatkovne baze ipd.),
 razvoj ontologije od začetka.

Ponovna uporaba
Problem razumljivih in poţeljivih imen (1)

 izogibanje poţeljivim imenom,
 upoštevanje “de facto” standarde za
poimenovanje (W3C):
 poimenovanje virov v CamelCase obliki
○ brez presledkov, beseda z veliko začetnico,
○ npr. rdfs:subClassClassOf,
owl:InverseFunctionalProperty,
 ime razreda se začne z veliko začetnico
○ npr. owl:Restriction, owl:Class

Ponovna uporaba
Problem razumljivih in poţeljivih imen (2)

 ime lastnosti se začne z majhno začetnico,
○ npr. owl:inverseOf
 ime primerka se začne z veliko začetnico,
○ npr. tr:MoskoOblacilo,
 pri imenih razredov uporabljamo ednino,
○ npr: owl:SymmetricProperty, tr:Srajca.

Ponovna uporaba
Obvladovanje razredov in primerkov

 Najbolj pogosta dilema: Kdaj zmodeliramo
koncept kot razred ali kot primerek?
 odvisno od zahtev, če :VprasanjeZVisokoPrioriteto

potrebujemo oboje owl:equivalentClass

:imaPrioriteto ima :Visoka

○ vzorec razred-primerek owl:onProperty .owl:hasValue.

 razred je mnoţica primerkov
:imaPrioriteto :Visoka

○ vsebuje naj vsaj 1 primerek,
 najprej se odločimo kaj bomo modelirali, potem ali
gre za razred ali primerek in na koncu izberemo
ime.

Pogoste napake modeliranja (1)

 preobširna uporaba razredov,
 vsak koncept je razred,
 orodja to spodbujajo,
 ekskluzivnost,
 vsi primerki pod-razreda tudi primerki nad-
razreda, :Mesto

 ni pa res, da so edini rdfs:subClassOf

:jePovezanZ nekaj :Ocean
:PristaniskoMesto .owl:equivalentClass.
kandidati za nad-razred :Mesto

owl:intersectionOf

primerki pod-razreda [:jePovezanZ nekaj :Ocean,
Mesto]

 rešitev: vzorec preseka

Pogoste napake modeliranja (2)

 objektivizacija,
 omejevanje na isti pomen in delovanje, kot je pri
objektnem modelu,
 obvladovanje razrednih identifikatorjev,
 uporaba owl:AnnotationProperty,
 vsiljiva konceptualizacija,
 idejo “načrtovanje za ponovno uporabo”
pomešamo z “povej vse kar lahko”

Vpliv informacijskih povezav

Spletni OS Web 4.0
2020 - 2030
Inteligentni osebni agenti
Semantični splet
SWRL
Web 3.0 Porazdeljeno iskanje
OWL 2010 - 2020
OpenID AJAX SPARQL Semantične podatkovne baze
Semantično iskanje Widgeti
RSS ATOM
P2P RDF
JavaScript
SOAP XML Flash Web 2.0 Office 2.0
Java 2000 - 2010 Spletni blogi Skupna raba multimedijskih vsebin
Svetovni splet HTML
HTTP Portali Wikiji Socialno mreženje
VR
Iskanje s ključnimi besedami
BBS Gopher Web 1.0
1990 - 2000
Spletne strani Enostavno sodelovanje
MMO MacOS SQL Groupware
Namizje SGML Podatkovne baze
Windows
Datotečni strežniki
Email
FTP IRC
Doba računalnikov
1980 - 1990
USENET
Osebni
računalnik Datotečni sistemi

Vpliv socialnih povezav

Dejan Lavbič
Univerza v Ljubljani
Fakulteta za računalništvo in informatiko

http://amor.fri.uni-lj.si/dejan/SW/tutorial
Dejan.Lavbic@fri.uni-lj.si

Ontologije in tehnologije semantičnega spleta

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Andere mochten auch

Andere mochten auch (9)

Ontologije in tehnologije semantičnega spleta

Hinweis der Redaktion