STAW 08/12: Programare Web. Suita de tehnologii HTML5
Dezvoltarea aplicațiilor Web (12/12): Inginerie ontologică: Alinierea ontologiilor. Şabloane de proiectare. Domenii de utilizare
1. inginerie ontologică – partea II
alinierea & fuziunea ontologiilor
șabloane de proiectare, domenii de utilizare
Dr. Sabin Buragawww.purl.org/net/busaco
Dezvoltarea aplicațiilor Web
4. existența unor ontologii diverse,
modelând puncte de vedere diferite
Dr. Sabin Buragawww.purl.org/net/busaco
realitate
5. Expresivitatea limbajului ontologii folosit
versus
complexitatea inferențelor ce pot fi efectuate
Dr. Sabin Buragawww.purl.org/net/busaco
preliminarii
6. Aspecte de interes
(Calvanese, Giacomo & Rodriguez-Muro, 2008):
utilizarea construcțiilor ontologice oferite de OWL
efectuarea de inferențe
Dr. Sabin Buragawww.purl.org/net/busaco
preliminarii
7. Aspecte de interes
(Calvanese, Giacomo & Rodriguez-Muro, 2008):
recurgerea la volum mare de date (indivizi)
(re)utilizare a unor baze de date
Dr. Sabin Buragawww.purl.org/net/busaco
preliminarii
8. Aspecte de interes
(Calvanese, Giacomo & Rodriguez-Muro, 2008):
flexibilitate privind realizarea interogărilor
limbaje de interogare – specifice (SPARQL)
Dr. Sabin Buragawww.purl.org/net/busaco
preliminarii
9. Aspecte de interes
(Calvanese, Giacomo & Rodriguez-Muro, 2008):
realizarea de asocieri între date,
păstrând sursele originare
asocieri (mappings) – e.g., baze de date↔triplestores
Dr. Sabin Buragawww.purl.org/net/busaco
preliminarii
10. Context: integrarea datelor – data integration
data integration is the problem of providing unified
and transparent access to a set of autonomous and
heterogeneous sources
Bernstein & Haas, Communications of the ACM, 2008
Dr. Sabin Buragawww.purl.org/net/busaco
preliminarii
11. Crearea corespondențelor dintre ontologii
merging
O1
mapping
O2
O1
Om
O2
articulation
Dr. Sabin Buragawww.purl.org/net/busaco
necesități
12. Context:
integrarea datelor
scheme de baze de date (relaționale)
specificații provenite din inteligența artificială
Web (semantic) – RDF, JSON(-LD), OWL,…
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
13. Motive ale existenței nepotrivirilor – mismatches
conform (Noy, 2005)
reprezentarea subiectivă a unui domeniu (lume, web)
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
exemplu:
carte pentru copii despre animale vs. compendiu zoologic
14. Motive ale existenței nepotrivirilor – mismatches
conform (Noy, 2005)
existența diferitelor cerințe și workflow-uri
privitoare la (tipuri de) aplicații software
exemplificări:
e-business vs. e-learning vs. e-entertainment,
interacțiune convențională (desktop) vs. mediu mobil/TV
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
15. Motive ale existenței nepotrivirilor – mismatches
conform (Noy, 2005)
folosirea altor convenții de reprezentare a cunoștințelor
a se (re)vedea și
cursul anterior
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
16. Tipuri de nepotriviri
la nivel…
de limbaj
ontologic
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
17. Nepotriviri la nivel de limbaj
diferențe de sintaxă, expresivitate sau semantică
a limbajelor ontologice actuale
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
18. Nepotriviri la nivel ontologic
diferențe vizând structura semantică
exemple: termeni diferiți definind același concept,
același termen descriind mai multe concepte,
convenții/paradigme de modelare eterogene,
puncte de vedere diferite etc.
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
21. www.aktors.org/ontology/ vs. ebiquity.umbc.edu/ontology/
specificare diferită a conceptelor:
Publication – restricții privitoare la citări, referințe biblio.
versus
Publication – restricții referitoare la rezumat
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor – exemplu
24. www.aktors.org/ontology/ vs. ebiquity.umbc.edu/ontology/
convenții de modelare și nivel de detaliere:
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor – exemplu
proprietatea address compusă
din alte fragmente de informație
versus
proprietatea address de tip șir de caractere (nestructurat)
25. Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
Problemă:
date la intrare ontologii – exprimate prin entități
discrete (tabele, XML, JSON, clase, proprietăți,…) –,
trebuie determinate relațiile (e.g., echivalență,
subsumare,…) care au loc între aceste entități
30. Reducerea eterogenității
poate fi realizată în 2 pași
1. potrivire (match) – determinarea alinierii
la momentul proiectării sau (re)utilizării ontologiei
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
31. Reducerea eterogenității
poate fi realizată în 2 pași
2. procesarea alinierii
fuzionare (merging), transformare etc.
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
32. Corespondența între O1 și O2
〈 id, e1, e2, r 〉
id = identificator unic al corespondenței
ei entitate din ontologia Oi (e.g., clasă,…), i=1,2
r = relație între e1 și e2
echivalență (=), disjuncție (⊥) etc.
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
33. Alinierea (alignment) A între O1 și O2 este
o mulțime de corespondențe peste O1 și O2
prezintă o anumită cardinalitate: 1 la 1, 1 la N etc.
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
34. Alinierea (alignment) A între O1 și O2 este
o mulțime de corespondențe peste O1 și O2
prezintă o anumită cardinalitate: 1 la 1, 1 la N etc.
pot fi atașate meta-date adiționale:
metoda de aliniere, data alinierii, proprietăți specifice,…
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
35. Alinierile pot fi descrise semantic
pe baza logicilor descrierii (Zimmermann, 2006)
conform François Scharffe (2008)
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
38. Patrimoniul cultural (cultural heritage)
alinieri realizate în faza de proiectare a aplicațiilor de
integrare a capodoperelor descrise via lexicoane
precum Iconclass și Aria
alinierile rezultate pot fi folosite și pentru a facilita
căutările multicriteriale (faceted search)
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor: utilizare
39. Geografie computațională (geo-information)
exemplu: planificarea urbană
bazată pe terminologii din arii diverse
(hidrologie, topografie) utilizate pentru a oferi
rezultate de interes conform cererilor utilizatorului
alinierile sunt (re)folosite la expandarea interogărilor
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor: utilizare
40. Medierea datelor în contextul serviciilor Web
(Euzenat, Mocan & Scharffe, 2008)
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor: utilizare
41. Medierea datelor în contextul serviciilor Web
(Euzenat, Mocan & Scharffe, 2008)
alinierea ontologică este facilitată de
WSMT (Web Service Modeling Toolkit)
alinierile sunt exprimate
via AML (Abstract Mapping Language)
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor: utilizare
43. Tehnici de potrivire la nivel de termeni
pe baza șirurilor de caractere
prefixul: net = network, pin = pinguin (?)
sufixul: ID = PID, word = sword (?)
distanța editării (numărul de operații de inserare,
ștergere, substituție a caracterelor pentru transformarea
unui termen în altul): EditDistance (NKN, Nikon) = 4
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
44. Tehnici de potrivire la nivel de termeni
bazate pe limbaj
procesarea entităților (tokenization)
Hands-Free Kits → 〈 hands, free, kits 〉
analiza morfologică pentru găsirea
tuturor formelor de bază (lemmalization): Kits → Kit
eliminarea cuvintelor nerelevante: “a”, “the”, “by” etc.
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
45. Tehnici de potrivire la nivel de termeni
pe baza sensurilor – cazul WordNet
hiponimie, meronimie: Brand ⊏ Name
hipernimie, holonimie: Software ⊐ WebFramework
sinonimie
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
antonimie sau relații de siblings: Microprocessors ⊥ PC Board
46. Tehnici de potrivire la nivel de termeni
pe baza glossei – se folosește WordNet
numărul acelorași cuvinte prezente
în ambele glosse (texte) de intrare
conduce la creșterea valorii de similaritate a termenilor
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
47. Tehnici de potrivire la nivel de termeni
pe baza glossei – se folosește WordNet
exemplu:
Maltese dog is a breed of toy dogs having
a long straight silky white coat
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
Afghan hound is a tall graceful breed of hound with a long silky coat
48. Tehnici de potrivire la nivel de termeni
pe baza glossei – se folosește WordNet
pot fi adoptate API-uri/biblioteci/servicii specializate
precum AlchemiAPI, Diffbot, Stemmer, Textalytics și altele
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
49. Tehnici de potrivire la nivel structural
pe baza taxonomiei
potriviri ale drumurilor mărginite în graful ontologiilor
(bounded path matching)
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
50. Tehnici de potrivire la nivel structural
pe baza taxonomiei
reguli privitoare la super/sub-concepte
e.g., dacă super-conceptele sunt similare,
conceptele – copii ale acestora – sunt și ele similare
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
51. Tehnici de potrivire la nivel structural
bazate pe modele
verificarea satisfiabilității (SAT) pe baza axiomelor:
Axioms → rel (context1, context2)
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
53. Tehnici de potrivire la nivel structural
bazate pe modele – utilizarea logicilor descrierii
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
54. Procesele de potrivire pot avea loc secvențial
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
55. Procesele de potrivire se pot desfășura în paralel
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
56. Remarcă:
“Matching, however, requires explanations
because mappings between terms are not always
intuitively obvious to human users.”
Pavel Shvaiko, 2005
Dr. Sabin Buragawww.purl.org/net/busaco
potrivirea ontologiilor
57. Procesul general: metodologie pentru crearea
asocierilor – mappings (M. Ehrig, 2006)
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
58. Date de intrare:
două ontologii O1 și O2
eventual, pot fi puse la dispoziție asocieri cunoscute
(realizate manual, semi-automat ori automat)
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
59. Date de ieșire:
o reprezentare a alinierilor
tabel indicând relația alignO1,O2
suplimentar, se pot oferi și valori de încredere
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
60. Pasul 1: feature engineering
sunt selectate fragmente mici descriind entități
de interes – reprezentând anumite semantici
ulterior, aceste trăsături vor fi folosite
pentru compararea ontologiilor
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
61. Pasul 2: search step selection
se caută candidați pentru aliniere
se calculează similaritatea unor perechi
de concepte (c1, c2), cu c1 O1, c2 O2
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
62. Pasul 2: search step selection
se caută candidați pentru aliniere
unele construcții pot fi ignorate
de exemplu,
se poate compara o1:car cu o2:automobile,
dar nu cu o2:hasMotor
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
63. Pasul 2: search step selection
se caută candidați pentru aliniere
suplimentar, se pot adopta strategii (euristici) de
reducere a spațiului comparațiilor pentru ontologii largi
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
64. Pasul 3: similarity computation
pentru descrierile date ale 2 entități din spațiul
de candidați ai alinierii, se indică o similaritate
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
65. Pasul 3: similarity computation
pentru descrierile date ale 2 entități din spațiul
de candidați ai alinierii, se indică o similaritate
măsura similarității poate fi dată de
una sau mai multe caracteristici (trăsături, features)
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
67. Pasul 4: similarity aggregation
pentru 2 entități, pot exista mai multe similarități,
conform criteriilor considerate
e.g., privind etichetele conceptelor sau
relațiile cu alte entități
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
68. Pasul 4: similarity aggregation
pentru 2 entități, pot exista mai multe similarități,
conform criteriilor considerate
aceste valori se agregă
într-o unică valoare de similaritate
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
69. Pasul 4: similarity aggregation
exemplu:
(simlabel(o1:car, o2:automobile) +
simsubconcepts(o1:car, o2:automobile) +
siminstances(o1:car, o2:automobile)) / 3 = 0.5
combinarea acestor valori se realizează
prin mai multe strategii
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
70. Pasul 5: interpretation
valorile de similaritate individuale și agregate
sunt utilizate pentru alinierea entităților
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
71. Pasul 5: interpretation
valorile de similaritate individuale și agregate
sunt utilizate pentru alinierea entităților
aceste similarități vor fi interpretate
(se aleg diverse criterii: prag limită, structură etc.)
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
72. Pasul 5: interpretation
la final, se oferă sau nu o schemă de aliniere
a entităților considerate
e.g., align(o1:car) =‘⊥’
nu s-a putut determina
nici o aliniere convenabilă
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
73. Pasul 6: iteration
similaritatea e propagată în ontologii
pe baza relațiilor între entități
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
74. Pasul 6: iteration
similaritatea e propagată în ontologii
pe baza relațiilor între entități
la fiecare interație, va fi recalculată similaritatea
unei alinieri candidate
pe baza similarității perechilor entităților vecine
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
75. Pasul 6: iteration
după realizarea unei interații,
pot rezulta alte similarități
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
77. Abordările avansate de aliniere utilizează:
metode euristice – e.g., probabilistice
metode bazate pe reguli
tehnici de analiză structurală a grafurilor
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
78. Abordările avansate de aliniere utilizează:
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
învățare automată: algoritmi bayesieni, rețele neuronale,…
tehnici de raționament – e.g., theorem proving
algoritmi combinați, cu implicarea expertului uman
(user-driven composition)
79. Există mai mulți algoritmi propuși
competiția anuală OAC – Ontology Alignment Contest
(2004—2013)
http://oaei.ontologymatching.org/
detalii în P. Shvaiko, J. Euzenat, “Ontology Matching:
State of the Art and Future Challenges”,
IEEE Transactions on Knowledge and Data Engineering (2013)
http://disi.unitn.it/~p2p/RelatedWork/Matching/SurveyOMtkde_SE.pdf
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
80. De asemenea, se pot folosi cunoștințe anterioare
(background knowledge)
WordNet
ontologii de referință ale domeniului
ontologii de nivel superior – e.g., DOLCE, SUMO, UMBEL
resurse textuale on-line – i.e. Wikipedia (DBpedia)
vocabulare/ontologii disponibile on-line
Dr. Sabin Buragawww.purl.org/net/busaco
alinierea ontologiilor
81. Dr. Sabin Buragawww.purl.org/net/busaco
pentru două entități provenind din vocabularele AGROVOC și NAL
(National Agricultural Library) se deduce automat
că termenul Food este mai general decât Beef
sistemul de efectuare a potrivirilor (matcher) a recurs la cunoștințe
anterioare (background knowledge) disponibile pe Web
84. SF (Similarity Flooding)
Artemis (Analysis of Requirements:
Tool Environment for Multiple Information Systems)
Cupid
COMA (Combination Of Matching Algorithms)
NOM (Naive Ontology Mapping)
QOM (Quick Ontology Mapping)
OLA (OWL Lite Aligner)
H-Match
S-Match
Dr. Sabin Buragawww.purl.org/net/busaco
implementări (inițiale)
85. procesul de potrivire – bazată pe 4 modele de potrivire –
în sistemul H-Match (Castano et al., 2006)
Dr. Sabin Buragawww.purl.org/net/busaco
implementari (initiale)
86. Fuziunea de ontologii
ATOM (Automatic Target-driven Ontology Merging)
Cadre de lucru (frameworks) – Alignment API,
COMA++, MAFRA, PROMPT – extensie Protégé
Sisteme de matching – textual sau general
FOAM, OLA, Rondo etc.
Meta-matching systems – APFEL, eTuner
Dr. Sabin Buragawww.purl.org/net/busaco
implementări (mai recente)
87. arhitectura generală a framework-ului COMA++ 3.0
(S. Massmann et al., 2011)
Dr. Sabin Buragawww.purl.org/net/busaco
implementari (actuale)
89. Implementări de referință (ontology matching systems):
Dr. Sabin Buragawww.purl.org/net/busaco
implementări
SAMBO – focalizat asupra potrivirii & fuziunii de ontologii
biomedicale
Falcon – utilizează divide-et-impera și
algoritmi de clustering pentru alinieri de ontologii largi
RiMOM – framework ce folosește strategii multiple
conform unor algoritmi de decizie bayesiană
90. Implementări de referință (ontology matching systems):
ASMOV (Automatic Semantic Matching of Ontologies
with Verification) – scop: integrarea informațiilor
din domeniul bioinformaticii
AgreementMaker – include o multitudine de sisteme
automate de potrivire, cu suport pentru extensii
alte exemple: www.ontologymatching.org/projects.html
Dr. Sabin Buragawww.purl.org/net/busaco
implementări
91. Dr. Sabin Buragawww.purl.org/net/busaco
modularizarea ontologiilor
“Împrumutarea” entităților specificate de ontologii
practică obișnuită în ingineria software
facilitează dezvoltarea colaborativă a ontologiei
exemple demonstrative:
www.inf.unibz.it/~calvanese/teaching/2008-10-ISWC-tutorial-tones/
92. Matthew Horridge & Uli Sattler, 2008
Dr. Sabin Buragawww.purl.org/net/busaco
94. Clasificare (Suárez-Figueroa et al., 2007)
NeOn-project.org
logical ontology design patterns (LP)
architectural patterns (AP)
content design patterns (CP)
Dr. Sabin Buragawww.purl.org/net/busaco
șabloane de proiectare
95. Logical ontology design patterns (LP)
corespund contrucțiilor OWL, la nivel semantic
Dr. Sabin Buragawww.purl.org/net/busaco
șabloane de proiectare
96. Architectural patterns (AP)
“rețete” de modelare de structuri exprimate
cu ajutorul LP care caracterizează ontologia
în ansamblu
Dr. Sabin Buragawww.purl.org/net/busaco
șabloane de proiectare
97. Content design patterns (CP)
“rețete” de specificare a structurii conforme
unui tip, exprimată printr-un vocabular
specific (non-logic)
referitor la un domeniu de interes
Dr. Sabin Buragawww.purl.org/net/busaco
șabloane de proiectare
98. Logical ontology design patterns (LP)
exemple:
modelarea unei clase primitive,
a relației subClassOf,
a proprietăților funcționale de tip datatype,
a unui individ
etc.
Dr. Sabin Buragawww.purl.org/net/busaco
șabloane de proiectare
99. Logical ontology design patterns (LP)
Class (BusinessTask subClassOf Task)
DatatypeProperty (name
domain (Task)
numele
range (xsd:string)
unui task
)
Dr. Sabin Buragawww.purl.org/net/busaco
șabloane de proiectare
100. Logical ontology design patterns (LP)
specificarea relațiilor N-are
conform (Aldo Gangelmi, 2008)
Dr. Sabin Buragawww.purl.org/net/busaco
șabloane de proiectare
101. Architectural patterns (AP)
taxonomia
ontologia simplă (lightweight)
modularizarea ontologiilor
…
aspect de interes: controlul versiunilor
Dr. Sabin Buragawww.purl.org/net/busaco
șabloane de proiectare
103. Architectural patterns (AP)
proiectare (design)
management al proiectului
argumentare
soluții de proiectare
flux de activități colaborative
funcționalități
Dr. Sabin Buragawww.purl.org/net/busaco
șabloane de proiectare
105. Content patterns (CP): Role-Task
Dr. Sabin Buragawww.purl.org/net/busaco
șabloane de proiectare
106. Content patterns (CP): Part-Whole relation
nu există construcții specifice OWL,
dar se poate recurge la unele facilități
Dr. Sabin Buragawww.purl.org/net/busaco
șabloane de proiectare
107. Content patterns (CP): Part-Whole relation
exemplificare:
având specificate relațiile tranzitive
Finger isPartOf Hand, Hand isPartOf Arm, Arm isPartOf Body
se poate deduce
Finger isPartOf Body
Dr. Sabin Buragawww.purl.org/net/busaco
șabloane de proiectare
108. Content patterns (CP): kindOf relation
probleme privitoare la relația kindOf:
Hand is not kindOf Body
însă, rănirea unui braț este kindOf rănirea unui trup
idem, în situația conceptelor Motor și Automobil
Dr. Sabin Buragawww.purl.org/net/busaco
șabloane de proiectare
109. Content patterns (CP): kindOf relation
probleme privitoare la relația kindOf:
Hand is not kindOf Body
însă, rănirea unui braț este kindOf rănirea unui trup
idem, în situația conceptelor Motor și Automobil
oamenii se așteaptă să obțină ierarhii de tip partonomic
Dr. Sabin Buragawww.purl.org/net/busaco
șabloane de proiectare
110. O altă clasificare – seria de evenimente
Workshop on Ontology Patterns (2009—2013)
www.ontologydesignpatterns.org
la nivel logic (logical)
arhitecturale (architectural)
lexico-sintactice (lexico-syntactic)
referitoare la continut
reengineering
Dr. Sabin Buragawww.purl.org/net/busaco
șabloane de proiectare
111. detalii la http://ontologydesignpatterns.org/wiki/OPTypes
Dr. Sabin Buragawww.purl.org/net/busaco
Taxonomia șabloanelor de proiectare:
Structural
Logical
Architectural
Correspondence
Re-engineering
Alignment
Content
Reasoning
Presentation
Naming
Annotation
Lexico-Syntactic
113. Pot fi folosite și în cadrul alinierii de ontologii
exemple:
Attribute Transformation
(String Operation, Value Conversion, Data Operation),
Class to Attribute, Class Union,
Equivalent Relation, Relation Negation, Inverse Relation
etc.
Dr. Sabin Buragawww.purl.org/net/busaco
șabloane de proiectare
115. Specifice unor domenii de interes
exemplificări:
pentru business, se poate recurge la șabloanele
Action, CommunicationEvent, Time indexed person role
în cazul fluxurilor de lucru (workflow-uri), se pot folosi
Reaction, Sequence, TaskExecution, Transition
pescuit (fishery): GearSpecies, GearVessel, GearWaterArea
Dr. Sabin Buragawww.purl.org/net/busaco
șabloane de proiectare
116. un șablon de modelare
a hărților istorice
(Eleni Gkadolou, 2013)
Dr. Sabin Buragawww.purl.org/net/busaco
sabloane de proiectare
118. Domenii având cunoștințe modelate via ontologii
(Ian Horrocks & Peter F. Patel-Schneider, 2011)
agricultura
AGROVOC (multilingual agricultural vocabulary),
Fisheries ontology, Geopolitical ontology, OpenAGRIS etc.
http://aims.fao.org/
Dr. Sabin Buragawww.purl.org/net/busaco
utilizare practică a ontologiilor
120. Domenii având cunoștințe modelate via ontologii
(Ian Horrocks & Peter F. Patel-Schneider, 2011)
biologie
GO (Gene Ontology)
BioPAX (Biological Pathways Exchange ontology)
www.biopax.org
Dr. Sabin Buragawww.purl.org/net/busaco
utilizare practică a ontologiilor
121. Domenii având cunoștințe modelate via ontologii
(Ian Horrocks & Peter F. Patel-Schneider, 2011)
biomedicină
OBO – Open Biological and Biomedical Ontologies
e.g., PRO (PRotein Ontology), Anatomical Entity Ontology,
Common Anatomy Reference Ontology etc.
www.bioontology.org
www.obofoundry.org
Dr. Sabin Buragawww.purl.org/net/busaco
utilizare practică a ontologiilor
122. detalii despre serviciul Web REST oferit:
http://data.bioontology.org/documentation
Dr. Sabin Buragawww.purl.org/net/busaco
utilizare practica a ontologiilor
123. Domenii având cunoștințe modelate via ontologii
(Martin Hepp, 2012)
comerț electronic
GoodRelations, FAB (Food and Beverage Ontology),
PTO (Product Types Ontology), TIO (Tickets Ontology),…
http://purl.org/goodrelations/
www.productontology.org
Dr. Sabin Buragawww.purl.org/net/busaco
utilizare practică a ontologiilor
124. Domenii având cunoștințe modelate via ontologii
(Joost Breuker et al., 2009)
legislație
LKIF (Legal Knowledge Interchange Format),
OPJK (Ontology of Professional Judicial Knowledge),
IPROnto (Intellectual Property Rights Ontology) etc.
https://github.com/RinkeHoekstra/lkif-core
Dr. Sabin Buragawww.purl.org/net/busaco
utilizare practică a ontologiilor
125. modelarea conceptelor din legislația spaniolă
(Oscar Corcho et al.)
Dr. Sabin Buragawww.purl.org/net/busaco
utilizare practică a ontologiilor
126. Domenii având cunoștințe modelate via ontologii
Dr. Sabin Buragawww.purl.org/net/busaco
utilizare practică a ontologiilor
(Y. Raimond, P. Sinclair, N. Humfrey, M. Smethurst, 2009)
mass-media
PO (Programmes Ontology), MO (Music Ontology)
folosite de BBC
http://purl.org/ontology/po/
www.w3.org/2001/sw/sweo/public/UseCases/BBC/
128. Domenii având cunoștințe modelate via ontologii
(Antoine Isaac, 2012)
cultură
proiectul Europeana reutilizează vocabulare + ontologii
via ontologia ORE (Object Reuse and Exchange)
www.w3.org/2001/sw/sweo/public/UseCases/Europeana/
http://europeana.eu/
Dr. Sabin Buragawww.purl.org/net/busaco
utilizare practică a ontologiilor
129. Domenii având cunoștințe modelate via ontologii
(Ian Horrocks & Peter F. Patel-Schneider, 2011)
mediu
ontologiile SWEET (Semantic Web for Earth and
Environmental Terminology)
http://sweet.jpl.nasa.gov/ontology/
Dr. Sabin Buragawww.purl.org/net/busaco
utilizare practică a ontologiilor
131. Domenii având cunoștințe modelate via ontologii
(Joshua Shinavier, 2012; Oscar Corcho, 2013)
preluarea datelor de la senzori
constituirea așa-numitelor semantic sensor networks
ce recurg la modele conceptuale – e.g., OntoSensor
Dr. Sabin Buragawww.purl.org/net/busaco
utilizare practică a ontologiilor
www.slideshare.net/joshsh/semantics-and-sensors
www.slideshare.net/ocorcho/semantic-social-sensor-networks
133. Domenii având cunoștințe modelate via ontologii
(J. Breslin et al., 2011; Ș. Negru & S. Buraga, 2013)
aplicații Web sociale
FOAF, SIOC, PIMO (Personal Information MOdel),
CommonTag, PersonasOnto,…
www.semanticdesktop.org/ontologies/pimo/
http://blankdots.com/open/personasonto.html
Dr. Sabin Buragawww.purl.org/net/busaco
utilizare practică a ontologiilor
134. Domenii având cunoștințe modelate via ontologii
(Peter Mika & Thanh Tran, 2013)
semantic Web search
se bazează pe structura/înțelesul datelor și
pe cunoștințe anterioare modelate explicit
Dr. Sabin Buragawww.purl.org/net/busaco
utilizare practică a ontologiilor
www.slideshare.net/thanhtran81/sem-tech2013-tutorial-22953164
135. Domenii având cunoștințe modelate via ontologii
(Peter Mika & Thanh Tran, 2013)
semantic Web search
recurge la modele lingvistice + modele conceptuale
consideră intențiile utilizatorului (query intent)
Dr. Sabin Buragawww.purl.org/net/busaco
utilizare practică a ontologiilor
137. Query
Processing
Keywords
Web forms
Natural language
Formal language
• IR-style
matching & ranking
• DB-style precise
matching (queries)
• KB-style matching &
inferences
• Query visualization
• Document and data
presentation
Result
Presentation • Summarization
Query
Refinement
Knowledge
Representation
Semantic Models
Resources
Dr. Sabin Buragawww.purl.org/net/busaco
•
•
•
Query
Construction •
Documents
• Implicit feedback
• Explicit feedback
• Incentives
Document
Representation
138. Domenii având cunoștințe modelate via ontologii
(Martin et al., 2008; Fensel et al., 2007)
descrierea serviciilor Web
scop: automatizarea descoperirii, selectării, invocării,
compunerii și monitorizării execuției serviciilor Web
OWL-S, WSMO (Web Services Modeling Ontology)
www.daml.org/services/owl-s/
www.wsmo.org
Dr. Sabin Buragawww.purl.org/net/busaco
utilizare practică a ontologiilor
139. Domenii având cunoștințe modelate via ontologii
(Khalid Belhajjame et al., 2013)
ingineria modelării cunoștințelor
Dr. Sabin Buragawww.purl.org/net/busaco
utilizare practică a ontologiilor
provenance of a resource = a record that describes entities
and processes involved in producing and delivering
or otherwise influencing that resource
PROV (Provenance Ontology) – recomandare W3C (2013)
http://www.w3.org/TR/prov-o/
143. Mit:
the semantic Web technology is Description Logic
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
144. Mit:
the semantic Web technology is Description Logic
OWL este doar un limbaj al Web-ului semantic
aplicațiile (dezvoltatorii) care doresc să exprime
diverse expresivități îl pot utiliza
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
145. Asigurarea interoperabilității
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
o abordare pragmaticăfolosirea și altor limbaje via URI
JSON-LD – linked data via JSON
(proposed recommendation, W3C, noiembrie 2013)
http://json-ld.org/
JSONiq – realizarea de interogări asupra datelor JSON
www.jsoniq.org
147. Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
Având un model ontologic (consistent), pot fi
exprimate reguli referitoare la entitățile modelate
if condition then conclusion
antecedent
consecvent
148. Via reguli, pot fi deduse noi aspecte de interes
e.g., dacă un membru al unei echipe e interesat
de un limbaj de programare, atunci echipa în ansamblu
e interesată de acel limbaj
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
149. Via reguli, pot fi deduse noi aspecte de interes
e.g., dacă un membru al unei echipe e interesat
de un limbaj de programare, atunci echipa în ansamblu
e interesată de acel limbaj
?person interestedBy ?lang
?person member ?team
?team interestedBy ?lang
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
151. RIF (Rule Interchange Format)
suită de specificații W3C standardizate (2010, 2013)
www.w3.org/2005/rules/
www.w3.org/TR/rif-overview
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
152. RIF (Rule Interchange Format)
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
scop:
asigurarea interoperabilității vizând specificarea regulilor
și transferul între sisteme de reguli existente
153. RIF (Rule Interchange Format)
limitarea raționamentelor (ipoteza lumilor deschise)
prin reguli, se poate impune NAF – negation as failure
“If Cristina isn’t known to have a brother,
then assert she is brother-less.”
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
154. RIF (Rule Interchange Format)
regulile pot fi utilizare și în cadrul medierilor ontologice
la nivel de TBox și/sau ABox
“If Alex knows Bogdan and Bogdan knows Carmen
and Carmen hasFamilyMember Diana,
then assert Diana canTrust Alex.”
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
156. RIF (Rule Interchange Format)
RIF BLD – Basic Logic Dialect
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
aserțiunile privind condițiile + concluziile sunt monotone
valoarea de adevăr a predicatelor nu poate fi schimbată
157. RIF (Rule Interchange Format)
RIF BLD – Basic Logic Dialect
if Ana rel:childOf Bogdan
and Bogdan rel:brotherOf Cosmin
then Cosmin rel:uncleOf Ana
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
158. RIF (Rule Interchange Format)
RIF PRD – Production Rule Dialect
aserțiunile despre condiții + concluzii nu sunt monotone
valoarea de adevăr a predicatelor poate fi modificată
(similar situației de la limbajele de programare)
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
159. RIF (Rule Interchange Format)
RIF PRD – Production Rule Dialect
if customer.level = "premium"
then customer.discount = 0.25
inițial: customer.discount = 0
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
160. Studiu de caz (Amit Sheth)
utilizarea ontologiilor și regulilor
în contextul aplicațiilor financiare
scop:
automatizarea detectării inconsistențelor
și neregulilor financiare
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
161. Studiu de caz (Amit Sheth)
specificarea riguroasă a terminologiei
din sistemul financiar
integrarea datelor din surse multiple (semi)structurate
managementul și evaluarea formulelor analitice
asupra datelor financiare
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
162. Studiu de caz (Amit Sheth, 2006)
pasul I:
crearea ontologiei – financial domain ontology –,
populată pe baza unor surse de încredere
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
163. Studiu de caz (Amit Sheth, 2006)
pasul II:
implementarea unor extractori software
pentru eliminarea ambiguităților privind datele
+ deducerea relațiilor relevante dintre acestea
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
164. Studiu de caz (Amit Sheth, 2006)
pasul III:
dezvoltarea unui cadru de lucru
pentru specificarea formulelor/regulilor
și pentru interogarea cunoștințelor modelate ontologic
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
166. Studiu de caz (Q. Zhu et al., 2010)
recurgerea la reguli pentru descoperirea
informațiilor privitoare la medicamente
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
scop:
detectarea relațiilor între componentele medicamentelor
și efecte biologice, în contextul diverselor afecțiuni
167. Studiu de caz (Q. Zhu et al., 2010)
date preluate via servicii Web:
PubChem Compound, Pubchem BioAssay, Drug Bank
agregarea informațiilor se realizează folosind
WENDI (Web Engine for Non-obvious Drug Information)
procesare – inclusiv a regulilor – folosind Apache Jena
http://jena.apache.org/
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
168. Scenariu de recomandare de produse (S. Hawke, 2009)
utilizatorul se află într-un magazin și
dorește să cumpere un obiect
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
folosind telefonul mobil scanează produsul și poate obține
via sistem(e) de reguli descrise semantic
prețul în alte magazine din vecinătate, caracteristici de
interes – e.g., proveniență, componente, păreri,
pericole/maniere de utilizare,… –,
oferte ale producătorului, dacă prietenii îl dețin deja etc.
169. Mit:
semantic Web is about public data
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
170. Mit:
semantic Web is about public data
tehnologiile Web-ului semantic se pot aplica
și în cazul datelor la nivel personal, de grup,
organizațional – inclusiv vizând mediile enterprise
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
171. Sabin
Anca
Paul
Radu
d in ( p ) x; rel ( x, p )
din ( Anca) 4
Cristina
analiza rețelelor sociale via teoria grafurilor
Man
dc:creator
type
author
Sabin
web.html
type
dc:title
Person
Dezvoltarea aplicatiilor Web
creator
subProperty
Person
subClass
author
Man
model ontologic
de la modelare formală la specificații ontologice
adaptare după Fabien Gandon (2009)
Dr. Sabin Buragawww.purl.org/net/busaco
Claudia
172. Mit:
semantic Web is about public data
…dar nu trebuie ignorate așteptările utilizatorilor
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
acces public la informații/cunoștințe procesabile automat
open knowledge
open government, open culture, open science etc.
173. Alte mituri (Tim Berners-Lee)
the semantic Web is about hand-annotated
Web pages
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
174. Alte mituri (Tim Berners-Lee)
the semantic Web is about hand-annotated
Web pages
such pages are interesting,
but not the mainstay of semantic Web: too much trouble!
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
175. Alte mituri (Tim Berners-Lee)
the semantic Web is mainly about content
extracted from text
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
176. Alte mituri (Tim Berners-Lee)
the semantic Web is mainly about content
extracted from text
it is primarily an interlingua for relational data and logic
bridges will always be important
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
177. Alte mituri (Tim Berners-Lee)
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
the semantic Web is about making one big ontology
178. Alte mituri (Tim Berners-Lee)
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
the semantic Web is about making one big ontology
the semantic Web is about a fractal mess
of interconnected vocabularies/ontologies
a se (re)vedea inițiativa Linked Open Data
179. Alte mituri (Tim Berners-Lee)
the semantic Web ontologies must all be consistent
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
180. Alte mituri (Tim Berners-Lee)
the semantic Web ontologies must all be consistent
only the parts I am using together
existența instrumentelor – teoretice și practice –
de verificare formală + efectuare de raționamente
Dr. Sabin Buragawww.purl.org/net/busaco
ce este web-ul semantic
181. Diverse aspecte avute în vedere de Web-ul semantic
pot fi aplicații pe scară largă
(e.g., în cadrul cloud computing, în contextul big data)
căutare, regăsire, reutilizare de date/cunoștințe
data/relation/knowledge mining
sisteme de recomandare (socială) „inteligentă”
etc.
problematici avute în vedere de Web science
Dr. Sabin Buragawww.purl.org/net/busaco
ce va fi web-ul semantic
182. Inginerie ontologică
alinieri de ontologii,
șabloane de proiectare,
utilizări practice, perspective
Dr. Sabin Buragawww.purl.org/net/busaco
rezumat