SoSe 2013 | IT-Zertifikat: AMM - Semantic Web und das Resource Description Framework
1. Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung
Jan G. Wieners // jan.wieners@uni-koeln.de
Daten- und Metadatenstandards
Sommersemester 2013
03. Juli 2013 – Semantic Web und das Resource Description Framework
2. Ausgangspunkt: Das World Wide Web (WWW)
Einschränkungen des WWW
Semantic Web
Problemstellung, Intention, Worum geht„s?
Wissensrepräsentation
Ontologien
Mikroformate
RDF
RDF / XML
Anwendung: FOAF
Sitzungsüberblick
4. Internet vs. WWW
WWW: Sehr großer Ressourcenfundus:
Dokumente bzw. Textuelle Information (HTML-Dokumente,
PDF, etc.)
Bilder
Videodateien
…
1989 am CERN entwickelt
Intention: Austausch von Forschungsergebnissen
Konzepte: Das WWW…
bietet Mechanismen, um auf Dokumente des Internets
zugreifen zu können HTTP, sowie die Eindeutige
Referenzierung von Inhalten: URL
bietet eine Syntax (HTML), um Dokumente anzuzeigen
und miteinander zu verknüpfen (Hyperlinks)
World Wide Web
5. Aufruf einer Website - HTTP
Client stellt Anfrage an Server
Server beantwortet Anfrage, d.h. liefert ein
Dokument / eine Ressource zurück
HTML definiert eine Syntax, die von Rechnern
verstanden werden kann HTML sagt dem
Rechner, wie das Dokument angezeigt werden soll
World Wide Web
10. „Magic“ II:
Ranking: Sortierung der Treffer von hochrelevanten zu
weniger relevanten Treffern
„Magic“ III:
Performance:
It‘s magic?
11. „What„s wrong with the web?“ – die Grenzen des
WWW
I. „Wer ist Jan Wieners?“
Suchanfrage: Wieners
[Wer], [ist] weniger relevante Suchterme
World Wide Web
12. Probleme:
Prüfung der Suchergebnisse auf Benutzerseite - daran
haben wir uns gewöhnt
Gefahr / Dilemma: Die Suchanfrage ist
überspezifiziert Durch Angabe weiterer Suchterme
schränken wir die Trefferliste erneut ein
Weiteres Problem: Es könnten Seiten im WWW
existieren, die sich mit dem Suchbegriff beschäftigen,
ihn jedoch nicht nennen, z.B. Jan W.
(Zunehmendes Problem „Filter Bubble“: Wir
bekommen nur die Suchergebnisse, die
Suchmaschinenanbieter für uns vorsehen)
World Wide Web
13. „What„s wrong with the web?“ – die Grenzen des
WWW
II. „Zeige mir Fotos von Paris“
Suchmaschinen versuchen (mitunter), die
Bedeutung eines Bildes / das im Bild dargestellt
durch den Kontext zu erschließen:
Dateiname
Text, der sich in Bildnähe befindet
14. „What„s wrong with the
web?“ – die Grenzen
des WWW
III. „Finde Musik, die
ich mögen könnte“
Knackpunkt:
Hintergrundwissen –
Welche Musik mag ich
derzeit?
(Musikgeschmack
verändert sich mitunter)
World Wide Web
15. Oh weh, was meint sie
/ er damit bloß???
Den Computermechanismen
mangelt„s an Wissen!
„knowledge gap“:
Probleme im Verständnis
natürlicher Sprache
Interpretation des Inhaltes von
Bildern oder anderen
multimedialen Dingen
Computer verfügt nicht über
Hintergrundwissen über das der
Benutzer / die Benutzerin verfügt
Computer verfügt nicht über
Hintergrundwissen über die
Benutzerin / den Benutzer
16. Paradigmenwechsel: von passiver Rechenleistung
zu aktiver Rechenleistung (Verständnis der Inhalte)
Das Semantic Web will Computern helfen, die
Bedeutung hinter den Webseiten zu "verstehen“
Das derzeitige WWW dreht sich um Dokumente
Das Semantic Web dreht sich um Dinge
(Menschen, Musik, Filme), um Konzepte
Eine Möglichkeit: Einbettung semantischer
Information in HTML-Seiten
Semantic Web
18. Ach so ist das gemeint!
…hätte sie / er das nicht
gleich sagen können?!?
Wissenslücke zwischen
Benutzer und Computer
mindern
Bereitstellung von
Wissen in einer Art und
Weise, in der es von
Computern verarbeitet
werden und für weiteres
Schließen verwendet
werden kann
Z.B.: Bereitstellung von
(semantischen)
Metainformationen, die
die Inhalte der Website
beschreiben (description,
keywords, etc.)
19.
20. “Home pages typically say things such as:”
"My name is..."
"I work for..."
"I'm interested in..."
"I live near..."
"My blog is..."
"I write in this weblog..."
"You can see me in this picture..."
"My Public Key is ..."
“FOAF is a way to say all those things, but so that
computers can interpret it. Computers can't understand
English yet, so we have to be a little more precise in
how we say these things. FOAF is a way of saying
these things for computers.”
Friend-of-A-Friend (FOAF)
22. Konzept des Semantic Web formuliert 1996 von
Tim Berners-Lee
Kerntechnologien (logikbasierte Sprachen zur
Representation von Wissen und (automatisiertem)
Schließen) entwickelt im Forschungsfeld der
Künstlichen Intelligenz.
Standards: W3C
Ursprüngliche Intention: Annotation –
Anreicherung der Inhalte im WWW durch
Metadaten
Semantic Web
24. Kurzer Exkurs: Künstliche Intelligenz
Menschliches Denken Rationales Denken
„[Die Automatisierung von]
Aktivitäten, die wir dem
menschlichen Denken
zuordnen, Aktivitäten wie
beispielsweise
Entscheidungsfindung,
Problemlösung, Lernen..“
(Bellman, 1978)
„Die Studie mentaler
Fähigkeiten durch die
Nutzung
programmiertechnischer
Modelle.“
(Charniak und
McDermott,1985)
Menschliches Handeln Rationales Handeln
„Das Studium des
Problems, Computer dazu
zu bringen, Dinge zu tun,
bei denen ihnen
momentan der Mensch
noch überlegen ist.“
(Rich und Knight, 1991)
„Computerintelligenz ist die
Studie des Entwurfs
intelligenter Agenten.“
(Poole et al., 1998)
Fokussierungsweisen von KI nach Russell / Norvig
25. Ein Knackpunkt: Das Semantic Web macht Arbeit.
Benutzerinnen und Benutzer müssen neben
Inhalten auch Metadaten, d.h. beschreibende
Inhalte bereitstellen
Bei Webseiten: Mikroformate
…zurück zum Semantic Web
27. Wissensrepräsentation: Ontologien und Ontologiesprachen
(Ontologie: Wissenschaft vom Sein des Seienden)
Ontologien werden formuliert in formalen Sprachen mit einer
wohldefinierten Syntax
Ontologien gründen auf der Arbeit von Gemeinschaften
(Communities)
RDF und OWL = am häufigsten verwendete Sprachen
Ontologien
Leichtgewichtige: Unterscheidungen zwischen Klassen, Instanzen
und Eigenschaften, jedoch nur minimale Beschreibung der
Konzepte
Schwergewichtige: Machen„s möglich, präziser zu beschreiben,
wie Klassen von anderen Klassen abgeleitet sind
In der Praxis: leichtgewichtige Ontologien
Semantic Web
29. The Resource Description Framework (RDF)
Erfunden, um Ressourcen im WWW zu
beschreiben
Domänenunabhängig, d.h. kann auch dazu
verwendet werden, Entitäten der realen Welt zu
beschreiben
RDF ist eine einfache Modellierungssprache, ist
jedoch die Grundlage für komplexere Sprachen
wie OWL
RDF
30. W3C (http://www.w3schools.com/rdf/rdf_intro.asp):
RDF stands for Resource Description Framework
RDF is a framework for describing resources on the web
RDF is designed to be read and understood by
computers
RDF is not designed for being displayed to people
RDF is written in XML
RDF is a part of the W3C's Semantic Web Activity
RDF is a W3C Recommendation
RDF
40. Unterscheidung:
Ressourcen: Alles, was über einen Uniform
Resource Identifier (URI) referenziert werden kann
Eigenschaften (properties): Eigenschaften von
Ressourcen
Ausdrücke (Expressions) werden geformt mit
Tripeln in der Form (Subjekt, Prädikat, Objekt)
Ausdrücke (statements) = resource + properties
RDF
44. „The FOAF ("Friend of a Friend") project is a
community driven effort to define an RDF
vocabulary for expressing metadata about people,
and their interests, relationships and activities.”
Grundaufbau eines FOAF-Dokumentes:
RDF / XML und FOAF
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:foaf="http://xmlns.com/foaf/0.1/">
<!– Hier kommt das FOAF-XML rein -->
</rdf:RDF>
45. Hinzufügen einer Person und eines Namens:
RDF / XML und FOAF
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:foaf="http://xmlns.com/foaf/0.1/">
<foaf:Person>
<foaf:name>Jan Wieners</foaf:name>
</foaf:Person>
</rdf:RDF>
46. Hinzufügen einer Email-Adresse:
RDF / XML und FOAF
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:foaf="http://xmlns.com/foaf/0.1/">
<foaf:Person>
<foaf:name>Jan Wieners</foaf:name>
<foaf:mbox rdf:resource="mailto:jan.wieners@uni-koeln.de"/>
</foaf:Person>
</rdf:RDF>
48. Beschreiben Sie sich selbst mit den Begriffen aus FOAF in RDF /
XML. Ergänzen Sie Freund- und Bekanntschaften. Das FOAF-
Vokabular finden Sie erläutert unter http://xmlns.com/foaf/spec/.
Prüfen Sie Ihre Arbeit mit dem W3C-Validator unter
http://www.w3.org/RDF/Validator
Startpunkt:
RDF - Übung
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:foaf="http://xmlns.com/foaf/0.1/">
<!– Hier kommt das FOAF-XML rein -->
</rdf:RDF>