1. Knowledge Graphs im Tourismus
Elias Kärle, Semantic Technology Institute, Universität Innsbruck
18.7.2018, KG Workshop, Innsbruck
@eliaska
2. Semantic Technology Institute
» Teil des Institutes für Informatik der Universität Innsbruck
» Gegründet 2006 von Univ.-Prof. Dr. Dieter Fensel
» Forschung & Entwicklung: Informations- und Kommunikations-
technologien basierend auf semantischen Technologien
„Verticals“ hauptsächlich:
» eTourismus
» eCommerce
» Online Communication
Page 2KG Workshop I Elias Kärle I 18. Juli 2018
3. Semantic Technology Institute
Forschungsthemen
» „Web 5.0“
• Annotation von Webseiten und Validierung
• Linked Open Data durch semantische Annotationen
• Knowledge Graphs
» Multi-Channel Social Media
• Automatische Verteilung von Inhalten
• „Reposting“ externer Inhalte
» Dialogsysteme
• Dialogbasierte Interaktion mit dem Gast/Kunden
» Intelligente Persönliche Assistenten (IPA)
• Automatischer annotationsbasierte Anwendungen für Alexa & Co.
Page 3KG Workshop I Elias Kärle I 18. Juli 2018
4. Team und Expertise
» Elias Kärle
• Wissenschaftlicher Mitarbeiter am STI seit 2014
• davor Studium der Informatik
• 5 Jahre Softwareentwickler (Web, Apps)
» Derzeitiger Forschungsschwerpunkt:
• semantische Technologien im Tourismus
• effiziente Linked Open Data Publikation im Web
• Light-weight Semantic Web Services
• Knowledge Graphs im Tourismus
Page 4KG Workshop I Elias Kärle I 18. Juli 2018
5. Team und Expertise
» Umutcan Simsek
• Semantische Validierung, Dialogsysteme
» Oleksandra Panasiuk
• Schema.org Design Patterns
» Boran Balci
• Technische Aspekte von Knowledge Graphs
Page 5KG Workshop I Elias Kärle I 18. Juli 2018
6. 1. Das Headless Web
2. (Linked) Open Data
3. Der „Tiroler Knowledge Graph“
4. Show Cases
5. Challenges
Page 6
Inhalt
KG Workshop I Elias Kärle I 18. Juli 2018
7. „In 10 Jahren wird es das Web wie wir es kennen nicht mehr geben!“
Page 7
1. Das Headless Web
KG Workshop I Elias Kärle I 18. Juli 2018
Headless Web!
8. 1. Das Headless Web
Das Headless Web ist ausgerichtet auf die „neuen Konsumenten“ von Web Inhalten!
Page 8KG Workshop I Elias Kärle I 18. Juli 2018
IPAs, Chatbots, …Menschen
9. 1. Das Headless Web
Veränderung ist deutlich sichtbar:
Suchmaschinen Hotel Buchungen Einzelhandel
Page 9KG Workshop I Elias Kärle I 18. Juli 2018
10. 1. Das Headless Web
Probleme des Headless Web:
• individuelle Webseiten verschwinden
• kleine Produkt- und Serviceanbieter im Web verschwinden
Probleme Produkte & Services zu guten Konditionen zu verkaufen
• “Big Players” werden stärker
• Monopole Preisanstieg Anbieter & Konsumenten leiden darunter
Page 10KG Workshop I Elias Kärle I 18. Juli 2018
11. 1. Das Headless Web
» Wie kann man das Beste aus dieser Entwicklung machen?
Warum sind Suchmaschinen so stark? Daten
Warum sind OTAs so stark? Daten
Wer hat KEINE Daten Entwickler, Forscher, Startups, …
„Wie soll ernstzunehmende Konkurrenz für Suchmaschinen, OTAs & Co
entstehen wenn alle Daten unter Verschluss gehalten werden?“
„Daten hinter verschlossenen Türen hemmen Innovation!“
Page 11KG Workshop I Elias Kärle I 18. Juli 2018
12. 1. Das Headless Web
» Also was tun?
Eine Möglichkeit:
Daten öffnen für alle Anwender
Daten als Open Data zur Verfügung stellen
Anwendungen erstellen die jene Daten nutzen
z.B.: Speicherung und Verbreitung über einen
„Knowledge Graph“
Page 12KG Workshop I Elias Kärle I 18. Juli 2018
13. 2. (Linked) Open Data
Was ist Open Data?
Hauptthemen:
» Verfügbarkeit und freier Zugang
» Wiederverwendung und Weitergabe
» Universelle Beteiligung
Page 13KG Workshop I Elias Kärle I 18. Juli 2018
“Als Open Data (aus englisch open data, wörtlich offene Daten)
werden Daten bezeichnet, die von jedermann ohne jegliche
Einschränkungen genutzt, weiterverbreitet und
weiterverwendet werden dürfen.”[1]
[1] Jörn von Lucke, Christian Geiger: Open Government Data (Frei verfügbare Daten des öffentlichen Sektors). Hrsg.: zeppelin university. Friedrichshafen 3. Dezember 2010
14. 2. (Linked) Open Data
Warum Open Data?
» „Daten gehören den Menschen“ – medizinische Forschung, Genom
Forschung
» Mit öffentliche Geldern ermöglicht – allgemein universitäre Forschung,
Governement Data
» Fakten können nicht dem Urheberrecht unterliegen
» Freier Zugang ermöglicht Zusammenarbeit – Wikipedia
» Forschungsförderung durch freie Forschungsergebnisse
» Zeit & Geldersparnis für Behörden durch weniger/keine Anfragen
» Mehr Information für Bürger wenn Daten über Umgebung offen sind
» Mehr INNOVATION!
Page 14KG Workshop I Elias Kärle I 18. Juli 2018
15. 2. (Linked) Open Data
Beispiele für Open Data?
» Transparenz:
• Finnische “Tax Free”, Britische “Where does my Money go?”
Steuerhinterziehung in Höhe von 3.2 Milliarden kanadischen Dollar bei
gemeinnützigen Organisationen aufdecken
» Innovation
• Wiener Öffi App mit Abfahrtsmonitor
• bodenpreise.at
• Tyrolean Map
• Toilet Map Vienna – Augmented Reality App
• Schal legal?
Page 15KG Workshop I Elias Kärle I 18. Juli 2018
16. 2. (Linked) Open Data
Was ist Linked Open Data?
Linked Open Data = Linked Data + Open Data
Was ist Linked Data?
Page 16KG Workshop I Elias Kärle I 18. Juli 2018
17. 2. (Linked) Open Data
Was ist Linked Data?
» Tim Berners-Lee skizzierte 2006 vier Prinzipien für "Linked Data"[1] :
1) Verwende URIs um “Dinge” zu identifizieren
2) Verwende HTTP URIs, dass diese Dinge auch interpretiert
(“dereferenziert”) werden können
3) Stelle brauchbare Information zur Verfügung wenn jemand die URL öffnet
(vorzugsweise unter Verwendung von offenen Standards: RDF, SPARQL, …)
4) Stelle bei der Veröffentlichung der Daten im Web Verweise zu HTTP URIs
anderer “Dingen” her um mehr darüber zu erfahren
Page 17KG Workshop I Elias Kärle I 18. Juli 2018
[1] Tim Berners-Lee: https://www.w3.org/DesignIssues/LinkedData.html
18. 2. (Linked) Open Data
Linked Open Data (LOD)
» Linked Data wird als
Open Data publiziert
Page 18KG Workshop I Elias Kärle I 18. Juli 2018
19. 2. (Linked) Open Data
» Linked Open Data
Page 19KG Workshop I Elias Kärle I 18. Juli 2018
Offene Lizenz
Maschinenlesbar
Offenes Format
Genügt RDF Standards
Verlinkt m. anderen Datensätzen
https://5stardata.info
20. 3. Knowledge Graph
» Was ist ein Knowledge Graph?
In relationaler Datenbank… Speicherung von Daten in Tabellen
Spalten für Eigenschaften
Zeilen für Werte
Page 20KG Workshop I Elias Kärle I 18. Juli 2018
21. 3. Knowledge Graph
In einem Knowledge Graph, Speicherung von Daten als Knoten und
Verbindungen zwischen den Knoten.
Page 21KG Workshop I Elias Kärle I 18. Juli 2018
Bild: https://www.w3.org/TR/rdf11-primer/
22. 3. Knowledge Graph
Warum Knowledge Graphs?
» Technische Vorteile
» Wissenschaftliches Interesse
» Touristisches Interesse
Page 22KG Workshop I Elias Kärle I 18. Juli 2018
23. 3. Knowledge Graph
Warum Knowledge Graphs?
» Technische Vorteile:
• Adaptierbar – kein fixes Schema
• schnelle Anfragen/Suche
• Semantische Technologien sind anwendbar
Page 23KG Workshop I Elias Kärle I 18. Juli 2018
24. 3. Knowledge Graph
Warum Knowledge Graphs?
» Wissenschaftliches Interesse:
• Methoden zur Publikation und Aggregation
semantischer Daten
• Weiteres Anwendungsgebiet von schema.org
• Zeitreihenanalysen
• Open Data Anwendungen
• Basis für Machine Leraning und AI
Page 24KG Workshop I Elias Kärle I 18. Juli 2018
25. 3. Knowledge Graph
Warum Knowledge Graphs?
» Touristisches Interesse:
• Sammlung von Open Data (offene Daten)
• Zeitreihenanalyse: Preisentwicklung, Besucherströme, …
• Möglichkeit für Drittanwender Anwendungen zu
erstellen (Auskunft, Buchung, Verkauf, …)
• Schaffung innovativer Services durch Kombination und
Wiederverwendung von Datensätzen
Page 25KG Workshop I Elias Kärle I 18. Juli 2018
26. 3. Knowledge Graph
Wie füllen wir unseren KG?
1) Crawling
Page 26KG Workshop I Elias Kärle I 18. Juli 2018
2) Mapping
27. 3. Knowledge Graph
1) Crawling
» Automatisierte Suche nach touristisch relevanten Inhalten im Web
» Nur semantisch angereicherte Information
maschinenlesbar, maschineninterpretierbar
» Webseiten mit schema.org Annotationen
Page 27KG Workshop I Elias Kärle I 18. Juli 2018
28. 3. Knowledge Graph
1) Crawling: schema.org
» Ins Leben gerufen und gewartet von vier großen Suchmaschinenanbietern
» Vokabular zur Beschreibung von „Dingen“ im Web
» Weite Verbreitung im Web:
1) Starke Motivation: SEO „gratis“
2) „leicht“ anwendbar
nützliche Tools verfügbar
Page 28KG Workshop I Elias Kärle I 18. Juli 2018
http://www.schema.org/
29. 3. Knowledge Graph
1) Crawling: broker.semantify.it
Page 29KG Workshop I Elias Kärle I 18. Juli 2018
Hotel
Resta
urant
Shop
Skisch
ool
Guide
W
H
S
I
B
E
W
H
S
P
M
S
E
R
P
sdo/off
ers +
sdo/act
ions
website
sdo/off
ers +
sdo/act
ions
website
sdo/off
ers +
sdo/act
ions
website
sdo/off
ers +
sdo/act
ions
website
sdo/off
ers +
sdo/act
ions
website
extract
extract
extract
extract
extract
JSON-LD
JSON-LD
JSON-LD
JSON-LD
JSON-LD
31. 3. Knowledge Graph
2) Mapping:
» Abbilden verschiedener Datenquellen auf das schema.org Vokabular
» Automatisiertes übersetzen der Daten
Verschieden Kooperationspartner:
» Easybooking
» Feratel
» General Solutions
» Outdooractive
» Tirolwerbung
» Waldhart Software
Page 31KG Workshop I Elias Kärle I 18. Juli 2018
32. 3. Knowledge Graph
» Beispiel eines solchen Mappings (General Solutions Datensatz):
Page 32KG Workshop I Elias Kärle I 18. Juli 2018
Objekt Type Schema.org Type
Schiff & Bahn CivicStructure
Freizeitpark Park
Themen- & Lehrpfad SportsActivityLocation
Museum Museum
Therme & Wasserwelt SportsActivityLocation
Shopping ShoppingCenter
Bergbahn CivicStructure
Sommerrodelbahn SportsActivityLocation
33. 3. Knowledge Graph
2) Mapping: semantify.it
» Plattform zur:
• Erzeugung
• Validierung
• Veröffentlichung
von Annotationen
» Für statische, dynamische und aktive Daten
• DS Editor, Annotaiton Editor
• Wrapper, Heuristics
• Semantify.it-Actions
Page 33KG Workshop I Elias Kärle I 18. Juli 2018
34. 3. Knowledge Graph
2) Mapping: semantify.it
Page 34KG Workshop I Elias Kärle I 18. Juli 2018
35. 3. Knowledge Graph
Page 35KG Workshop I Elias Kärle I 18. Juli 2018
T
G
K
TVB
TW
Hot
els
Ber
gba
hn
Skis
chu
le
F
GS
IM
ODA
WH
EB
…
offene Daten
Bild: Kärle, 2018
36. 3. Knowledge Graph
» 2.8 Milliarden Fakten (Triples)
» Täglich ~8 Mio neue Einträge
» Welche Daten:
• Statische, dynamische, aktive
POIs, Wanderungen
Hotels, Restaurants
Angebote, Verfügbarkeiten
Events
Buchungsschnittstellen, Suchinterfaces
Page 36KG Workshop I Elias Kärle I 18. Juli 2018
37. 3. Knowledge Graph
» Häufigste Datentypen (täglich):
schema.org/ImageObject ~ 596.000
schema.org/PostalAddress ~ 165.000
schema.org/GoeCoordinates ~ 143.000
schema.org/Event ~ 133.000
schema.org/Offer ~ 30.000
schema.org/Product ~ 30.000
schema.org/HotelRoom ~ 17.000
Page 37KG Workshop I Elias Kärle I 18. Juli 2018
38. 4. Show Cases
» Demo Sprachassistent
Alexa Skill die Fragen auf Basis des Knowledge Graph beantwortet
Page 38KG Workshop I Elias Kärle I 18. Juli 2018
Demo am STI Stand! Bild: Panasiuk et al., 2018
39. 4. Show Cases
» Demo Sprachassistent
Alexa Skill die Fragen auf Basis des Knowledge Graph beantwortet
Page 39KG Workshop I Elias Kärle I 18. Juli 2018
https://youtu.be/8Q5asdmWp0s
40. 4. Show Cases
» Zimmerbuchung über Knowledge Graphen
Schnittstelle über dem Knowledge Graphen
• Einstiegspunkt: annotiertes Suchfeld (schema:SearchAction)
• Antwort: Liste von Angeboten (schema:Offer)
Angebot beinhaltet Anknüpfungsinformation (schema:Action), welche auf
die Buchungsstrecke des Anbieters verweist
Page 40KG Workshop I Elias Kärle I 18. Juli 2018
Hotel
I
B
E
Bild: Kärle et al., 2018
41. 4. Show Cases
» Data Analysis
Redundante Datenhaltung für Zeitreihenanalysen
Page 41KG Workshop I Elias Kärle I 18. Juli 2018
Bild: Simsek et al., 2018
42. 5. Challenges
Offene Herausforderungen:
» Hardware / Software
• Preis
• Performance
• Verfügbarkeit
• Sicherheit
» Entity Recognition
• Mehrere „Schloss Ambras“ – welches ist „das richtige?
• Welche Perspektive interessiert wen?
Page 42KG Workshop I Elias Kärle I 18. Juli 2018
43. 5. Challenges
» Entity Matching / Reconciliation
• sollen Typen überhaupt „zusammengeführt“ werden
• Wer macht das?
• Hilfreiche Vereinfachung oder ungewollter Bias?
» Entitiy Personalization / Personal Enhancing
• Wie kann man Daten mit eigener Information anreichern
» History / Versionierung
• Wann und wie oft wird dupliziert?
• Was wird dupliziert (Git oder CVS Ansatz)?
Page 43KG Workshop I Elias Kärle I 18. Juli 2018
44. 5. Challenges
Ihr/wir seid/sind gefragt!
» Innovative Ideen für den Tourismus!
• Open Data als Motivation
• Daten Publikation
• Daten Konsum
Page 44KG Workshop I Elias Kärle I 18. Juli 2018