SlideShare ist ein Scribd-Unternehmen logo
1 von 45
Downloaden Sie, um offline zu lesen
Knowledge Graphs im Tourismus
Elias Kärle, Semantic Technology Institute, Universität Innsbruck
18.7.2018, KG Workshop, Innsbruck
@eliaska
Semantic Technology Institute
» Teil des Institutes für Informatik der Universität Innsbruck
» Gegründet 2006 von Univ.-Prof. Dr. Dieter Fensel
» Forschung & Entwicklung: Informations- und Kommunikations-
technologien basierend auf semantischen Technologien
„Verticals“ hauptsächlich:
» eTourismus
» eCommerce
» Online Communication
Page 2KG Workshop I Elias Kärle I 18. Juli 2018
Semantic Technology Institute
Forschungsthemen
» „Web 5.0“
• Annotation von Webseiten und Validierung
• Linked Open Data durch semantische Annotationen
• Knowledge Graphs
» Multi-Channel Social Media
• Automatische Verteilung von Inhalten
• „Reposting“ externer Inhalte
» Dialogsysteme
• Dialogbasierte Interaktion mit dem Gast/Kunden
» Intelligente Persönliche Assistenten (IPA)
• Automatischer annotationsbasierte Anwendungen für Alexa & Co.
Page 3KG Workshop I Elias Kärle I 18. Juli 2018
Team und Expertise
» Elias Kärle
• Wissenschaftlicher Mitarbeiter am STI seit 2014
• davor Studium der Informatik
• 5 Jahre Softwareentwickler (Web, Apps)
» Derzeitiger Forschungsschwerpunkt:
• semantische Technologien im Tourismus
• effiziente Linked Open Data Publikation im Web
• Light-weight Semantic Web Services
• Knowledge Graphs im Tourismus
Page 4KG Workshop I Elias Kärle I 18. Juli 2018
Team und Expertise
» Umutcan Simsek
• Semantische Validierung, Dialogsysteme
» Oleksandra Panasiuk
• Schema.org Design Patterns
» Boran Balci
• Technische Aspekte von Knowledge Graphs
Page 5KG Workshop I Elias Kärle I 18. Juli 2018
1. Das Headless Web
2. (Linked) Open Data
3. Der „Tiroler Knowledge Graph“
4. Show Cases
5. Challenges
Page 6
Inhalt
KG Workshop I Elias Kärle I 18. Juli 2018
„In 10 Jahren wird es das Web wie wir es kennen nicht mehr geben!“
Page 7
1. Das Headless Web
KG Workshop I Elias Kärle I 18. Juli 2018
Headless Web!
1. Das Headless Web
Das Headless Web ist ausgerichtet auf die „neuen Konsumenten“ von Web Inhalten!
Page 8KG Workshop I Elias Kärle I 18. Juli 2018
 IPAs, Chatbots, …Menschen
1. Das Headless Web
Veränderung ist deutlich sichtbar:
Suchmaschinen Hotel Buchungen Einzelhandel
Page 9KG Workshop I Elias Kärle I 18. Juli 2018
1. Das Headless Web
Probleme des Headless Web:
• individuelle Webseiten verschwinden
• kleine Produkt- und Serviceanbieter im Web verschwinden
 Probleme Produkte & Services zu guten Konditionen zu verkaufen
• “Big Players” werden stärker
• Monopole  Preisanstieg  Anbieter & Konsumenten leiden darunter
Page 10KG Workshop I Elias Kärle I 18. Juli 2018
1. Das Headless Web
» Wie kann man das Beste aus dieser Entwicklung machen?
Warum sind Suchmaschinen so stark?  Daten
Warum sind OTAs so stark?  Daten
Wer hat KEINE Daten  Entwickler, Forscher, Startups, …
„Wie soll ernstzunehmende Konkurrenz für Suchmaschinen, OTAs & Co
entstehen wenn alle Daten unter Verschluss gehalten werden?“
„Daten hinter verschlossenen Türen hemmen Innovation!“
Page 11KG Workshop I Elias Kärle I 18. Juli 2018
1. Das Headless Web
» Also was tun?
Eine Möglichkeit:
 Daten öffnen für alle Anwender
 Daten als Open Data zur Verfügung stellen
 Anwendungen erstellen die jene Daten nutzen
 z.B.: Speicherung und Verbreitung über einen
„Knowledge Graph“
Page 12KG Workshop I Elias Kärle I 18. Juli 2018
2. (Linked) Open Data
Was ist Open Data?
Hauptthemen:
» Verfügbarkeit und freier Zugang
» Wiederverwendung und Weitergabe
» Universelle Beteiligung
Page 13KG Workshop I Elias Kärle I 18. Juli 2018
“Als Open Data (aus englisch open data, wörtlich offene Daten)
werden Daten bezeichnet, die von jedermann ohne jegliche
Einschränkungen genutzt, weiterverbreitet und
weiterverwendet werden dürfen.”[1]
[1] Jörn von Lucke, Christian Geiger: Open Government Data (Frei verfügbare Daten des öffentlichen Sektors). Hrsg.: zeppelin university. Friedrichshafen 3. Dezember 2010
2. (Linked) Open Data
Warum Open Data?
» „Daten gehören den Menschen“ – medizinische Forschung, Genom
Forschung
» Mit öffentliche Geldern ermöglicht – allgemein universitäre Forschung,
Governement Data
» Fakten können nicht dem Urheberrecht unterliegen
» Freier Zugang ermöglicht Zusammenarbeit – Wikipedia
» Forschungsförderung durch freie Forschungsergebnisse
» Zeit & Geldersparnis für Behörden durch weniger/keine Anfragen
» Mehr Information für Bürger wenn Daten über Umgebung offen sind
» Mehr INNOVATION!
Page 14KG Workshop I Elias Kärle I 18. Juli 2018
2. (Linked) Open Data
Beispiele für Open Data?
» Transparenz:
• Finnische “Tax Free”, Britische “Where does my Money go?”
 Steuerhinterziehung in Höhe von 3.2 Milliarden kanadischen Dollar bei
gemeinnützigen Organisationen aufdecken
» Innovation
• Wiener Öffi App mit Abfahrtsmonitor
• bodenpreise.at
• Tyrolean Map
• Toilet Map Vienna – Augmented Reality App
• Schal legal?
Page 15KG Workshop I Elias Kärle I 18. Juli 2018
2. (Linked) Open Data
Was ist Linked Open Data?
Linked Open Data = Linked Data + Open Data
 Was ist Linked Data?
Page 16KG Workshop I Elias Kärle I 18. Juli 2018
2. (Linked) Open Data
Was ist Linked Data?
» Tim Berners-Lee skizzierte 2006 vier Prinzipien für "Linked Data"[1] :
1) Verwende URIs um “Dinge” zu identifizieren
2) Verwende HTTP URIs, dass diese Dinge auch interpretiert
(“dereferenziert”) werden können
3) Stelle brauchbare Information zur Verfügung wenn jemand die URL öffnet
(vorzugsweise unter Verwendung von offenen Standards: RDF, SPARQL, …)
4) Stelle bei der Veröffentlichung der Daten im Web Verweise zu HTTP URIs
anderer “Dingen” her um mehr darüber zu erfahren
Page 17KG Workshop I Elias Kärle I 18. Juli 2018
[1] Tim Berners-Lee: https://www.w3.org/DesignIssues/LinkedData.html
2. (Linked) Open Data
Linked Open Data (LOD)
» Linked Data wird als
Open Data publiziert
Page 18KG Workshop I Elias Kärle I 18. Juli 2018
2. (Linked) Open Data
» Linked Open Data
Page 19KG Workshop I Elias Kärle I 18. Juli 2018
Offene Lizenz
Maschinenlesbar
Offenes Format
Genügt RDF Standards
Verlinkt m. anderen Datensätzen
https://5stardata.info
3. Knowledge Graph
» Was ist ein Knowledge Graph?
In relationaler Datenbank… Speicherung von Daten in Tabellen
 Spalten für Eigenschaften
 Zeilen für Werte
Page 20KG Workshop I Elias Kärle I 18. Juli 2018
3. Knowledge Graph
In einem Knowledge Graph, Speicherung von Daten als Knoten und
Verbindungen zwischen den Knoten.
Page 21KG Workshop I Elias Kärle I 18. Juli 2018
Bild: https://www.w3.org/TR/rdf11-primer/
3. Knowledge Graph
Warum Knowledge Graphs?
» Technische Vorteile
» Wissenschaftliches Interesse
» Touristisches Interesse
Page 22KG Workshop I Elias Kärle I 18. Juli 2018
3. Knowledge Graph
Warum Knowledge Graphs?
» Technische Vorteile:
• Adaptierbar – kein fixes Schema
• schnelle Anfragen/Suche
• Semantische Technologien sind anwendbar
Page 23KG Workshop I Elias Kärle I 18. Juli 2018
3. Knowledge Graph
Warum Knowledge Graphs?
» Wissenschaftliches Interesse:
• Methoden zur Publikation und Aggregation
semantischer Daten
• Weiteres Anwendungsgebiet von schema.org
• Zeitreihenanalysen
• Open Data Anwendungen
• Basis für Machine Leraning und AI
Page 24KG Workshop I Elias Kärle I 18. Juli 2018
3. Knowledge Graph
Warum Knowledge Graphs?
» Touristisches Interesse:
• Sammlung von Open Data (offene Daten)
• Zeitreihenanalyse: Preisentwicklung, Besucherströme, …
• Möglichkeit für Drittanwender Anwendungen zu
erstellen (Auskunft, Buchung, Verkauf, …)
• Schaffung innovativer Services durch Kombination und
Wiederverwendung von Datensätzen
Page 25KG Workshop I Elias Kärle I 18. Juli 2018
3. Knowledge Graph
Wie füllen wir unseren KG?
1) Crawling
Page 26KG Workshop I Elias Kärle I 18. Juli 2018
2) Mapping
3. Knowledge Graph
1) Crawling
» Automatisierte Suche nach touristisch relevanten Inhalten im Web
» Nur semantisch angereicherte Information
 maschinenlesbar, maschineninterpretierbar
» Webseiten mit schema.org Annotationen
Page 27KG Workshop I Elias Kärle I 18. Juli 2018
3. Knowledge Graph
1) Crawling: schema.org
» Ins Leben gerufen und gewartet von vier großen Suchmaschinenanbietern
» Vokabular zur Beschreibung von „Dingen“ im Web
» Weite Verbreitung im Web:
1) Starke Motivation: SEO „gratis“
2) „leicht“ anwendbar
 nützliche Tools verfügbar
Page 28KG Workshop I Elias Kärle I 18. Juli 2018
http://www.schema.org/
3. Knowledge Graph
1) Crawling: broker.semantify.it
Page 29KG Workshop I Elias Kärle I 18. Juli 2018
Hotel
Resta
urant
Shop
Skisch
ool
Guide
W
H
S
I
B
E
W
H
S
P
M
S
E
R
P
sdo/off
ers +
sdo/act
ions
website
sdo/off
ers +
sdo/act
ions
website
sdo/off
ers +
sdo/act
ions
website
sdo/off
ers +
sdo/act
ions
website
sdo/off
ers +
sdo/act
ions
website
extract
extract
extract
extract
extract
JSON-LD
JSON-LD
JSON-LD
JSON-LD
JSON-LD
3. Knowledge Graph
Page 30KG Workshop I Elias Kärle I 18. Juli 2018
3. Knowledge Graph
2) Mapping:
» Abbilden verschiedener Datenquellen auf das schema.org Vokabular
» Automatisiertes übersetzen der Daten
Verschieden Kooperationspartner:
» Easybooking
» Feratel
» General Solutions
» Outdooractive
» Tirolwerbung
» Waldhart Software
Page 31KG Workshop I Elias Kärle I 18. Juli 2018
3. Knowledge Graph
» Beispiel eines solchen Mappings (General Solutions Datensatz):
Page 32KG Workshop I Elias Kärle I 18. Juli 2018
Objekt Type Schema.org Type
Schiff & Bahn CivicStructure
Freizeitpark Park
Themen- & Lehrpfad SportsActivityLocation
Museum Museum
Therme & Wasserwelt SportsActivityLocation
Shopping ShoppingCenter
Bergbahn CivicStructure
Sommerrodelbahn SportsActivityLocation
3. Knowledge Graph
2) Mapping: semantify.it
» Plattform zur:
• Erzeugung
• Validierung
• Veröffentlichung
von Annotationen
» Für statische, dynamische und aktive Daten
• DS Editor, Annotaiton Editor
• Wrapper, Heuristics
• Semantify.it-Actions
Page 33KG Workshop I Elias Kärle I 18. Juli 2018
3. Knowledge Graph
2) Mapping: semantify.it
Page 34KG Workshop I Elias Kärle I 18. Juli 2018
3. Knowledge Graph
Page 35KG Workshop I Elias Kärle I 18. Juli 2018
T
G
K
TVB
TW
Hot
els
Ber
gba
hn
Skis
chu
le
F
GS
IM
ODA
WH
EB
…
offene Daten
Bild: Kärle, 2018
3. Knowledge Graph
» 2.8 Milliarden Fakten (Triples)
» Täglich ~8 Mio neue Einträge
» Welche Daten:
• Statische, dynamische, aktive
POIs, Wanderungen
Hotels, Restaurants
Angebote, Verfügbarkeiten
Events
Buchungsschnittstellen, Suchinterfaces
Page 36KG Workshop I Elias Kärle I 18. Juli 2018
3. Knowledge Graph
» Häufigste Datentypen (täglich):
schema.org/ImageObject ~ 596.000
schema.org/PostalAddress ~ 165.000
schema.org/GoeCoordinates ~ 143.000
schema.org/Event ~ 133.000
schema.org/Offer ~ 30.000
schema.org/Product ~ 30.000
schema.org/HotelRoom ~ 17.000
Page 37KG Workshop I Elias Kärle I 18. Juli 2018
4. Show Cases
» Demo Sprachassistent
Alexa Skill die Fragen auf Basis des Knowledge Graph beantwortet
Page 38KG Workshop I Elias Kärle I 18. Juli 2018
Demo am STI Stand! Bild: Panasiuk et al., 2018
4. Show Cases
» Demo Sprachassistent
Alexa Skill die Fragen auf Basis des Knowledge Graph beantwortet
Page 39KG Workshop I Elias Kärle I 18. Juli 2018
https://youtu.be/8Q5asdmWp0s
4. Show Cases
» Zimmerbuchung über Knowledge Graphen
Schnittstelle über dem Knowledge Graphen
• Einstiegspunkt: annotiertes Suchfeld (schema:SearchAction)
• Antwort: Liste von Angeboten (schema:Offer)
 Angebot beinhaltet Anknüpfungsinformation (schema:Action), welche auf
die Buchungsstrecke des Anbieters verweist
Page 40KG Workshop I Elias Kärle I 18. Juli 2018
Hotel
I
B
E
Bild: Kärle et al., 2018
4. Show Cases
» Data Analysis
Redundante Datenhaltung für Zeitreihenanalysen
Page 41KG Workshop I Elias Kärle I 18. Juli 2018
Bild: Simsek et al., 2018
5. Challenges
Offene Herausforderungen:
» Hardware / Software
• Preis
• Performance
• Verfügbarkeit
• Sicherheit
» Entity Recognition
• Mehrere „Schloss Ambras“ – welches ist „das richtige?
• Welche Perspektive interessiert wen?
Page 42KG Workshop I Elias Kärle I 18. Juli 2018
5. Challenges
» Entity Matching / Reconciliation
• sollen Typen überhaupt „zusammengeführt“ werden
• Wer macht das?
• Hilfreiche Vereinfachung oder ungewollter Bias?
» Entitiy Personalization / Personal Enhancing
• Wie kann man Daten mit eigener Information anreichern
» History / Versionierung
• Wann und wie oft wird dupliziert?
• Was wird dupliziert (Git oder CVS Ansatz)?
Page 43KG Workshop I Elias Kärle I 18. Juli 2018
5. Challenges
Ihr/wir seid/sind gefragt!
» Innovative Ideen für den Tourismus!
• Open Data als Motivation
• Daten Publikation
• Daten Konsum
Page 44KG Workshop I Elias Kärle I 18. Juli 2018
www.sti-innsbruck.at
@eliaska

Weitere ähnliche Inhalte

Was ist angesagt?

Open Government Data als nachhaltige Massnahme fuer die digitale Infrastrukt...
Open Government Data als nachhaltige Massnahme fuer die digitale Infrastrukt...Open Government Data als nachhaltige Massnahme fuer die digitale Infrastrukt...
Open Government Data als nachhaltige Massnahme fuer die digitale Infrastrukt...Martin Kaltenböck
 
Agenda digitales gesundheitswesen offene_gesundheitsdaten_20150120
Agenda  digitales gesundheitswesen offene_gesundheitsdaten_20150120Agenda  digitales gesundheitswesen offene_gesundheitsdaten_20150120
Agenda digitales gesundheitswesen offene_gesundheitsdaten_20150120Andre Golliez
 
Offen (nur) gegen Gebühr? Die Open-Data-Gretchenfrage.
Offen (nur) gegen Gebühr? Die Open-Data-Gretchenfrage.Offen (nur) gegen Gebühr? Die Open-Data-Gretchenfrage.
Offen (nur) gegen Gebühr? Die Open-Data-Gretchenfrage.Oliver Bildesheim
 
Open Government Data Breakfast am 12.5.2010
Open Government Data Breakfast am 12.5.2010Open Government Data Breakfast am 12.5.2010
Open Government Data Breakfast am 12.5.2010Semantic Web Company
 
OpenData und Lokaljournalismus | Scoopcamp HH 2010
OpenData und Lokaljournalismus | Scoopcamp HH 2010OpenData und Lokaljournalismus | Scoopcamp HH 2010
OpenData und Lokaljournalismus | Scoopcamp HH 2010Lorenz Matzat
 
1st Open Government Data Meetup Austria, Keynote by Andreas Langegger
1st Open Government Data Meetup Austria, Keynote by Andreas Langegger1st Open Government Data Meetup Austria, Keynote by Andreas Langegger
1st Open Government Data Meetup Austria, Keynote by Andreas LangeggerAndreas Langegger
 
OpenData als Demokratiemotor
OpenData als DemokratiemotorOpenData als Demokratiemotor
OpenData als DemokratiemotorLorenz Matzat
 

Was ist angesagt? (7)

Open Government Data als nachhaltige Massnahme fuer die digitale Infrastrukt...
Open Government Data als nachhaltige Massnahme fuer die digitale Infrastrukt...Open Government Data als nachhaltige Massnahme fuer die digitale Infrastrukt...
Open Government Data als nachhaltige Massnahme fuer die digitale Infrastrukt...
 
Agenda digitales gesundheitswesen offene_gesundheitsdaten_20150120
Agenda  digitales gesundheitswesen offene_gesundheitsdaten_20150120Agenda  digitales gesundheitswesen offene_gesundheitsdaten_20150120
Agenda digitales gesundheitswesen offene_gesundheitsdaten_20150120
 
Offen (nur) gegen Gebühr? Die Open-Data-Gretchenfrage.
Offen (nur) gegen Gebühr? Die Open-Data-Gretchenfrage.Offen (nur) gegen Gebühr? Die Open-Data-Gretchenfrage.
Offen (nur) gegen Gebühr? Die Open-Data-Gretchenfrage.
 
Open Government Data Breakfast am 12.5.2010
Open Government Data Breakfast am 12.5.2010Open Government Data Breakfast am 12.5.2010
Open Government Data Breakfast am 12.5.2010
 
OpenData und Lokaljournalismus | Scoopcamp HH 2010
OpenData und Lokaljournalismus | Scoopcamp HH 2010OpenData und Lokaljournalismus | Scoopcamp HH 2010
OpenData und Lokaljournalismus | Scoopcamp HH 2010
 
1st Open Government Data Meetup Austria, Keynote by Andreas Langegger
1st Open Government Data Meetup Austria, Keynote by Andreas Langegger1st Open Government Data Meetup Austria, Keynote by Andreas Langegger
1st Open Government Data Meetup Austria, Keynote by Andreas Langegger
 
OpenData als Demokratiemotor
OpenData als DemokratiemotorOpenData als Demokratiemotor
OpenData als Demokratiemotor
 

Ähnlich wie kg-workshop

TFF2018 - Vortrag: Elias Kärle, STI Innsbruck
TFF2018 - Vortrag: Elias Kärle, STI InnsbruckTFF2018 - Vortrag: Elias Kärle, STI Innsbruck
TFF2018 - Vortrag: Elias Kärle, STI InnsbruckTourismFastForward
 
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...Martin Kaltenböck
 
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)Martin Kaltenböck
 
Datenmonitoring am Beispiel OGD
Datenmonitoring am Beispiel OGD Datenmonitoring am Beispiel OGD
Datenmonitoring am Beispiel OGD Bernhard Krabina
 
OkLab Leipzig (state: 2017)
OkLab Leipzig (state: 2017)OkLab Leipzig (state: 2017)
OkLab Leipzig (state: 2017)joergreichert
 
DMA IGNITE NIGHT - Open Data Wien
DMA IGNITE NIGHT - Open Data WienDMA IGNITE NIGHT - Open Data Wien
DMA IGNITE NIGHT - Open Data WienData Market Austria
 
Forschungsdatenmanagement in den (vergleichenden) Regionalwissenschaften - am...
Forschungsdatenmanagement in den (vergleichenden) Regionalwissenschaften - am...Forschungsdatenmanagement in den (vergleichenden) Regionalwissenschaften - am...
Forschungsdatenmanagement in den (vergleichenden) Regionalwissenschaften - am...Jan Lüth
 
Bat open data und datenwirtschaft in der schweiz_20150619
Bat open data und datenwirtschaft in der schweiz_20150619Bat open data und datenwirtschaft in der schweiz_20150619
Bat open data und datenwirtschaft in der schweiz_20150619Andre Golliez
 
Open Government Data als Teil der Open Commons Region Linz, Stefan Pawel, G...
Open Government Data als Teil der Open Commons Region Linz, Stefan Pawel, G...Open Government Data als Teil der Open Commons Region Linz, Stefan Pawel, G...
Open Government Data als Teil der Open Commons Region Linz, Stefan Pawel, G...Semantic Web Company
 
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot ATLinked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot ATMartin Kaltenböck
 
Code for Germany – Slidedeck Dez. 2014
Code for Germany – Slidedeck Dez. 2014Code for Germany – Slidedeck Dez. 2014
Code for Germany – Slidedeck Dez. 2014codeforde
 
Globale Standards im Web of Things
Globale Standards im Web of ThingsGlobale Standards im Web of Things
Globale Standards im Web of ThingsGeorg Rehm
 
Wo stehen wir mit Open Government Data in der Schweiz? (Juni 2012)
Wo stehen wir mit Open Government Data in der Schweiz? (Juni 2012)Wo stehen wir mit Open Government Data in der Schweiz? (Juni 2012)
Wo stehen wir mit Open Government Data in der Schweiz? (Juni 2012)OpendataCH
 
Open Government Data
Open Government DataOpen Government Data
Open Government DataPeter Parycek
 

Ähnlich wie kg-workshop (20)

TFF2018 - Vortrag: Elias Kärle, STI Innsbruck
TFF2018 - Vortrag: Elias Kärle, STI InnsbruckTFF2018 - Vortrag: Elias Kärle, STI Innsbruck
TFF2018 - Vortrag: Elias Kärle, STI Innsbruck
 
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
 
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
Einführung Linked Open Data (LOD) - Introduction to Linked Open Data (LOD)
 
BMVIT & Data Market Austria
BMVIT & Data Market AustriaBMVIT & Data Market Austria
BMVIT & Data Market Austria
 
20161103 dma odp + data pioneers
20161103 dma odp + data pioneers20161103 dma odp + data pioneers
20161103 dma odp + data pioneers
 
ODP und Data Market Austria
ODP und Data Market AustriaODP und Data Market Austria
ODP und Data Market Austria
 
Vienna od meet-up-20oct2016-tuwien
Vienna od meet-up-20oct2016-tuwienVienna od meet-up-20oct2016-tuwien
Vienna od meet-up-20oct2016-tuwien
 
Datenmonitoring am Beispiel OGD
Datenmonitoring am Beispiel OGD Datenmonitoring am Beispiel OGD
Datenmonitoring am Beispiel OGD
 
DMA Ignite Night - BMVIT
DMA Ignite Night - BMVITDMA Ignite Night - BMVIT
DMA Ignite Night - BMVIT
 
OkLab Leipzig (state: 2017)
OkLab Leipzig (state: 2017)OkLab Leipzig (state: 2017)
OkLab Leipzig (state: 2017)
 
20161020 od meet up odp & data pioneers
20161020 od meet up odp & data pioneers20161020 od meet up odp & data pioneers
20161020 od meet up odp & data pioneers
 
DMA IGNITE NIGHT - Open Data Wien
DMA IGNITE NIGHT - Open Data WienDMA IGNITE NIGHT - Open Data Wien
DMA IGNITE NIGHT - Open Data Wien
 
Forschungsdatenmanagement in den (vergleichenden) Regionalwissenschaften - am...
Forschungsdatenmanagement in den (vergleichenden) Regionalwissenschaften - am...Forschungsdatenmanagement in den (vergleichenden) Regionalwissenschaften - am...
Forschungsdatenmanagement in den (vergleichenden) Regionalwissenschaften - am...
 
Bat open data und datenwirtschaft in der schweiz_20150619
Bat open data und datenwirtschaft in der schweiz_20150619Bat open data und datenwirtschaft in der schweiz_20150619
Bat open data und datenwirtschaft in der schweiz_20150619
 
Open Government Data als Teil der Open Commons Region Linz, Stefan Pawel, G...
Open Government Data als Teil der Open Commons Region Linz, Stefan Pawel, G...Open Government Data als Teil der Open Commons Region Linz, Stefan Pawel, G...
Open Government Data als Teil der Open Commons Region Linz, Stefan Pawel, G...
 
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot ATLinked Open Data Pilotprojekt Österreich - LOD Pilot AT
Linked Open Data Pilotprojekt Österreich - LOD Pilot AT
 
Code for Germany – Slidedeck Dez. 2014
Code for Germany – Slidedeck Dez. 2014Code for Germany – Slidedeck Dez. 2014
Code for Germany – Slidedeck Dez. 2014
 
Globale Standards im Web of Things
Globale Standards im Web of ThingsGlobale Standards im Web of Things
Globale Standards im Web of Things
 
Wo stehen wir mit Open Government Data in der Schweiz? (Juni 2012)
Wo stehen wir mit Open Government Data in der Schweiz? (Juni 2012)Wo stehen wir mit Open Government Data in der Schweiz? (Juni 2012)
Wo stehen wir mit Open Government Data in der Schweiz? (Juni 2012)
 
Open Government Data
Open Government DataOpen Government Data
Open Government Data
 

kg-workshop

  • 1. Knowledge Graphs im Tourismus Elias Kärle, Semantic Technology Institute, Universität Innsbruck 18.7.2018, KG Workshop, Innsbruck @eliaska
  • 2. Semantic Technology Institute » Teil des Institutes für Informatik der Universität Innsbruck » Gegründet 2006 von Univ.-Prof. Dr. Dieter Fensel » Forschung & Entwicklung: Informations- und Kommunikations- technologien basierend auf semantischen Technologien „Verticals“ hauptsächlich: » eTourismus » eCommerce » Online Communication Page 2KG Workshop I Elias Kärle I 18. Juli 2018
  • 3. Semantic Technology Institute Forschungsthemen » „Web 5.0“ • Annotation von Webseiten und Validierung • Linked Open Data durch semantische Annotationen • Knowledge Graphs » Multi-Channel Social Media • Automatische Verteilung von Inhalten • „Reposting“ externer Inhalte » Dialogsysteme • Dialogbasierte Interaktion mit dem Gast/Kunden » Intelligente Persönliche Assistenten (IPA) • Automatischer annotationsbasierte Anwendungen für Alexa & Co. Page 3KG Workshop I Elias Kärle I 18. Juli 2018
  • 4. Team und Expertise » Elias Kärle • Wissenschaftlicher Mitarbeiter am STI seit 2014 • davor Studium der Informatik • 5 Jahre Softwareentwickler (Web, Apps) » Derzeitiger Forschungsschwerpunkt: • semantische Technologien im Tourismus • effiziente Linked Open Data Publikation im Web • Light-weight Semantic Web Services • Knowledge Graphs im Tourismus Page 4KG Workshop I Elias Kärle I 18. Juli 2018
  • 5. Team und Expertise » Umutcan Simsek • Semantische Validierung, Dialogsysteme » Oleksandra Panasiuk • Schema.org Design Patterns » Boran Balci • Technische Aspekte von Knowledge Graphs Page 5KG Workshop I Elias Kärle I 18. Juli 2018
  • 6. 1. Das Headless Web 2. (Linked) Open Data 3. Der „Tiroler Knowledge Graph“ 4. Show Cases 5. Challenges Page 6 Inhalt KG Workshop I Elias Kärle I 18. Juli 2018
  • 7. „In 10 Jahren wird es das Web wie wir es kennen nicht mehr geben!“ Page 7 1. Das Headless Web KG Workshop I Elias Kärle I 18. Juli 2018 Headless Web!
  • 8. 1. Das Headless Web Das Headless Web ist ausgerichtet auf die „neuen Konsumenten“ von Web Inhalten! Page 8KG Workshop I Elias Kärle I 18. Juli 2018  IPAs, Chatbots, …Menschen
  • 9. 1. Das Headless Web Veränderung ist deutlich sichtbar: Suchmaschinen Hotel Buchungen Einzelhandel Page 9KG Workshop I Elias Kärle I 18. Juli 2018
  • 10. 1. Das Headless Web Probleme des Headless Web: • individuelle Webseiten verschwinden • kleine Produkt- und Serviceanbieter im Web verschwinden  Probleme Produkte & Services zu guten Konditionen zu verkaufen • “Big Players” werden stärker • Monopole  Preisanstieg  Anbieter & Konsumenten leiden darunter Page 10KG Workshop I Elias Kärle I 18. Juli 2018
  • 11. 1. Das Headless Web » Wie kann man das Beste aus dieser Entwicklung machen? Warum sind Suchmaschinen so stark?  Daten Warum sind OTAs so stark?  Daten Wer hat KEINE Daten  Entwickler, Forscher, Startups, … „Wie soll ernstzunehmende Konkurrenz für Suchmaschinen, OTAs & Co entstehen wenn alle Daten unter Verschluss gehalten werden?“ „Daten hinter verschlossenen Türen hemmen Innovation!“ Page 11KG Workshop I Elias Kärle I 18. Juli 2018
  • 12. 1. Das Headless Web » Also was tun? Eine Möglichkeit:  Daten öffnen für alle Anwender  Daten als Open Data zur Verfügung stellen  Anwendungen erstellen die jene Daten nutzen  z.B.: Speicherung und Verbreitung über einen „Knowledge Graph“ Page 12KG Workshop I Elias Kärle I 18. Juli 2018
  • 13. 2. (Linked) Open Data Was ist Open Data? Hauptthemen: » Verfügbarkeit und freier Zugang » Wiederverwendung und Weitergabe » Universelle Beteiligung Page 13KG Workshop I Elias Kärle I 18. Juli 2018 “Als Open Data (aus englisch open data, wörtlich offene Daten) werden Daten bezeichnet, die von jedermann ohne jegliche Einschränkungen genutzt, weiterverbreitet und weiterverwendet werden dürfen.”[1] [1] Jörn von Lucke, Christian Geiger: Open Government Data (Frei verfügbare Daten des öffentlichen Sektors). Hrsg.: zeppelin university. Friedrichshafen 3. Dezember 2010
  • 14. 2. (Linked) Open Data Warum Open Data? » „Daten gehören den Menschen“ – medizinische Forschung, Genom Forschung » Mit öffentliche Geldern ermöglicht – allgemein universitäre Forschung, Governement Data » Fakten können nicht dem Urheberrecht unterliegen » Freier Zugang ermöglicht Zusammenarbeit – Wikipedia » Forschungsförderung durch freie Forschungsergebnisse » Zeit & Geldersparnis für Behörden durch weniger/keine Anfragen » Mehr Information für Bürger wenn Daten über Umgebung offen sind » Mehr INNOVATION! Page 14KG Workshop I Elias Kärle I 18. Juli 2018
  • 15. 2. (Linked) Open Data Beispiele für Open Data? » Transparenz: • Finnische “Tax Free”, Britische “Where does my Money go?”  Steuerhinterziehung in Höhe von 3.2 Milliarden kanadischen Dollar bei gemeinnützigen Organisationen aufdecken » Innovation • Wiener Öffi App mit Abfahrtsmonitor • bodenpreise.at • Tyrolean Map • Toilet Map Vienna – Augmented Reality App • Schal legal? Page 15KG Workshop I Elias Kärle I 18. Juli 2018
  • 16. 2. (Linked) Open Data Was ist Linked Open Data? Linked Open Data = Linked Data + Open Data  Was ist Linked Data? Page 16KG Workshop I Elias Kärle I 18. Juli 2018
  • 17. 2. (Linked) Open Data Was ist Linked Data? » Tim Berners-Lee skizzierte 2006 vier Prinzipien für "Linked Data"[1] : 1) Verwende URIs um “Dinge” zu identifizieren 2) Verwende HTTP URIs, dass diese Dinge auch interpretiert (“dereferenziert”) werden können 3) Stelle brauchbare Information zur Verfügung wenn jemand die URL öffnet (vorzugsweise unter Verwendung von offenen Standards: RDF, SPARQL, …) 4) Stelle bei der Veröffentlichung der Daten im Web Verweise zu HTTP URIs anderer “Dingen” her um mehr darüber zu erfahren Page 17KG Workshop I Elias Kärle I 18. Juli 2018 [1] Tim Berners-Lee: https://www.w3.org/DesignIssues/LinkedData.html
  • 18. 2. (Linked) Open Data Linked Open Data (LOD) » Linked Data wird als Open Data publiziert Page 18KG Workshop I Elias Kärle I 18. Juli 2018
  • 19. 2. (Linked) Open Data » Linked Open Data Page 19KG Workshop I Elias Kärle I 18. Juli 2018 Offene Lizenz Maschinenlesbar Offenes Format Genügt RDF Standards Verlinkt m. anderen Datensätzen https://5stardata.info
  • 20. 3. Knowledge Graph » Was ist ein Knowledge Graph? In relationaler Datenbank… Speicherung von Daten in Tabellen  Spalten für Eigenschaften  Zeilen für Werte Page 20KG Workshop I Elias Kärle I 18. Juli 2018
  • 21. 3. Knowledge Graph In einem Knowledge Graph, Speicherung von Daten als Knoten und Verbindungen zwischen den Knoten. Page 21KG Workshop I Elias Kärle I 18. Juli 2018 Bild: https://www.w3.org/TR/rdf11-primer/
  • 22. 3. Knowledge Graph Warum Knowledge Graphs? » Technische Vorteile » Wissenschaftliches Interesse » Touristisches Interesse Page 22KG Workshop I Elias Kärle I 18. Juli 2018
  • 23. 3. Knowledge Graph Warum Knowledge Graphs? » Technische Vorteile: • Adaptierbar – kein fixes Schema • schnelle Anfragen/Suche • Semantische Technologien sind anwendbar Page 23KG Workshop I Elias Kärle I 18. Juli 2018
  • 24. 3. Knowledge Graph Warum Knowledge Graphs? » Wissenschaftliches Interesse: • Methoden zur Publikation und Aggregation semantischer Daten • Weiteres Anwendungsgebiet von schema.org • Zeitreihenanalysen • Open Data Anwendungen • Basis für Machine Leraning und AI Page 24KG Workshop I Elias Kärle I 18. Juli 2018
  • 25. 3. Knowledge Graph Warum Knowledge Graphs? » Touristisches Interesse: • Sammlung von Open Data (offene Daten) • Zeitreihenanalyse: Preisentwicklung, Besucherströme, … • Möglichkeit für Drittanwender Anwendungen zu erstellen (Auskunft, Buchung, Verkauf, …) • Schaffung innovativer Services durch Kombination und Wiederverwendung von Datensätzen Page 25KG Workshop I Elias Kärle I 18. Juli 2018
  • 26. 3. Knowledge Graph Wie füllen wir unseren KG? 1) Crawling Page 26KG Workshop I Elias Kärle I 18. Juli 2018 2) Mapping
  • 27. 3. Knowledge Graph 1) Crawling » Automatisierte Suche nach touristisch relevanten Inhalten im Web » Nur semantisch angereicherte Information  maschinenlesbar, maschineninterpretierbar » Webseiten mit schema.org Annotationen Page 27KG Workshop I Elias Kärle I 18. Juli 2018
  • 28. 3. Knowledge Graph 1) Crawling: schema.org » Ins Leben gerufen und gewartet von vier großen Suchmaschinenanbietern » Vokabular zur Beschreibung von „Dingen“ im Web » Weite Verbreitung im Web: 1) Starke Motivation: SEO „gratis“ 2) „leicht“ anwendbar  nützliche Tools verfügbar Page 28KG Workshop I Elias Kärle I 18. Juli 2018 http://www.schema.org/
  • 29. 3. Knowledge Graph 1) Crawling: broker.semantify.it Page 29KG Workshop I Elias Kärle I 18. Juli 2018 Hotel Resta urant Shop Skisch ool Guide W H S I B E W H S P M S E R P sdo/off ers + sdo/act ions website sdo/off ers + sdo/act ions website sdo/off ers + sdo/act ions website sdo/off ers + sdo/act ions website sdo/off ers + sdo/act ions website extract extract extract extract extract JSON-LD JSON-LD JSON-LD JSON-LD JSON-LD
  • 30. 3. Knowledge Graph Page 30KG Workshop I Elias Kärle I 18. Juli 2018
  • 31. 3. Knowledge Graph 2) Mapping: » Abbilden verschiedener Datenquellen auf das schema.org Vokabular » Automatisiertes übersetzen der Daten Verschieden Kooperationspartner: » Easybooking » Feratel » General Solutions » Outdooractive » Tirolwerbung » Waldhart Software Page 31KG Workshop I Elias Kärle I 18. Juli 2018
  • 32. 3. Knowledge Graph » Beispiel eines solchen Mappings (General Solutions Datensatz): Page 32KG Workshop I Elias Kärle I 18. Juli 2018 Objekt Type Schema.org Type Schiff & Bahn CivicStructure Freizeitpark Park Themen- & Lehrpfad SportsActivityLocation Museum Museum Therme & Wasserwelt SportsActivityLocation Shopping ShoppingCenter Bergbahn CivicStructure Sommerrodelbahn SportsActivityLocation
  • 33. 3. Knowledge Graph 2) Mapping: semantify.it » Plattform zur: • Erzeugung • Validierung • Veröffentlichung von Annotationen » Für statische, dynamische und aktive Daten • DS Editor, Annotaiton Editor • Wrapper, Heuristics • Semantify.it-Actions Page 33KG Workshop I Elias Kärle I 18. Juli 2018
  • 34. 3. Knowledge Graph 2) Mapping: semantify.it Page 34KG Workshop I Elias Kärle I 18. Juli 2018
  • 35. 3. Knowledge Graph Page 35KG Workshop I Elias Kärle I 18. Juli 2018 T G K TVB TW Hot els Ber gba hn Skis chu le F GS IM ODA WH EB … offene Daten Bild: Kärle, 2018
  • 36. 3. Knowledge Graph » 2.8 Milliarden Fakten (Triples) » Täglich ~8 Mio neue Einträge » Welche Daten: • Statische, dynamische, aktive POIs, Wanderungen Hotels, Restaurants Angebote, Verfügbarkeiten Events Buchungsschnittstellen, Suchinterfaces Page 36KG Workshop I Elias Kärle I 18. Juli 2018
  • 37. 3. Knowledge Graph » Häufigste Datentypen (täglich): schema.org/ImageObject ~ 596.000 schema.org/PostalAddress ~ 165.000 schema.org/GoeCoordinates ~ 143.000 schema.org/Event ~ 133.000 schema.org/Offer ~ 30.000 schema.org/Product ~ 30.000 schema.org/HotelRoom ~ 17.000 Page 37KG Workshop I Elias Kärle I 18. Juli 2018
  • 38. 4. Show Cases » Demo Sprachassistent Alexa Skill die Fragen auf Basis des Knowledge Graph beantwortet Page 38KG Workshop I Elias Kärle I 18. Juli 2018 Demo am STI Stand! Bild: Panasiuk et al., 2018
  • 39. 4. Show Cases » Demo Sprachassistent Alexa Skill die Fragen auf Basis des Knowledge Graph beantwortet Page 39KG Workshop I Elias Kärle I 18. Juli 2018 https://youtu.be/8Q5asdmWp0s
  • 40. 4. Show Cases » Zimmerbuchung über Knowledge Graphen Schnittstelle über dem Knowledge Graphen • Einstiegspunkt: annotiertes Suchfeld (schema:SearchAction) • Antwort: Liste von Angeboten (schema:Offer)  Angebot beinhaltet Anknüpfungsinformation (schema:Action), welche auf die Buchungsstrecke des Anbieters verweist Page 40KG Workshop I Elias Kärle I 18. Juli 2018 Hotel I B E Bild: Kärle et al., 2018
  • 41. 4. Show Cases » Data Analysis Redundante Datenhaltung für Zeitreihenanalysen Page 41KG Workshop I Elias Kärle I 18. Juli 2018 Bild: Simsek et al., 2018
  • 42. 5. Challenges Offene Herausforderungen: » Hardware / Software • Preis • Performance • Verfügbarkeit • Sicherheit » Entity Recognition • Mehrere „Schloss Ambras“ – welches ist „das richtige? • Welche Perspektive interessiert wen? Page 42KG Workshop I Elias Kärle I 18. Juli 2018
  • 43. 5. Challenges » Entity Matching / Reconciliation • sollen Typen überhaupt „zusammengeführt“ werden • Wer macht das? • Hilfreiche Vereinfachung oder ungewollter Bias? » Entitiy Personalization / Personal Enhancing • Wie kann man Daten mit eigener Information anreichern » History / Versionierung • Wann und wie oft wird dupliziert? • Was wird dupliziert (Git oder CVS Ansatz)? Page 43KG Workshop I Elias Kärle I 18. Juli 2018
  • 44. 5. Challenges Ihr/wir seid/sind gefragt! » Innovative Ideen für den Tourismus! • Open Data als Motivation • Daten Publikation • Daten Konsum Page 44KG Workshop I Elias Kärle I 18. Juli 2018