Things, not Strings

559 Aufrufe

Veröffentlicht am

Veröffentlicht in: Internet
0 Kommentare
1 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

Keine Downloads
Aufrufe
Aufrufe insgesamt
559
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
5
Aktionen
Geteilt
0
Downloads
1
Kommentare
0
Gefällt mir
1
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Things, not Strings

  1. 1. Things, not Strings ADV Tagung - Suchstrategien für heute und morgen 12. November, 2014 Dr. Bernhard Haslhofer Data Scientist AIT - Austrian Institute of Technology bernhard.haslhofer@ait.ac.at
  2. 2. Things, not Strings http://googleblog.blogspot.co.at/2012/05/introducing-knowledge-graph-things-not.html
  3. 3. Knowledge Graph?
  4. 4. Vorteile 4
  5. 5. Die richtigen “Dinge” finden 5
  6. 6. Zusammenfassungen 6
  7. 7. Beziehungen 7
  8. 8. “Wird auch oft gesucht” 8
  9. 9. Funktionsweise 9
  10. 10. Information Retrieval Basics 10 (Web-)Inhalte Analyse Repräsentation (Index) Retrieval Funktion Resultate Suchbegriff Analyse Repräsentation“David Alaba”
  11. 11. Invertierter Index 11 alaba austria david rapid wien stadion d1 d2 d3 d1 d4 d5 d1 d6 d7 d4 d1 d2 d4 d5 d7 Dictionary Postings
  12. 12. Semantischer Index 12 alaba austria david rapid wien stadion d1 d2 d3 d1 d4 d5 d1 d6 d7 d4 d1 d2 d4 d5 d7 Dictionary Postings Knowledge Graph
  13. 13. Semantischer Index 13 alaba austria david rapid wien stadion d1 d2 d3 d1 d4 d5 d1 d6 d7 d4 d1 d2 d4 d5 d7 Strings Things
  14. 14. Knowledge Graph Konstruktion 14
  15. 15. Eigenschaften • Dinge sind eindeutig identifizierbar (URIs) • Dinge haben • einen Typ (“Person”, “Ort”, “Ereignis”, …) • Eigenschaften (“Name”, “Lat/Lng”, “Datum”, …) • Beziehungen zu anderen relevanten (!!!) Dingen 15
  16. 16. Aggregation (offener) Daten 16
  17. 17. Aggregation (offener) Daten
  18. 18. Aggregation (offener) Daten 18
  19. 19. Extraktion von Dingen 19 <div itemscope itemtype="http://schema.org/SportsTeam"> <span itemprop=“name">FC Bayern München</span> <div itemprop="member" item scope itemtype="http://schema.org/OrganizationRole"> <div itemprop="member" itemscope itemtype="http://schema.org/Person"> <span itemprop=“name">David Alaba</span> </div> <span itemprop="startDate">2010</span> <span itemprop=“namedPosition">Linker Verteidiger</span> </div>
  20. 20. Interaktive Eingabe 20
  21. 21. Knowledge Graph Verlinkung 21 d2 d6
  22. 22. Schritte / Probleme • Named Entity Detection: “…EM-Qualifikation gegen Russland: So geht Marcel Koller mit dem David Alaba- Ausfall um…” • Named Entity Disambiguation: “…Aufregendes Derby lässt die Austria aufatmen…”
 (Austria = Fußballverein/Land)? • Named Entity Linkage/Resolution: • David Alaba = http://dbpedia.org/resource/David_Alaba • Austria = http://www.freebase.com/m/03mp37 22
  23. 23. Tools • AlchemyAPI (http://www.alchemyapi.com/): • identifiziert eine Vielzahl von Entitätstypen (Personen, Orte, Ereignisse, etc.) in Dokumenten • unterstützt DBPedia, Freebase • DBPedia Spotlight (https://github.com/dbpedia-spotlight): • annotiert DBPedia Entitäten in Dokumenten • …. 23
  24. 24. Fazit 24
  25. 25. • Heutige und zukünftige Suchstrategien basieren auf Volltextsuche + Knowledge Graph • Google Knowledge Graph • Microsoft Bing Satori Knowledge Base • … 25
  26. 26. • Identifikation, Extraktion und Verlinkung von Dingen “Things” gewinnt zunehmend an Bedeutung • Verfügbarkeit offener, strukturierter Daten ist essentiell zum Aufbau von Knowledge Graphs 26
  27. 27. Ausblick 27
  28. 28. • Knowledge Base/Graph • ist Voraussetzung für Question-Answering Systeme (z.b., IBM Watson) • bildet Basis für natürlichsprachige Suche • ermöglicht Antizipation zukünftiger Suchanfragen
 28
  29. 29. “OK Bernhard…” 29 http://bernhardhaslhofer.info http://slideshare.net/bhaslhofer bernhard.haslhofer@ait.ac.at @bhaslhofer

×