„Wie Sie schon immer           finden wollten, was Sie           noch nie gesucht haben“            Paradigmenwechsel in d...
Wie Sie schon immer finden wollten,    was Sie noch nie gesucht haben     Paradigmenwechsel in der (Web)Suche         • Vo...
Wie Sie schon immer finden wollten,    was Sie noch nie gesucht haben     Paradigmenwechsel in der (Web)Suche         • Vo...
Wie findet man etwas im WWW?    15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack   4Mittwoch, 25. Mai 2011
Das „Google Dilemma“    15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack   5Mittwoch, 25. Mai 2011
Das „Google Dilemma“                                                               Suchvorschläge                         ...
Das „Google Dilemma“    15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack   7Mittwoch, 25. Mai 2011
Das „Google Dilemma“        • Steht das Wichtigste tatsächlich vorne in          der Ergebnisliste?        • Was heist übe...
Wie Sie schon immer finden wollten,    was Sie noch nie gesucht haben     Paradigmenwechsel in der (Web)Suche         • Vo...
Klassisches   Information Retrieval      Information requests                                                             ...
Klassisches     Information Retrieval    (vereinfachte Variante....)                                                      ...
Vektorraum Modell     •Dokumente und Anfragen werden als                                                         Bsp.: n =...
Wie gut ist das Suchergebnis?                         relevante Dokumente, die gefunden wurden                            ...
Wie gut ist das Suchergebnis?                                                                            Menge aller Dokum...
Suche im World Wide Web                         Warum ist da                                      s Suchen im             ...
Das WWW ist ziemlich groß...        •ca. 25 x 109 in Suchmaschinen           indizierte Dokumente           (TNL Blog: Goo...
...und wächst immer weiter                                                               2010: 7 TB pro Tag    15. Leibniz...
...und wächst immer weiter                                                               2010:                            ...
Suche im World Wide Web                         Suche im WW                                       W ist oft               ...
Warum habe ich Birnen im   Ergebnis?                                                                            Menge alle...
Sprache ist schwierig...                                                               (1) Homonyme                       ...
Warum habe ich nicht alle Äpfel im Ergebnis?                                                                            Me...
Sprache ist schwierig...                                                               (2) Synonyme                       ...
Sprache ist schwierig...     bild.de                                                               Was bedeutet die       ...
Wie Sie schon immer finden wollten,    was Sie noch nie gesucht haben     Paradigmenwechsel in der (Web)Suche         • Vo...
Wie kommt Google    zu Informationen über ein Video?    15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack   26Mittw...
Wie findet man etwas         in einem audiovisuellen Archiv?    15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack  ...
Wie findet man etwas          in einem audiovisuellen Archiv?                                         1. Schritt: Digitali...
Wie findet man etwas          in einem audiovisuellen Archiv?                                         1. Schritt: Digitali...
Wie findet man etwas          in einem audiovisuellen Archiv?                                      Manuelle Audio-/Videoan...
Automatisierte    Audio- und Videoanalyse                                                                         automati...
yovisto.com      • Videosuchmaschine mit dem Themenschwerpunkt        akademische Lehrveranstaltungen                     ...
Wie Sie schon immer finden wollten,    was Sie noch nie gesucht haben     Paradigmenwechsel in der (Web)Suche         • Vo...
Die ursprüngliche Idee des    World Wide Web                                    „The Web was designed as an information   ...
3. Wissensrepräsentation und Logik            3.1 Ontologien in Philosophie und Informatik35                         „Peop...
Wissensrepräsentation                                                               gemeinsames                           ...
Inhalte im WWW   maschinell „verstehen“                                                                   Text: „Jetzt spr...
Inhalte im WWW   maschinell „verstehen“                                                               Text: „Jetzt spricht...
Inhalte im WWW   maschinell „verstehen“   • Bedeutung (Semantik) wird über      geeignete Wissensrepräsentationen      (On...
Inhalte im WWW   maschinell „verstehen“     • Bedeutung (Semantik) wird über         geeignete Wissensrepräsentationen    ...
Ontologien als   Wissensrepräsentation                                                               Philosophie          ...
The Web of Data - The Semantic Web                                Data is a precious thing and will last longer than the  ...
http://dbpedia.org/    15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
DBPedia - die semantische Wikipedia            □ Zentraler Bestandteil:              Wikipedia Info-Boxen    15. Leibniz-K...
DBPedia - die semantische Wikipedia            □ Zentraler Bestandteil:              Wikipedia Info-Boxen    15. Leibniz-K...
Wie Sie schon immer finden wollten,    was Sie noch nie gesucht haben     Paradigmenwechsel in der (Web)Suche            •...
Wie kann ich                              Ontologien be                                            im                  Suc...
Ontologien zur   Verbesserung der Suche          (1) Präzisierung der Suchergebnisse          • Schlüsselwort-basierte Suc...
Ontologien zur   Verbesserung der Suche           (2) Erweiterung der Suchergebnisse           • Schlüsselwortbasierte Suc...
Ontologien zur   Verbesserung der Suche             (3) Herstellung von Querverweisen               □ Bereitstellung von S...
Wie Sie schon immer finden wollten,    was Sie noch nie gesucht haben     Paradigmenwechsel in der (Web)Suche          • V...
Suchen ist nicht gleich Suchen         • Ein einfaches Beispiel:                Ich suche das Buch „Wem die Stunde schlägt...
Suchen ist nicht gleich Suchen         • Ein einfaches Beispiel:               Ich suche das Buch „Wem die Stunde schlägt“...
Suchen ist nicht gleich Suchen        • ...aber was, wenn man nicht genau weiß, was man sucht?               Mir hat das B...
Explorative Suche         • Was, wenn der Benutzer nicht weiß, welchen Suchbegriff er/sie benutzen soll?         • Was, we...
Explorative Suche             dbpedia:For_Whom_the_Bell_Tolls                                    Wie soll das semantische ...
Explorative Suche                                                                                   or                    ...
Explorative Suche                                                                                     dbpedia:Jack_Kerouac...
Explorative Suche                                                                                              dbpedia:Jer...
29                                                              Waitelonis, Sack: Augmenting Video Search with Linked Open...
„Wie Sie schon immer   finden wollten, was Sie   noch nie gesucht haben“    Paradigmenwechsel in der (Web)Suche   Kontakt:...
Nächste SlideShare
Wird geladen in …5
×

Wie Sie schon immer finden wollten, was sie noch nie gesucht hatten - Paradigmenwechsel in der (Web)Suche

2.231 Aufrufe

Veröffentlicht am

Präsentation anlässlich des Vortrags zum 15. Leibniz-Kolleg, am 25.05.2011 an der Universität Potsdam

Veröffentlicht in: Technologie, Bildung
2 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
2.231
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
2
Aktionen
Geteilt
0
Downloads
0
Kommentare
2
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Wie Sie schon immer finden wollten, was sie noch nie gesucht hatten - Paradigmenwechsel in der (Web)Suche

  1. 1. „Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben“ Paradigmenwechsel in der (Web)Suche Dr. Harald Sack Hasso-Plattner-Institut für Softwaresystemtechnik Universität Potsdam 15. Leibniz-Kolleg Potsdam, 25. Mai 2011 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 1Mittwoch, 25. Mai 2011
  2. 2. Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben Paradigmenwechsel in der (Web)Suche • Vom klassischen Suchen und Finden im Internet • Das „Google Dilemma“ • Wie funktioniert eigentlich Google? • Text ist „einfach“...aber was ist mit dem Rest? • Semantische Suchtechnologien • Wie man Wissen repräsentiert • Besser Suchen mit Semantik • Suchen ist nicht gleich Suchen 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 2Mittwoch, 25. Mai 2011
  3. 3. Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben Paradigmenwechsel in der (Web)Suche • Vom klassischen Suchen und Finden im Internet • Das „Google Dilemma“ • Wie funktioniert eigentlich Google? • Text ist „einfach“...aber was ist mit dem Rest? • Semantische Suchtechnologien • Wie man Wissen repräsentiert • Besser Suchen mit Semantik • Suchen ist nicht gleich Suchen 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 3Mittwoch, 25. Mai 2011
  4. 4. Wie findet man etwas im WWW? 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 4Mittwoch, 25. Mai 2011
  5. 5. Das „Google Dilemma“ 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 5Mittwoch, 25. Mai 2011
  6. 6. Das „Google Dilemma“ Suchvorschläge Suchfacetten Multimodale Ergebnisse 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 6Mittwoch, 25. Mai 2011
  7. 7. Das „Google Dilemma“ 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 7Mittwoch, 25. Mai 2011
  8. 8. Das „Google Dilemma“ • Steht das Wichtigste tatsächlich vorne in der Ergebnisliste? • Was heist überhaupt „wichtig“? • Ist das, was Google für wichtig hält, tatsächlich auch für alle gleichermaßen wichtig? • ...und was ist mit dem Rest? • Ist das überhaupt tatsächlich auch alles? • Kann ich überprüfen, ob die Ergebnisse vollständig sind? 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 8Mittwoch, 25. Mai 2011
  9. 9. Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben Paradigmenwechsel in der (Web)Suche • Vom klassischen Suchen und Finden im Internet • Das „Google Dilemma“ • Wie funktioniert eigentlich Google? • Text ist „einfach“...aber was ist mit dem Rest? • Semantische Suchtechnologien • Wie man Wissen repräsentiert • Besser Suchen mit Semantik • Suchen ist nicht gleich Suchen 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 9Mittwoch, 25. Mai 2011
  10. 10. Klassisches Information Retrieval Information requests files of records Menge von Dokumenten Menge von Anfragen similarity Anfrage- Indexierung formulierung Indexierungssprache(nach Salton,G., McGill, M.J.:Introduction to Modern Information Retrieval. McGraw-Hill, New York 1983) 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 10Mittwoch, 25. Mai 2011
  11. 11. Klassisches Information Retrieval (vereinfachte Variante....) Menge von Dokumenten „Suchen“ SUCHEN, vb. , in allen ger n ? sprachen bezeugt: got.sokjan, ags. sēcan, as. sokian, an. Soekj Suchterm(e) Schlüsselwörter [Bd. 20, Sp. 835] sēza, ahd. suohhan. aus idg. sprachen steht am nächsten lat. sāgiospüre, air. saigim gehe Suchanfrage einer sache nach, suche; zur weiteren verwandtschaft vgl. Walde-Pokorny 2, 449. der umlaut des stammvokals erscheint im nd., er wird im md. verzeichnet vonCrecelius oberhess. wb. 827; Spiess henneb. id. 248; Hertel Thüringen240; Gerbet Vogtland 425 und auf kolonialem boden bei Schröerdeutsche mundarten des ungrischen berglandes 225. neben eigentlichem suchen einer sache Suchindex nachspüren, sich bemühen, sie aufzufinden (dann auch jemanden aufsuchen, ihn bedrohen, angreifen) steht Dokument eine reich bezeugte bedeutungsgruppe mehr 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sackon Retrieval. McGraw-Hill, New York 1983) Mittwoch, 25. Mai 2011
  12. 12. Vektorraum Modell •Dokumente und Anfragen werden als Bsp.: n = 3 Punkte in einem hochdimensionalen, Deskriptor2 Dokument = (2,4,2) Suchabfrage = (1,0,0) metrischen Vektorraum repräsentiert 4 •Zum Retrieval wird die Distanz zwischen Dokument Suchanfrage- und Dokumentenvektor verwendet •Relevanzbewertung (Ranking) erfolgt nach der ermittelten Distanz Suchanfrage ρ •Differenzierte Termgewichtung möglich •lineare Termanordnung im Dokument 2 Deskriptor1 geht verloren 2 •mangelnde semantische Sensitivität Deskriptor3 (Vokabularabhängigkeit) G. Salton, A. Wong, C. S. Yang: "A Vector Space Model for Automatic Indexing," Communications of the ACM, vol. 18, nr. 11, pp. 613–620, 1975. 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 12Mittwoch, 25. Mai 2011
  13. 13. Wie gut ist das Suchergebnis? relevante Dokumente, die gefunden wurden |R∩P| Recall= |R| R P |R∩P| Precision= |P| relevante Dokumente gefundene Dokumente 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 13Mittwoch, 25. Mai 2011
  14. 14. Wie gut ist das Suchergebnis? Menge aller Dokumente Ergebnis 6 Recall= = 0,67 9 relevant unrelevant 6 Precision= = 0,75 8 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 14Mittwoch, 25. Mai 2011
  15. 15. Suche im World Wide Web Warum ist da s Suchen im WWW so sc hwierig? 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 15Mittwoch, 25. Mai 2011
  16. 16. Das WWW ist ziemlich groß... •ca. 25 x 109 in Suchmaschinen indizierte Dokumente (TNL Blog: Google has 24 billion items index, considers MSN search nearest competitor, September 2005) •Web Crawler: > 1012 Dokumente (The Official Google Blog: We knew the Web was Big....., Juli 25, 2008) •Google Search Index Caffeine umfasst ca.100 Million Gigabytes i.e. 1017 Byte (SMX Video: Google’s Matt Cutts On Caffeine Launch, June 9, 2010, http://searchengineland.com/smx-video-googles-matt-cutts-on-caffeine-launch-43933) •DeepWeb (Darkweb) schätzungsweise bis zu 550 mal größer als das Surface Web (Bergman, 2001) 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 16Mittwoch, 25. Mai 2011
  17. 17. ...und wächst immer weiter 2010: 7 TB pro Tag 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 17Mittwoch, 25. Mai 2011
  18. 18. ...und wächst immer weiter 2010: 2 Milliarden Video-Downloads pro Tag 35h Video-Uploads pro Minute 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 18Mittwoch, 25. Mai 2011
  19. 19. Suche im World Wide Web Suche im WW W ist oft ungenau und (scheinbar) unvollständig. .. 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 19Mittwoch, 25. Mai 2011
  20. 20. Warum habe ich Birnen im Ergebnis? Menge aller Dokumente relevant unrelevant Ergebnis 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 20Mittwoch, 25. Mai 2011
  21. 21. Sprache ist schwierig... (1) Homonyme Gleichlautende Wörter mit unterschiedlicher Bedeutung Folge: Viele nicht-relevante (falsche) Ergebnisse Suchbegriff: „Golf“ 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 21Mittwoch, 25. Mai 2011
  22. 22. Warum habe ich nicht alle Äpfel im Ergebnis? Menge aller Dokumente relevant unrelevant Ergebnis 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  23. 23. Sprache ist schwierig... (2) Synonyme Unterschiedliche Wörter mit gleicher Bedeutung Folge: Nicht alle relevanten Ergebnisse Werden gefunden Im Englischen: Suchbegriff: „Golf“ VW Golf = „VW Rabbit“ 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 23Mittwoch, 25. Mai 2011
  24. 24. Sprache ist schwierig... bild.de Was bedeutet die Information? • Kontext • Absicht (Pragmatik) • implizites Wissen 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 24Mittwoch, 25. Mai 2011
  25. 25. Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben Paradigmenwechsel in der (Web)Suche • Vom klassischen Suchen und Finden im Internet • Das „Google Dilemma“ • Wie funktioniert eigentlich Google? • Text ist „einfach“...aber was ist mit dem Rest? • Semantische Suchtechnologien • Wie man Wissen repräsentiert • Besser Suchen mit Semantik • Suchen ist nicht gleich Suchen 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  26. 26. Wie kommt Google zu Informationen über ein Video? 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 26Mittwoch, 25. Mai 2011
  27. 27. Wie findet man etwas in einem audiovisuellen Archiv? 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 27Mittwoch, 25. Mai 2011
  28. 28. Wie findet man etwas in einem audiovisuellen Archiv? 1. Schritt: Digitalisierung analoger AV-Medien Damit audiovisuelle Daten einer computer-gestützten gezielten Suche zugänglich werden, müssen sie zuerst digitalisiert werden. 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 28Mittwoch, 25. Mai 2011
  29. 29. Wie findet man etwas in einem audiovisuellen Archiv? 1. Schritt: Digitalisierung analoger AV-Medien Damit audiovisuelle Daten einer computer-gestützten gezielten Suche zugänglich werden, müssen sie zuerst digitalisiert werden. 2. Schritt: Verschlagwortung Damit audiovisuelle Daten einer computergestützten gezielten Suche zugänglich werden, müssen Beschreibungen, Schlüsselwörter, etc. üblicherweise Textform vorliegen. 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 29Mittwoch, 25. Mai 2011
  30. 30. Wie findet man etwas in einem audiovisuellen Archiv? Manuelle Audio-/Videoanalyse 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 30Mittwoch, 25. Mai 2011
  31. 31. Automatisierte Audio- und Videoanalyse automatische inhaltliche Analyse ist • schwierig (fehleranfällig) und • berechnungs-/speicheraufwändig Genre- Logo- Overlay- Face- Analyse Detection text Detection Szenen- text { Audio-Mining Strukturelle Sprecher- Transkription Analyse identifikation 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 31Mittwoch, 25. Mai 2011
  32. 32. yovisto.com • Videosuchmaschine mit dem Themenschwerpunkt akademische Lehrveranstaltungen www.yovisto.com • aktuell mehr als 11.000 Vorlesungen und wissenschaftliche Vorträge aus der ganzen Welt • Automatisierte Videoanalyse • benutzergenerierte Co-Annotation • Social Tagging • Diskussionen • Rezensionen • Wiki • Lernmaterialien • Punktgenauer Zugriff auf gesuchte Videoinhalte 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 32Mittwoch, 25. Mai 2011
  33. 33. Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben Paradigmenwechsel in der (Web)Suche • Vom klassischen Suchen und Finden im Internet • Das „Google Dilemma“ • Wie funktioniert eigentlich Google? • Text ist „einfach“...aber was ist mit dem Rest? • Semantische Suchtechnologien • Wie man Wissen repräsentiert • Besser Suchen mit Semantik • Suchen ist nicht gleich Suchen 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 33Mittwoch, 25. Mai 2011
  34. 34. Die ursprüngliche Idee des World Wide Web „The Web was designed as an information space, with the goal that it should be useful not only for human-human communication, but also that machines would be able to participate and help… “ Tim Berners-Lee, Semantic Web Roadmap, Sept 1998 Voraussetzung: Semantic Web • Inhalte können von Maschinen • Web-Inhalte in natürlicher Sprache korrekt gelesen und interpretiert werden explizit annotiert mit (=verstanden) werden semantischen Metadaten • Semantische Metadaten kodieren die Bedeutung (Semantik) des Web-Inhalts und können von Natural Language Processing Maschinen korrekt gelesen und • Technologie des klassischen interpretiert werden Information Retrievals (WWW Suchmaschinen) 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 34Mittwoch, 25. Mai 2011
  35. 35. 3. Wissensrepräsentation und Logik 3.1 Ontologien in Philosophie und Informatik35 „People can‘t share knowledge if they don‘t speak a common language“ Thomas Davenport (1997) Vorlesung Semantic Web Technologien, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamMittwoch, 25. Mai 2011
  36. 36. Wissensrepräsentation gemeinsames Konzept verwenden verstehen Konzept ruft hervor referenziert „Golf“ Symbol steht für Gegenstand Ogden, Richards, semiotisches Dreieck, 1923 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 36Mittwoch, 25. Mai 2011
  37. 37. Inhalte im WWW maschinell „verstehen“ Text: „Jetzt spricht Poldi“ Entity Mapping Disambiguierung Poldi ? Drache bei „Hallo Spencer“ Lukasz Podolski ? Polnischer Radrennfahrer Leopold Holusek ? Deutscher Tischtennisspieler • Disambiguierung Auflösung sprachlicher Mehrdeutigkeiten Leopold Kielholz ? Schweizer Fußballspieler Poldi Kladno ? Tschechischer Fußballverein Lukas Podolski ? Deutscher Fußballspieler 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  38. 38. Inhalte im WWW maschinell „verstehen“ Text: „Jetzt spricht Poldi“ Entitäten- zuweisung Lukas Podolski Entität ist ein Fußballspieler Klasse • Die Bedeutung (Semantik) der Entitäten und Klassen muss ebenfalls explizit definiert werden. ist eine Person Klasse 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  39. 39. Inhalte im WWW maschinell „verstehen“ • Bedeutung (Semantik) wird über geeignete Wissensrepräsentationen (Ontologien) ausgedrückt Lukas Podolski (entity) Class- ist ein membership hat Typ Fußballer (class) subclass ist ein Ist Subklasse von superclass Person (class) 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  40. 40. Inhalte im WWW maschinell „verstehen“ • Bedeutung (Semantik) wird über geeignete Wissensrepräsentationen (Ontologien) ausgedrückt 1985-06-04 Lukas Podolski Gliwice hasBirthDate hasBirthPlace Entities ist ein Classes Fußballer ist ein ist ein ist ein Date Person Place hasBirthDate hasBirthPlace 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  41. 41. Ontologien als Wissensrepräsentation Philosophie „Philosophische Disziplin, die sich primär mit dem Sein, dem Seienden als solchem und mit den fundamentalen Typen von Entitäten beschäftigt…“ Wikipedia Informatik "Eine Ontologie ist eine explizite, formale Repräsentation der gemeinsamen Konzeptualisierung einer Domäne.“ (Thomas R. Gruber, 1993) Konzeptualisierung: abstraktes Modell (Domäne, identifizierte relevante Begriffe, Beziehungen) Christian Wolff: Philosophia prima sive Ontologia, 1729 Explizit: Bedeutungen aller Begriffe definiert Formal: maschinenverstehbar Gemeinsam: Konsens bzgl. Ontologie 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  42. 42. The Web of Data - The Semantic Web Data is a precious thing and will last longer than the 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack themselves. (Tim Berners-Lee) systems http://linkeddata.org/Mittwoch, 25. Mai 2011
  43. 43. http://dbpedia.org/ 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  44. 44. DBPedia - die semantische Wikipedia □ Zentraler Bestandteil: Wikipedia Info-Boxen 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  45. 45. DBPedia - die semantische Wikipedia □ Zentraler Bestandteil: Wikipedia Info-Boxen 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  46. 46. Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben Paradigmenwechsel in der (Web)Suche • Vom klassischen Suchen und Finden im Internet • Das „Google Dilemma“ • Wie funktioniert eigentlich Google? • Text ist „einfach“...aber was ist mit dem Rest? • Semantische Suchtechnologien • Wie man Wissen repräsentiert • Besser Suchen mit Semantik • Suchen ist nicht gleich Suchen 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 46Mittwoch, 25. Mai 2011
  47. 47. Wie kann ich Ontologien be im Suchen im W eb nutzen? 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 47Mittwoch, 25. Mai 2011
  48. 48. Ontologien zur Verbesserung der Suche (1) Präzisierung der Suchergebnisse • Schlüsselwort-basierte Suche liefert zu viele inhaltlich nicht relevante Suchergebnisse • Verfeinerung der ursprünglichen Suchphrase (Query Refinement) Suchphrase: Bank Mögliche Erweiterung: Bank ∧ Kreditanstalt oder Bank ∧ Sitzgelegenheit oder Bank ∧ Sediment 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  49. 49. Ontologien zur Verbesserung der Suche (2) Erweiterung der Suchergebnisse • Schlüsselwortbasierte Suche liefert nicht alle inhaltlich relevanten Suchergebnisse • Erweiterung der ursprünglichen Suchphrase (Query Refinement) Suchphrase: Bank Mögliche Erweiterung: Bank ∨ Kreditanstalt ∨ Sparkasse ∨ ... Bank ∨ Konto ∨ Kredit ∨ ... Bank ∨ Santander ∨ Raiffeisen ∨ ... 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  50. 50. Ontologien zur Verbesserung der Suche (3) Herstellung von Querverweisen □ Bereitstellung von Suchergebnissen, die zwar den Suchbegriff nicht notwendiger- weise enthalten, aber mit diesem in inhaltlichem Zusammenhang stehen Suchphrase: Ernest Hemingway Ausweitung der Suche auf Personen, die etwas mit Ernest Hemingway zu tun haben category:Person rdf:type rdf:type dbpedia:Marlene_Dietrich dbpedia:Ernest_Hemingway a:da ted popstr 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  51. 51. Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben Paradigmenwechsel in der (Web)Suche • Vom klassischen Suchen und Finden im Internet • Das „Google Dilemma“ • Wie funktioniert eigentlich Google? • Text ist „einfach“...aber was ist mit dem Rest? • Semantische Suchtechnologien • Wie man Wissen repräsentiert • Besser Suchen mit Semantik • Suchen ist nicht gleich Suchen 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  52. 52. Suchen ist nicht gleich Suchen • Ein einfaches Beispiel: Ich suche das Buch „Wem die Stunde schlägt“ von Ernest Hemingway in der ersten deutschen Ausgabe... 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  53. 53. Suchen ist nicht gleich Suchen • Ein einfaches Beispiel: Ich suche das Buch „Wem die Stunde schlägt“ von Ernest Hemingway in der ersten deutschen Ausgabe... Wem die Ernest H Stunde schlägt. (Stockho E M I N G W A - Fischer lm usw., Berman Y. S. 8“ Verlag, n- 1941) 56 0 II 1, 25 06, 3454 8 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  54. 54. Suchen ist nicht gleich Suchen • ...aber was, wenn man nicht genau weiß, was man sucht? Mir hat das Buch „Wem die Stunde schlägt“ von Ernest Hemingway gefallen und ich weiß nicht genau, was ich als nächstes lesen soll.... 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  55. 55. Explorative Suche • Was, wenn der Benutzer nicht weiß, welchen Suchbegriff er/sie benutzen soll? • Was, wenn der Benutzer komplexere Antworten sucht? • Was, wenn er/sie das Wissensgebiet, über das er sich informieren will, nicht (gut) kennt? • Was, wenn er/sie wissen möchte, welche Dokumente es insgesamt zu einem speziellen Thema in einem Repository gibt? • ...,Stöbern‘ statt ,Suchen‘ • ...etwas ,zufällig‘ finden • ...Serendipity • ...einen Überblick gewinnen 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  56. 56. Explorative Suche dbpedia:For_Whom_the_Bell_Tolls Wie soll das semantische http://dbpedia.org/page/For_Whom_the_Bell_Tolls Netzwerk um dbpedia:For_Whom_the_Bell_Tolls herum durchsucht werden? 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  57. 57. Explorative Suche or uth l:a -o w or dia th l:au pe -ow dia db p e db dbpedia-owl:author dbpedia-owl:author dbpedia:Ernest_Hemingway dbpedia:For_Whom_the_Bell_Tolls 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  58. 58. Explorative Suche dbpedia:Jack_Kerouac y _b ed nc e flu b y ed_ l:in n c -ow e dia l :i nflu dbpedia:Raymond_Carver ia -ow d pe e dbp db dbpedia-owl:author dbpedia-owl:influenced_by dbpedia:For_Whom_the_Bell_Tolls dbpedia:Ernest_Hemingway dbpedia:Jerome_D._Salinger 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  59. 59. Explorative Suche dbpedia:Jerome_D._Salinger dbpedia:Jack_Kerouac dbpedia:Raymond_Carver dbpedia-owl:notableWork dbpedia-owl:notableWork dbpedia-owl:notableWork 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011
  60. 60. 29 Waitelonis, Sack: Augmenting Video Search with Linked Open Data, http://mediaglobe.yovisto.com:8080/ in Proc. I-Semantics , Graz 2009. 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald Sack 60Mittwoch, 25. Mai 2011
  61. 61. „Wie Sie schon immer finden wollten, was Sie noch nie gesucht haben“ Paradigmenwechsel in der (Web)Suche Kontakt: Dr. Harald Sack Hasso-Plattner-Institut für Softwaresystemtechnik Universität Potsdam Prof.-Dr.-Helmert-Str. 2-3 D-14482 Potsdam Homepage: http://www.hpi.uni-potsdam.de/meinel/team/sack.html ür Blog: http://moresemantic.blogspot.com/ an k f n D it! E-Mail: harald.sack@hpi.uni-potsdam.de Viele sam ke Twitter: lysander07 fm erk re Au Ih 15. Leibniz-Kolleg, 25.05.2011, Potsdam, Dr. Harald SackMittwoch, 25. Mai 2011

×