Der Weg ist das Ziel                               Explorative Semantische                                     Videosuche ...
Der Weg ist das Ziel                               Explorative Semantische Videosuche                               • Woru...
The Web is big.  Really big.  You just wont believe how vastly,  hugely, mind-bogglingly big it is.  (frei nach Douglas Ad...
Wie findet man etwas                                                                 im WWW?                              ...
...the current solution:                               Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interak...
The World                                                                                                                 ...
Suchfacetten                                                                                                          Mult...
Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Brauns...
Welcome to the End of the World.... from AOL’s search query logs 08/2006                                                  ...
Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Brauns...
Das „Google Dilemma“       • Steht das Wichtigste tatsächlich vorne in der         Ergebnisliste?       • Was bedeutet übe...
Klassisches Information Retrieval     Information requests                                                                ...
Klassisches Information Retrieval                                                                                         ...
Wie gut ist das Suchergebnis?                         relevante Dokumente, die gefunden wurden                            ...
Suchmaschinen im WWW             • World Wide Web ist ein verteiltes Hypermediasystem              • multimediale Dokument...
Web-Crawler (Web Robot)16                                                                                                 ...
Suchmaschinen im WWW     Preprocessing und Indexierung17                                                                  ...
Suchmaschinen im WWW Effiziente Indexdatenstrukturen                                                                       ...
Suchmaschinen im WWW     Relevanzbewertung (Ranking)19                  • Linkpopularität (Google PageRank)               ...
Aber warum ist das Suchen im WWW so schwierig...?                                                                         ...
The Web is big.  Really big.  You just wont believe how vastly,  hugely, mind-bogglingly big it is.  (frei nach Douglas Ad...
The Web is big...                               •ca. 25 x 109 in Suchmaschinen indizierte                                D...
...and it‘s getting bigger every minute!                               Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, W...
http://www.visualnews.com/2012/06/19/how-much-data-created-every-minute/                               Dr. Harald Sack, Ha...
und damit                                                                                                    nicht genug.....
Problemfeld Informationssuche26            Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität P...
Problemfeld Informationsextraktion27            Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universi...
The Web does not only consist out of text data...            Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Insti...
29      A little Semantics goes a long way...            Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut,...
Automated Audiovisual Analysis                                                                                            ...
Semantische Suche                   • basiert auf semantisch annotierten Daten,                       i.e. (textuelle) Met...
Named Entity Recognition                                                               „locating and classifying atomic el...
Entity Mapping onto the Web of Data33                                                                                     ...
Semantic Multimedia Analysis              Video Analysis /              Metadata Extraction                               ...
35     ...was ist eigentlich der Vorteil der semantischen Suche?            Vorlesung Semantic Web, Dr. Harald Sack, Hasso...
Semantische Suche36       (1) Präzisierung der Suchergebnisse         • durch Verfeinerung der ursprünglichen Suchphrase ü...
Semantische Suche37        (2) Vervollständigung der Suchergebnisse          • durch Erweiterung der ursprünglichen Suchph...
Semantische Suche38        (3) Kategorisierung der Suchergebnisse        • durch inhaltsbasierte Filterung nach gemeinsame...
Semantic Search Faceted Search39            Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität ...
Semantic Search                               z.B. Auto-Suggestion ServicesDonnerstag, 20. September 12
Semantische Suche41        (3) Herstellung von Querverweisem          • Bereitstellung von Suchergebnissen, die zwar den S...
Suchen ist nicht immer gleich Suchen42            Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Univer...
ein einfaches Beispiel:                Ich suche nach dem Buch „Brave New World“ von                Aldous Huxley in der e...
44            ...aber was, wenn               ...mir hat das Buch „Brave New World“ gut gefallen,               aber was l...
45                          Exploratory Search                        • What, if the user does not know, which query strin...
46                                                                                                    http://dbpedia.org/p...
47                                                                                         or                             ...
dbpedia:H._G._Wells48                                                                                                     ...
dbpedia:H._G._Wells                              dbpedia:George_Orwell                dbpedia:Michel_Houellebecq49        ...
Problem: Was ist eigentlich wichtig?50         • Linked Data beinhaltet ungewichtetes Wissen         • ungewichtet = keine...
Explorative Suche - ein einfaches Beispiel      • Suche im Grunddatenbestand nach ,Aldous Huxley‘51      • Identifikation e...
Explorative Suche - vom „glücklichen Finden“      • Finden, was man eigentlich gar nicht gesucht hat,52        aber schon ...
Explorative Search                               with yovisto                                                    Waiteloni...
So long,  and Thanks for all the fish.  (Douglas Adams)                                               Contact:             ...
Nächste SlideShare
Wird geladen in …5
×

Der Weg ist das Ziel - Explorative semantische Videosuche

1.163 Aufrufe

Veröffentlicht am

Keynote zur IVDW 2012, am 20. September 2012 in Braunschweig im Rahmen der Informatik 2012.

Veröffentlicht in: Technologie
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
1.163
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
6
Aktionen
Geteilt
0
Downloads
10
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Der Weg ist das Ziel - Explorative semantische Videosuche

  1. 1. Der Weg ist das Ziel Explorative Semantische Videosuche Interaktion und Visualisierung im Datenweb (IVDW 2012) Braunschweig, 20.09.2012 Dr. Harald Sack Hasso-Plattner-Institut for IT-Systems Engineering University of PotsdamDonnerstag, 20. September 12
  2. 2. Der Weg ist das Ziel Explorative Semantische Videosuche • Worum gehts.... • Suchen und Finden im World Wide Web • Suche in multimedialen Daten • Semantische Suche • Explorative Suche Dr. Harald Sack Hasso-Plattner-Institut for IT-Systems Engineering University of PotsdamDonnerstag, 20. September 12
  3. 3. The Web is big. Really big. You just wont believe how vastly, hugely, mind-bogglingly big it is. (frei nach Douglas Adams) Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  4. 4. Wie findet man etwas im WWW? Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  5. 5. ...the current solution: Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  6. 6. The World according to Google... Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  7. 7. Suchfacetten Multimodale Ergebnisse Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  8. 8. Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  9. 9. Welcome to the End of the World.... from AOL’s search query logs 08/2006 ...according to Google ...62% of internet search engine users click on a search result within the first page of results, and 90% within the first three pages. iProspect Search Engine User Behaviour Study, 2006 the first 10 results received 89.71% of all click-through traffic; the following 10 results received 4.37%; the third page 2.42%; and the fifth page 1.07%. from AOL’s search query logs 08/2006 Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  10. 10. Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  11. 11. Das „Google Dilemma“ • Steht das Wichtigste tatsächlich vorne in der Ergebnisliste? • Was bedeutet überhaupt „wichtig“? • Ist das, was Google für wichtig hält, tatsächlich auch für alle gleichermaßen wichtig? • ...und was ist mit dem Rest? • Kann Google meine Absicht erraten?? • Sind das überhaupt tatsächlich auch alle Ergebnisse? • Kann ich überprüfen, ob die Ergebnisse vollständig sind? Problem: Ich muss wissen, was ich suche.... Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  12. 12. Klassisches Information Retrieval Information requests files of records Menge von Dokumenten Menge von Anfragen similarity Anfrage- Indexierung formulierung Indexierungssprache (nach Salton,G., McGill, M.J.: Introduction to Modern Information Retrieval. McGraw-Hill, New York 1983) Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  13. 13. Klassisches Information Retrieval (vereinfachte Variante....) Menge von Dokumenten „Suchen“ SUCHEN, vb. , in allen ger n ? sprachen bezeugt: got.sokjan, ags. sēcan, as. sokian, an. Soekj Suchterm(e) Schlüsselwörter [Bd. 20, Sp. 835] sēza, ahd. suohhan. aus idg. sprachen steht am nächsten lat. sāgiospüre, air. saigim gehe Suchanfrage einer sache nach, suche; zur weiteren verwandtschaft vgl. Walde-Pokorny 2, 449. der umlaut des stammvokals erscheint im nd., er wird im md. verzeichnet vonCrecelius oberhess. wb. 827; Spiess henneb. id. 248; Hertel Thüringen240; Gerbet Vogtland 425 und auf kolonialem boden bei Schröerdeutsche mundarten des ungrischen berglandes 225. neben eigentlichem suchen einer sache nachspüren, sich bemühen, sie Suchindex aufzufinden (dann auch jemanden aufsuchen, ihn bedrohen, angreifen) steht Dokument eine reich bezeugte bedeutungsgruppe mehr Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  14. 14. Wie gut ist das Suchergebnis? relevante Dokumente, die gefunden wurden |R∩P| Recall= |R| R P |R∩P| Precision= |P| relevante Dokumente gefundene Dokumente 14 Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  15. 15. Suchmaschinen im WWW • World Wide Web ist ein verteiltes Hypermediasystem • multimediale Dokumente • über Hyperlinks miteinander vernetzt • WWW-Suchmaschinen sind Information Retrieval Systeme mit folgenden Aufgaben • Erstellung und Pflege eines Indexes (Web Crawler + Indexing) • Verarbeitung von Suchabfragen (Retrieval + Ranking) • Aufbereitung der Ergebnisse (Visualisierung) 15 Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  16. 16. Web-Crawler (Web Robot)16 HTTP Request WWW-Server 2 4 http://www.xxxx.de/1234... http://www.xxxx.de/2234... http://www.xxxx.de/3234... http://www.xxxx.de/4234... <a href=“...“ .../> http://www.xxxx.de/5234... 1 http://www.xxxx.de/6234... http://www.xxxx.de/7234... <a href=“...“ .../> ... WWW-Server liefert angefragte HTML-Dokumente an den 3 Web-Crawler zurück HTML URL Liste Dokumente Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  17. 17. Suchmaschinen im WWW Preprocessing und Indexierung17 Datennormalisierung Wortidentifikation Sprachidentifikation Datenanalyse und Anlegen Word Stemming der Index- Datenstrukturen POS-Tagging Deskriptorengenerierung Web Crawler Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  18. 18. Suchmaschinen im WWW Effiziente Indexdatenstrukturen Ananas18 DocID Pos Frequenz Gewicht D123 1;13;77;132 4 9.4 D456 22;38 2 6.7 Aachen … … … … D998 15 1 1.2 Altavista Ananas Invertierte Datei … … Zustand Location List D123 Zypern Frequenz URL <H1> … <H6> <title> … text 4 1 1 0 1 … 1 Indexdatei D123 http://producers.ananas.org/index.htm <html> <head><title=“Ananas around the World“> </head> <body> … </body> </html> Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam Direkte DateiDonnerstag, 20. September 12
  19. 19. Suchmaschinen im WWW Relevanzbewertung (Ranking)19 • Linkpopularität (Google PageRank) resultierender Ausgangssituation Iteration der PageRank Berechnung PageRank A B A B Nr. PR(A) PR(B) PR(C) PR(D) 1.0 1.0 1 1,0 1,0 1,0 1,0 1.49 0,78 2 1,0 0,575 2,275 0,15 3 2,083 0,575 1,191 0,15 2 … … … … … 1.0 1.0 1.57 0,15 n 1,49 0,7833 1,577 0,15 C D C D Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  20. 20. Aber warum ist das Suchen im WWW so schwierig...? 20 Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  21. 21. The Web is big. Really big. You just wont believe how vastly, hugely, mind-bogglingly big it is. (frei nach Douglas Adams) Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  22. 22. The Web is big... •ca. 25 x 109 in Suchmaschinen indizierte Dokumente (TNL Blog: Google has 24 billion items index, considers MSN search nearest competitor, September 2005) •Web Crawler: > 1012 Dokumente (The Official Google Blog: We knew the Web was Big....., Juli 25, 2008) •Google Search Index Caffeine umfasst ca.100 Million Gigabytes i.e. 1017 Byte (SMX Video: Google’s Matt Cutts On Caffeine Launch, June 9, 2010, http://searchengineland.com/smx-video-googles-matt-cutts-on-caffeine- launch-43933) •DeepWeb (Darkweb) schätzungsweise bis zu 550 mal größer als das Surface Web (Bergman, 2001) Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  23. 23. ...and it‘s getting bigger every minute! Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  24. 24. http://www.visualnews.com/2012/06/19/how-much-data-created-every-minute/ Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  25. 25. und damit nicht genug...25 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  26. 26. Problemfeld Informationssuche26 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  27. 27. Problemfeld Informationsextraktion27 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  28. 28. The Web does not only consist out of text data... Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität Potsdam 28Donnerstag, 20. September 12
  29. 29. 29 A little Semantics goes a long way... Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  30. 30. Automated Audiovisual Analysis Visual Concept Analysis Classification: Face Studio Indoor Detection Person Identification overlay News Show Tracking Logo Clustering Detection text scene text Audio-Mining structural Automated speaker analysis Speech identification Recognition Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  31. 31. Semantische Suche • basiert auf semantisch annotierten Daten, i.e. (textuelle) Metadaten werden mit semantischen Entitäten (Wissensrepräsentation) verknüpft • ermöglicht durch entitätenbasiertes Information Retrieval eine Suche mit hohem Recall und Precision • durch Ausnutzung semantischer Relationen werden inhaltsbasierte Kategorisierungen und Filterfunktionen ermöglicht • Semantische Metadaten sind Interoperable Metadaten durch explizite Semantik • zur inhaltlichen Beschreibung • zur struturellen/technischen Beschreibung (Multimedia Ontologien) Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  32. 32. Named Entity Recognition „locating and classifying atomic elements...into predefined categories such as names, persons, organizations, locations, expressions of time, quantities, monetary values, etc.“ C.J.Rijsbergen, Information Retrieval (1979) Neil Armstrong Entities is a is a Ontologies Astronaut Person is a Science Occupation is a has an Employment Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12
  33. 33. Entity Mapping onto the Web of Data33 Neil Armstrong is a is a Astronaut Person is a Science Occupation is a has an Employment Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  34. 34. Semantic Multimedia Analysis Video Analysis / Metadata Extraction metadata metadata metadata metadata metadata Entity Recognition Entity Mapping e.g., bibliographical data, geographical data, encyclopedic data, ..Donnerstag, 20. September 12
  35. 35. 35 ...was ist eigentlich der Vorteil der semantischen Suche? Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  36. 36. Semantische Suche36 (1) Präzisierung der Suchergebnisse • durch Verfeinerung der ursprünglichen Suchphrase über mögliche Kategorisierungen/Oberbegriffe (Query Refinement) Suchphrase: Bank Mögliche Erweiterung: Bank ∧ Kreditanstalt oder Bank ∧ Sitzgelegenheit oder Bank ∧ Sediment Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  37. 37. Semantische Suche37 (2) Vervollständigung der Suchergebnisse • durch Erweiterung der ursprünglichen Suchphrase unter Einbeziehung von Synonymen sowie und Oberbegriffen (Query Refinement) Suchphrase: Bank Mögliche Erweiterung: Bank ∨ Kreditanstalt ∨ Sparkasse ∨ ... Bank ∨ Konto ∨ Kredit ∨ ... Bank ∨ Santander ∨ Raiffeisen ∨ ... Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  38. 38. Semantische Suche38 (3) Kategorisierung der Suchergebnisse • durch inhaltsbasierte Filterung nach gemeinsamen Oberbegriffen / Kategorien (Faceted Search) Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  39. 39. Semantic Search Faceted Search39 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  40. 40. Semantic Search z.B. Auto-Suggestion ServicesDonnerstag, 20. September 12
  41. 41. Semantische Suche41 (3) Herstellung von Querverweisem • Bereitstellung von Suchergebnissen, die zwar den Suchbegriff nicht notwendigerweise enthalten, aber mit diesem in inhaltlichem Zusammenhang stehen Suchphrase: Neil Armstrong ermittelter Oberbegriff: Apollo 11 Ausweitung der Suche auf andere Crewmitglieder dbprop:mission dbpedia:Michael_Collins dbpedia:Apollo_11 dbprop:mission dbprop:mission NER Neil Armstrong dbpedia:Neil_Armstrong dbpedia:Buzz_Aldrin Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  42. 42. Suchen ist nicht immer gleich Suchen42 Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  43. 43. ein einfaches Beispiel: Ich suche nach dem Buch „Brave New World“ von Aldous Huxley in der ersten in Deutschland erschienenen Ausgabe Brave Ne - The Al w World. (Hamburg batros C - Aldous H U X ontinent L E Y. 257 S. 8 usw., Albatros al Library, 47 “ Verlag, 1933) II 1, 25 06, 3454 8Harald Sack, Hasso-Plattner-Institute for IT-Systems Engineering, 63. Theorietag - Workshop für Algorithmen und Komplexität, FH Brandenburg, 18. 01. 2012Donnerstag, 20. September 12
  44. 44. 44 ...aber was, wenn ...mir hat das Buch „Brave New World“ gut gefallen, aber was lese ich als nächstes...? Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  45. 45. 45 Exploratory Search • What, if the user does not know, which query string to use? • What, if the user is looking for complex answers ? • What, if the user does not know the domain he/she is looking for? • What, if the user wants to know all(!) about a specific topic? • ...,Browsing‘ instead of ,Searching‘ • ...to get an overview • ...enable content based navigation Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  46. 46. 46 http://dbpedia.org/page/Brave_New_World What facts for dbpedia:Brave_New_World are relevant? ...use heuristics Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  47. 47. 47 or uth :a wl r -o ho ut dia l :a w pe ia-o ed db p db dbpedia-owl:author dbpedia-owl:author dbpedia:Aldous_Huxley dbpedia:Brave_New_World Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  48. 48. dbpedia:H._G._Wells48 dbpedia:George_Orwell es nc lue inf y/ log to s ce on en flu ia: in y/ ed g p olo nt db ia:o p ed db dbpedia-owl:author dbpedia:ontology/influences dbpedia:Aldous_Huxleydbpedia:Brave_New_World dbpedia:Michel_Houellebecq Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  49. 49. dbpedia:H._G._Wells dbpedia:George_Orwell dbpedia:Michel_Houellebecq49 dbpedia-owl:notableWork dbpedia-owl:notableWork dbpedia-owl:notableWorkdbpedia:The_Time_Machine dbpedia:Nineteen_Eighty-Four dbpedia:Les_Particules_élémentaires Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  50. 50. Problem: Was ist eigentlich wichtig?50 • Linked Data beinhaltet ungewichtetes Wissen • ungewichtet = keine Unterscheidung, ob wichtig oder unwichtig • z.B.., Aldous Huxley • > 400 Fakten (RDF-triples) • > 70 Eigenschaften (properties) Aldous Huxley • keine Reihenfolge • keine Relevanzbewertungen • Entwicklung von Heuristischen Verfahren zur Relevanz-Bewertung von Linked Data Fakten • semantische Graphenanalyse • statistische Verfahren http://dbpedia.org/page/Aldous_Huxley J. Waitelonis, H. Sack: Towards exploratory video search using linked data, MTAP vol.59-2, 2012, pp. 645-672. A. Thalhammer, M. Knuth, H. Sack: Evaluating Entity Summarizations Using a Game-Based Ground Truth, (ISWC 2012). Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  51. 51. Explorative Suche - ein einfaches Beispiel • Suche im Grunddatenbestand nach ,Aldous Huxley‘51 • Identifikation einer Entität dbpedia:Aldous Huxley • Bestimmung eines geeigneten Properties • Nutzung der gefundenen Properties zur Navigation des Suchraums H.G. Wells Aldous Huxley George Orwell dbpedia:ontology/influences dbpedia:ontology/influences rdfs:type rdfs:type rdfs:type Yago:EnglishScienceFictionWriters Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  52. 52. Explorative Suche - vom „glücklichen Finden“ • Finden, was man eigentlich gar nicht gesucht hat,52 aber schon immer einmal finden wollte.... • glückliches Finden = Serendipity Suchphrase: Ernest Hemingway Ausweitung der Suche auf Personen, die etwas mit Ernest Hemingway zu tun haben category:Person rdf:type rdf:type dbpedia:Marlene_Dietrich dbpedia:Ernest_Hemingway a:da ted popstr Vorlesung Semantic Web, Dr. Harald Sack, Hasso-Plattner-Institut, Universität PotsdamDonnerstag, 20. September 12
  53. 53. Explorative Search with yovisto Waitelonis, Sack: Augmenting Video Search with Linked Open Data, http://mediaglobe.yovisto.com:8080/ in Proc. I-Semantics 2009.Donnerstag, 20. September 12
  54. 54. So long, and Thanks for all the fish. (Douglas Adams) Contact: Harald Sack Hasso-Plattner-Institut für Softwaresystemtechnik Universität Potsdam Prof.-Dr.-Helmert-Str. 2-3 D-14482 Potsdam Homepage: ttp://www.hpi.uni-potsdam.de/meinel/team/sack.html h http://www.yovisto.com/ Blog: http://moresemantic.blogspot.com/ E-Mail: harald.sack@hpi.uni-potsdam.de Twitter: lysander07 / biblionomicon / yovisto Dr. Harald Sack, Hasso-Plattner-Institut Potsdam, Workshop: Interaktion und Visualisierung im Datenweb (IVDW 2012), Braunschweig, 20.09.2012Donnerstag, 20. September 12

×