15.04.13
1
Neue Entwicklungen im Suchmaschinenbereich und deren
Relevanz für Bibliotheken
Prof. Dr. Dirk Lewandowski
dirk.lewandowski@haw-hamburg.de
http://www.bui.haw-hamburg.de/lewandowski.html
@Dirk_Lew
Semantik?
•  „Semantic Web“
–  Idee, dass durch semantische Auszeichnungen alle Inhalte des Web miteinander
verbunden werden und von Maschinen verstanden werden können.
–  Alternative Ansätze: Linked Open Data, ...
•  „Low Level Semantics“
–  Faktenextraktion aus „chaotischen“ Dokumenten
–  Einfache Auszeichnungen durch Website-Betreiber (Eigeninteresse bedienen)
•  Verstehen der Dokumente vs. Verstehen der Suchanfragen
15.04.13
2
Semantische Annotation von Dokumenten
•  Semantische Annotationen können in der Suche ausgenutzt werden, um
•  die Ergebnisqualität zu verbessern
•  die Trefferdarstellung („Snippets“) zu verbessern
•  Das Problem von „echten“ Semantic-Web-Anwendungen ist die Komplexität
in der Erstellung.
•  Die großen Suchmaschinen haben sich auf ein gemeinsames Format für
semantische Annotationen geeignet, das in HTML umgesetzt wird.
Beispiel Google Knowledge Graph
15.04.13
3
Suchanfragen verstehen
•  bbl
•  vatikan
•  stockbrot
•  motonetix
•  nedcom
•  fußball
•  drehscheibe
•  frauentausch
•  seelenfarben
•  kachelmannwetter
•  osterei
•  wie ich
•  wgt
15.04.13
4
Suchanfragen im Kontext
Beispiel: Navigationsorientierte Suchanfragen anhand von Klicks
bestimmen
(Lewandowski, Drechsler & von Mach, 2012)
15.04.13
5
Semantische Suche
•  Verbesserung der Qualität der Suchergebnisse durch
–  Verstehen der Suchanfrage
–  Kontextsensitive Vorschläge zur Verbesserung der Suchanfrage
–  Verstehen der Dokumente, dadurch besserer Abgleich mit der Suchanfrage
–  Semantische Anreicherung der Ergebnisbeschreibungen („Snippets“), dadurch
besser fundierte Entscheidung der Nutzer?
–  Präsentation von aus Dokumenten zusammengestellten Ergebnissen (auf den
Seiten der Suchmaschine)
Soziale Suche
•  Problem des bisherigen Rankings: Qualität wird vor allem durch Popularität (Links/
Klicks) gemessen
•  Populär bei der Masse
•  Populär in einer bestimmten Nutzergruppe
•  Populär bei einem bestimmten Nutzer (Personalisierung)
•  Das Versprechen des „Social Ranking“:
•  Von Bekannten empfohlene Suchergebnisse sind relevanter und vertrauenswürdiger.
•  Problem: Im Gegensatz zu Linkdaten aus dem freien Web handelt es sich bei Sozialen
Netzwerken um geschlossene Netzwerke, auf die die Suchmaschinen nicht per
Crawling zugreifen können.
15.04.13
6
Bing und Facebook
•  Vereinbarung über die Nutzung von Facebook-Daten in Bing
–  Anmeldung in Bing mit dem Facebook-Account
–  Bislang nur in den USA verfügbar
–  Bing-Websuche in Facebook integriert
•  Anreicherung der Suchergebnisse durch Daten aus Facebook
–  Hervorhebung von Suchergebnisse durch Empfehlungen von Freunden
–  Höheres Ranking von empfohlenen Ergebnissen
–  Möglichkeit, Suchergebnisse in Facebook zu posten
–  Diskussion mit Facebook-Freunden auf den Bing-Ergebnisseiten
12 | Dirk
Lewandowski
•  x
15.04.13
7
Google und Google+
•  Aufbau eines eigenen sozialen Netzwerks durch Google
–  Integration in alle Google-Dienste
–  Bislang allerdings nicht besonders erfolgreich
•  Anreicherung der Suchergebnisse
–  Hervorhebung von Suchergebnisse durch Empfehlungen von Freunden
–  Höheres Ranking von empfohlenen Ergebnissen
•  Weiterer Nutzen von Google+
–  „Klarnamen-Pflicht“
–  Kombination mit anderen Profilen im Web (Twitter, etc.)
–  Verbindung mit Daten zur Autorschaft (rel=author)
à Dadurch „Vertrauens-Graph“ als weitere Komponente des Rankings
Fazit Soziale Suche
•  Soziale Suche vielschichtig (kollaborative Suche, ...), wichtigster Punkt ist
aber das Einbeziehen von Daten aus sozialen Netzwerken in das Ranking
und die Ergebnispräsentation.
•  Beide großen Suchmaschinen haben Ansätze, solche Daten zu integrieren.
–  Vorteil Bing: Daten aus dem Netzwerk, in dem tatsächlich etwas los ist.
–  Vorteil Google: Tiefere Integration möglich, da es sich um ein eigenes Netzwerk
handelt.
15.04.13
8
15 |
•  x
Anzeigen
Nachrichten
Bilder
Videos
Blogbeiträge
Zusammenstellung der Suchergebnisse
•  Das Suchanfragevolumen ist sehr ungleichmäßig verteilt.
•  Treffer auf den vorderen Plätzen werden sehr stark bevorzugt.
•  Durch entsteht ein großer Einfluss von Suchmaschinen (Google) auf das,
was Nutzer zu sehen bekommen.
1.  Dürfen die Suchmaschinen ihre eigenen Angebote / die Angebote von Partnern
in der Ergebnisdarstellung bevorzugen?
2.  Tun sie das?
•  „Such-Neutralität“ bedeutet, dass eine Suchmaschine alle Dokumente im
Index nach gleichen Kriterien in das Ranking mit einbezieht.
15.04.13
9
17 | Dirk
Lewandowski
•  x
18 | Dirk
Lewandowski
•  x
15.04.13
10
19 | Dirk
Lewandowski
•  x
Problemfelder
•  Bevorzugung eigener Angebote
–  In den organischen Ergebnissen
–  In den Universal-Search-Ergebnissen
•  Aufnahme in den Index
–  Bsp. Paid Inclusion bei Google Shopping: Eintragungen sind kostenpflichtig
–  Folgen weitere Dienste (Places, ...)?
à Kennzeichnung als eigenes Angebot bzw. Partnerangebot als Lösung?
15.04.13
11
Vielen Dank für die Aufmerksamkeit.
Prof. Dr. Dirk Lewandowski
Hochschule für Angewandte Wissenschaften Hamburg,
Department Information
http://www.bui.haw-hamburg.de/lewandowski.html
dirk.lewandowski@haw-hamburg.de
@Dirk_Lew

Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)

  • 1.
    15.04.13 1 Neue Entwicklungen imSuchmaschinenbereich und deren Relevanz für Bibliotheken Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de http://www.bui.haw-hamburg.de/lewandowski.html @Dirk_Lew Semantik? •  „Semantic Web“ –  Idee, dass durch semantische Auszeichnungen alle Inhalte des Web miteinander verbunden werden und von Maschinen verstanden werden können. –  Alternative Ansätze: Linked Open Data, ... •  „Low Level Semantics“ –  Faktenextraktion aus „chaotischen“ Dokumenten –  Einfache Auszeichnungen durch Website-Betreiber (Eigeninteresse bedienen) •  Verstehen der Dokumente vs. Verstehen der Suchanfragen
  • 2.
    15.04.13 2 Semantische Annotation vonDokumenten •  Semantische Annotationen können in der Suche ausgenutzt werden, um •  die Ergebnisqualität zu verbessern •  die Trefferdarstellung („Snippets“) zu verbessern •  Das Problem von „echten“ Semantic-Web-Anwendungen ist die Komplexität in der Erstellung. •  Die großen Suchmaschinen haben sich auf ein gemeinsames Format für semantische Annotationen geeignet, das in HTML umgesetzt wird. Beispiel Google Knowledge Graph
  • 3.
    15.04.13 3 Suchanfragen verstehen •  bbl • vatikan •  stockbrot •  motonetix •  nedcom •  fußball •  drehscheibe •  frauentausch •  seelenfarben •  kachelmannwetter •  osterei •  wie ich •  wgt
  • 4.
    15.04.13 4 Suchanfragen im Kontext Beispiel:Navigationsorientierte Suchanfragen anhand von Klicks bestimmen (Lewandowski, Drechsler & von Mach, 2012)
  • 5.
    15.04.13 5 Semantische Suche •  Verbesserungder Qualität der Suchergebnisse durch –  Verstehen der Suchanfrage –  Kontextsensitive Vorschläge zur Verbesserung der Suchanfrage –  Verstehen der Dokumente, dadurch besserer Abgleich mit der Suchanfrage –  Semantische Anreicherung der Ergebnisbeschreibungen („Snippets“), dadurch besser fundierte Entscheidung der Nutzer? –  Präsentation von aus Dokumenten zusammengestellten Ergebnissen (auf den Seiten der Suchmaschine) Soziale Suche •  Problem des bisherigen Rankings: Qualität wird vor allem durch Popularität (Links/ Klicks) gemessen •  Populär bei der Masse •  Populär in einer bestimmten Nutzergruppe •  Populär bei einem bestimmten Nutzer (Personalisierung) •  Das Versprechen des „Social Ranking“: •  Von Bekannten empfohlene Suchergebnisse sind relevanter und vertrauenswürdiger. •  Problem: Im Gegensatz zu Linkdaten aus dem freien Web handelt es sich bei Sozialen Netzwerken um geschlossene Netzwerke, auf die die Suchmaschinen nicht per Crawling zugreifen können.
  • 6.
    15.04.13 6 Bing und Facebook • Vereinbarung über die Nutzung von Facebook-Daten in Bing –  Anmeldung in Bing mit dem Facebook-Account –  Bislang nur in den USA verfügbar –  Bing-Websuche in Facebook integriert •  Anreicherung der Suchergebnisse durch Daten aus Facebook –  Hervorhebung von Suchergebnisse durch Empfehlungen von Freunden –  Höheres Ranking von empfohlenen Ergebnissen –  Möglichkeit, Suchergebnisse in Facebook zu posten –  Diskussion mit Facebook-Freunden auf den Bing-Ergebnisseiten 12 | Dirk Lewandowski •  x
  • 7.
    15.04.13 7 Google und Google+ • Aufbau eines eigenen sozialen Netzwerks durch Google –  Integration in alle Google-Dienste –  Bislang allerdings nicht besonders erfolgreich •  Anreicherung der Suchergebnisse –  Hervorhebung von Suchergebnisse durch Empfehlungen von Freunden –  Höheres Ranking von empfohlenen Ergebnissen •  Weiterer Nutzen von Google+ –  „Klarnamen-Pflicht“ –  Kombination mit anderen Profilen im Web (Twitter, etc.) –  Verbindung mit Daten zur Autorschaft (rel=author) à Dadurch „Vertrauens-Graph“ als weitere Komponente des Rankings Fazit Soziale Suche •  Soziale Suche vielschichtig (kollaborative Suche, ...), wichtigster Punkt ist aber das Einbeziehen von Daten aus sozialen Netzwerken in das Ranking und die Ergebnispräsentation. •  Beide großen Suchmaschinen haben Ansätze, solche Daten zu integrieren. –  Vorteil Bing: Daten aus dem Netzwerk, in dem tatsächlich etwas los ist. –  Vorteil Google: Tiefere Integration möglich, da es sich um ein eigenes Netzwerk handelt.
  • 8.
    15.04.13 8 15 | •  x Anzeigen Nachrichten Bilder Videos Blogbeiträge Zusammenstellungder Suchergebnisse •  Das Suchanfragevolumen ist sehr ungleichmäßig verteilt. •  Treffer auf den vorderen Plätzen werden sehr stark bevorzugt. •  Durch entsteht ein großer Einfluss von Suchmaschinen (Google) auf das, was Nutzer zu sehen bekommen. 1.  Dürfen die Suchmaschinen ihre eigenen Angebote / die Angebote von Partnern in der Ergebnisdarstellung bevorzugen? 2.  Tun sie das? •  „Such-Neutralität“ bedeutet, dass eine Suchmaschine alle Dokumente im Index nach gleichen Kriterien in das Ranking mit einbezieht.
  • 9.
    15.04.13 9 17 | Dirk Lewandowski • x 18 | Dirk Lewandowski •  x
  • 10.
    15.04.13 10 19 | Dirk Lewandowski • x Problemfelder •  Bevorzugung eigener Angebote –  In den organischen Ergebnissen –  In den Universal-Search-Ergebnissen •  Aufnahme in den Index –  Bsp. Paid Inclusion bei Google Shopping: Eintragungen sind kostenpflichtig –  Folgen weitere Dienste (Places, ...)? à Kennzeichnung als eigenes Angebot bzw. Partnerangebot als Lösung?
  • 11.
    15.04.13 11 Vielen Dank fürdie Aufmerksamkeit. Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Department Information http://www.bui.haw-hamburg.de/lewandowski.html dirk.lewandowski@haw-hamburg.de @Dirk_Lew