Wie beeinflussen Suchmaschinen den Informationsmarkt?
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
1. 15.04.13
1
Neue Entwicklungen im Suchmaschinenbereich und deren
Relevanz für Bibliotheken
Prof. Dr. Dirk Lewandowski
dirk.lewandowski@haw-hamburg.de
http://www.bui.haw-hamburg.de/lewandowski.html
@Dirk_Lew
Semantik?
• „Semantic Web“
– Idee, dass durch semantische Auszeichnungen alle Inhalte des Web miteinander
verbunden werden und von Maschinen verstanden werden können.
– Alternative Ansätze: Linked Open Data, ...
• „Low Level Semantics“
– Faktenextraktion aus „chaotischen“ Dokumenten
– Einfache Auszeichnungen durch Website-Betreiber (Eigeninteresse bedienen)
• Verstehen der Dokumente vs. Verstehen der Suchanfragen
2. 15.04.13
2
Semantische Annotation von Dokumenten
• Semantische Annotationen können in der Suche ausgenutzt werden, um
• die Ergebnisqualität zu verbessern
• die Trefferdarstellung („Snippets“) zu verbessern
• Das Problem von „echten“ Semantic-Web-Anwendungen ist die Komplexität
in der Erstellung.
• Die großen Suchmaschinen haben sich auf ein gemeinsames Format für
semantische Annotationen geeignet, das in HTML umgesetzt wird.
Beispiel Google Knowledge Graph
5. 15.04.13
5
Semantische Suche
• Verbesserung der Qualität der Suchergebnisse durch
– Verstehen der Suchanfrage
– Kontextsensitive Vorschläge zur Verbesserung der Suchanfrage
– Verstehen der Dokumente, dadurch besserer Abgleich mit der Suchanfrage
– Semantische Anreicherung der Ergebnisbeschreibungen („Snippets“), dadurch
besser fundierte Entscheidung der Nutzer?
– Präsentation von aus Dokumenten zusammengestellten Ergebnissen (auf den
Seiten der Suchmaschine)
Soziale Suche
• Problem des bisherigen Rankings: Qualität wird vor allem durch Popularität (Links/
Klicks) gemessen
• Populär bei der Masse
• Populär in einer bestimmten Nutzergruppe
• Populär bei einem bestimmten Nutzer (Personalisierung)
• Das Versprechen des „Social Ranking“:
• Von Bekannten empfohlene Suchergebnisse sind relevanter und vertrauenswürdiger.
• Problem: Im Gegensatz zu Linkdaten aus dem freien Web handelt es sich bei Sozialen
Netzwerken um geschlossene Netzwerke, auf die die Suchmaschinen nicht per
Crawling zugreifen können.
6. 15.04.13
6
Bing und Facebook
• Vereinbarung über die Nutzung von Facebook-Daten in Bing
– Anmeldung in Bing mit dem Facebook-Account
– Bislang nur in den USA verfügbar
– Bing-Websuche in Facebook integriert
• Anreicherung der Suchergebnisse durch Daten aus Facebook
– Hervorhebung von Suchergebnisse durch Empfehlungen von Freunden
– Höheres Ranking von empfohlenen Ergebnissen
– Möglichkeit, Suchergebnisse in Facebook zu posten
– Diskussion mit Facebook-Freunden auf den Bing-Ergebnisseiten
12 | Dirk
Lewandowski
• x
7. 15.04.13
7
Google und Google+
• Aufbau eines eigenen sozialen Netzwerks durch Google
– Integration in alle Google-Dienste
– Bislang allerdings nicht besonders erfolgreich
• Anreicherung der Suchergebnisse
– Hervorhebung von Suchergebnisse durch Empfehlungen von Freunden
– Höheres Ranking von empfohlenen Ergebnissen
• Weiterer Nutzen von Google+
– „Klarnamen-Pflicht“
– Kombination mit anderen Profilen im Web (Twitter, etc.)
– Verbindung mit Daten zur Autorschaft (rel=author)
à Dadurch „Vertrauens-Graph“ als weitere Komponente des Rankings
Fazit Soziale Suche
• Soziale Suche vielschichtig (kollaborative Suche, ...), wichtigster Punkt ist
aber das Einbeziehen von Daten aus sozialen Netzwerken in das Ranking
und die Ergebnispräsentation.
• Beide großen Suchmaschinen haben Ansätze, solche Daten zu integrieren.
– Vorteil Bing: Daten aus dem Netzwerk, in dem tatsächlich etwas los ist.
– Vorteil Google: Tiefere Integration möglich, da es sich um ein eigenes Netzwerk
handelt.
8. 15.04.13
8
15 |
• x
Anzeigen
Nachrichten
Bilder
Videos
Blogbeiträge
Zusammenstellung der Suchergebnisse
• Das Suchanfragevolumen ist sehr ungleichmäßig verteilt.
• Treffer auf den vorderen Plätzen werden sehr stark bevorzugt.
• Durch entsteht ein großer Einfluss von Suchmaschinen (Google) auf das,
was Nutzer zu sehen bekommen.
1. Dürfen die Suchmaschinen ihre eigenen Angebote / die Angebote von Partnern
in der Ergebnisdarstellung bevorzugen?
2. Tun sie das?
• „Such-Neutralität“ bedeutet, dass eine Suchmaschine alle Dokumente im
Index nach gleichen Kriterien in das Ranking mit einbezieht.
10. 15.04.13
10
19 | Dirk
Lewandowski
• x
Problemfelder
• Bevorzugung eigener Angebote
– In den organischen Ergebnissen
– In den Universal-Search-Ergebnissen
• Aufnahme in den Index
– Bsp. Paid Inclusion bei Google Shopping: Eintragungen sind kostenpflichtig
– Folgen weitere Dienste (Places, ...)?
à Kennzeichnung als eigenes Angebot bzw. Partnerangebot als Lösung?
11. 15.04.13
11
Vielen Dank für die Aufmerksamkeit.
Prof. Dr. Dirk Lewandowski
Hochschule für Angewandte Wissenschaften Hamburg,
Department Information
http://www.bui.haw-hamburg.de/lewandowski.html
dirk.lewandowski@haw-hamburg.de
@Dirk_Lew