15.04.13
1
Neue Entwicklungen im Suchmaschinenbereich und deren
Relevanz für Bibliotheken
Prof. Dr. Dirk Lewandowski
dirk.lewandowski@haw-hamburg.de
http://www.bui.haw-hamburg.de/lewandowski.html
@Dirk_Lew
15.04.13
2
Inhalt
1.  Der Suchmaschinenmarkt: Wo stehen wir heute?
2.  Das Ranking der Suchmaschinen
3.  Ergebnispräsentation
4.  Anfragetypen
5.  Aktuelle Entwicklungen
–  Semantische Suche
–  Soziale Suche
–  Suchneutralität
•  Suchmaschinen und Bibliotheken
–  Handlungsfeld Bibliothekarische Informationssysteme
–  Handlungsfeld Informationskompetenz
Der Suchmaschinenmarkt: Wo stehen wir heute?
•  Suchmaschinen sind der Zugang zum Wissen im Web
•  (Quasi-)Monopol in der Web-Suche, Vielfalt in anderen Bereichen
•  Suche bleibt ein weitgehend unterschätzter Bereich
15.04.13
3
Suchmaschinen
E-Commerce
15.04.13
4
Site-intern und andere Datenbestände
Masse
• In Deutschland in einem
Monat 5,6 Milliarden
Suchanfragen („Kern-Suche“).
• Pro Tag: >180 Millionen
• Pro Stunde: 7,5 Millionen
• Pro Minute: 125.448
• Pro Sekunde: 2.091
15.04.13
5
Web search: „Always different, always the same“
http://web.archive.org/web/19961023234631/http://altavista.digital.com/
Modell der Websuche
15.04.13
6
Kernkomponenten einer Suchmaschine
(Risvik & Michelsen 2002)
15.04.13
7
Gruppen von Rankingfaktoren bei Suchmaschinen
•  Textstatistik
–  „Wie gut passen Anfrage und Dokument zusammen?“
–  Worthäufigkeiten, Position der Suchbegriffe im Dokument, ...
•  Popularität
–  „Wie wahrscheinlich ist es, dass der Nutzer bei seiner Web-Navigation auf dieses
Dokument treffen würde?“
–  Linkpopularität (linktopologisches Modell), Klickpopularität (Nutzungsmodell).
•  Aktualität
–  „Sollen für diese Anfrage aktuelle Dokumente ausgegeben werden?“
–  Datumsangaben, Linkstruktur, ...
•  Lokalität (=Nutzermodell/Standort)
–  „Welche Dokumente passen zur ‚Umgebung‘ des Nutzers?“
–  Länderinterfaces
Im Detail: Lewandowski 2005, Kap. 6
Gruppen von Rankingfaktoren bei Suchmaschinen
•  Textstatistik
–  „Wie gut passen Anfrage und Dokument zusammen?“
–  Worthäufigkeiten, Position der Suchbegriffe im Dokument, ...
•  Popularität
–  „Wie wahrscheinlich ist es, dass der Nutzer bei seiner Web-Navigation auf dieses
Dokument treffen würde?“
–  Linkpopularität (linktopologisches Modell), Klickpopularität (Nutzungsmodell).
•  Aktualität
–  „Sollen für diese Anfrage aktuelle Dokumente ausgegeben werden?“
–  Datumsangaben, Linkstruktur, ...
•  Lokalität (=Nutzermodell/Standort)
–  „Welche Dokumente passen zur ‚Umgebung‘ des Nutzers?“
–  Länderinterfaces
vor 1998
1998
2001
2004
Im Detail: Lewandowski 2005, Kap. 6
15.04.13
8
Popularität als Hilfskonstruktion zur Messung von
Glaubwürdigkeit
(Lewandowski, 2012)
Trefferpräsentation in Suchmaschinen
•  Text
8 |
•  x
Anzeigen
Organische
Ergebnisse
Universal-
Search-
Ergebnisse
15.04.13
9
Ergebnisseite als Ganzes
•  Suchergebnisseite
–  Search Engine Results Page (SERP)
•  Drei Bereiche:
–  Organische Ergebnisse
–  Navigationselemente
–  Werbung
•  Wahrnehmung der SERP: Der Knick („fold“)
–  Above the fold
–  Below the fold
Treffer 1
Treffer 2
Treffer 3
Treffer 4
Treffer 4
Suchfeld, Optionen
Werbung WerbungNavigation,
Optionen
15.04.13
10
Das typische Verhalten der Suchmaschinennutzer
•  Suchanfragen sind kurz und ungenau
–  „Die meisten Nutzer sind nicht willens, bei der Formulierung ihres Suchziels allzu
viel kognitive und zeitliche Energie aufzuwenden.“ (Machill et al., 2003)
•  Trefferselektion beeinflusst durch
–  Suchmaschinenmarke (Jansen et al. 2007)
–  Position des Treffers (Keane, O'Brien, & Smyth, 2008)
–  Treffer steht im sichtbaren Bereich (Granka et al. 2005; Cutrell 2007)
–  Aussagekräftige Beschreibungen, hervorgehobene Keywords (Lewandowski
2008)
–  Treffer ist besonders hervorgehoben – Universal Search
xxxx
•  xxxx
15.04.13
11
xxxx
•  xxxx
xxxx
•  xxxx
15.04.13
12
Anfragetypen in der Websuche
nach Broder (2002)
•  Informational (informationsorientiert)
–  Nutzer möchte sich zu einem Thema informieren.
–  Ziel sind mehrere Dokumente.
•  Navigational (navigationsorientiert)
–  Ziel ist es, eine bestimmte Seite (wieder) zu finden.
–  Typisch: Suche nach Homepage („Uni Regensburg“).
–  Ziel ist i.d.R. ein Dokument.
•  Transactional (transaktionsorientiert)
–  Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden soll.
–  Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei.
Anteile der Anfragetypen
(Lewandowski, Drechsler & von Mach, 2012)
15.04.13
13
Vielen Dank für die Aufmerksamkeit.
Prof. Dr. Dirk Lewandowski
Hochschule für Angewandte Wissenschaften Hamburg,
Department Information
http://www.bui.haw-hamburg.de/lewandowski.html
dirk.lewandowski@haw-hamburg.de
@Dirk_Lew

Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)

  • 1.
    15.04.13 1 Neue Entwicklungen imSuchmaschinenbereich und deren Relevanz für Bibliotheken Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de http://www.bui.haw-hamburg.de/lewandowski.html @Dirk_Lew
  • 2.
    15.04.13 2 Inhalt 1.  Der Suchmaschinenmarkt:Wo stehen wir heute? 2.  Das Ranking der Suchmaschinen 3.  Ergebnispräsentation 4.  Anfragetypen 5.  Aktuelle Entwicklungen –  Semantische Suche –  Soziale Suche –  Suchneutralität •  Suchmaschinen und Bibliotheken –  Handlungsfeld Bibliothekarische Informationssysteme –  Handlungsfeld Informationskompetenz Der Suchmaschinenmarkt: Wo stehen wir heute? •  Suchmaschinen sind der Zugang zum Wissen im Web •  (Quasi-)Monopol in der Web-Suche, Vielfalt in anderen Bereichen •  Suche bleibt ein weitgehend unterschätzter Bereich
  • 3.
  • 4.
    15.04.13 4 Site-intern und andereDatenbestände Masse • In Deutschland in einem Monat 5,6 Milliarden Suchanfragen („Kern-Suche“). • Pro Tag: >180 Millionen • Pro Stunde: 7,5 Millionen • Pro Minute: 125.448 • Pro Sekunde: 2.091
  • 5.
    15.04.13 5 Web search: „Alwaysdifferent, always the same“ http://web.archive.org/web/19961023234631/http://altavista.digital.com/ Modell der Websuche
  • 6.
  • 7.
    15.04.13 7 Gruppen von Rankingfaktorenbei Suchmaschinen •  Textstatistik –  „Wie gut passen Anfrage und Dokument zusammen?“ –  Worthäufigkeiten, Position der Suchbegriffe im Dokument, ... •  Popularität –  „Wie wahrscheinlich ist es, dass der Nutzer bei seiner Web-Navigation auf dieses Dokument treffen würde?“ –  Linkpopularität (linktopologisches Modell), Klickpopularität (Nutzungsmodell). •  Aktualität –  „Sollen für diese Anfrage aktuelle Dokumente ausgegeben werden?“ –  Datumsangaben, Linkstruktur, ... •  Lokalität (=Nutzermodell/Standort) –  „Welche Dokumente passen zur ‚Umgebung‘ des Nutzers?“ –  Länderinterfaces Im Detail: Lewandowski 2005, Kap. 6 Gruppen von Rankingfaktoren bei Suchmaschinen •  Textstatistik –  „Wie gut passen Anfrage und Dokument zusammen?“ –  Worthäufigkeiten, Position der Suchbegriffe im Dokument, ... •  Popularität –  „Wie wahrscheinlich ist es, dass der Nutzer bei seiner Web-Navigation auf dieses Dokument treffen würde?“ –  Linkpopularität (linktopologisches Modell), Klickpopularität (Nutzungsmodell). •  Aktualität –  „Sollen für diese Anfrage aktuelle Dokumente ausgegeben werden?“ –  Datumsangaben, Linkstruktur, ... •  Lokalität (=Nutzermodell/Standort) –  „Welche Dokumente passen zur ‚Umgebung‘ des Nutzers?“ –  Länderinterfaces vor 1998 1998 2001 2004 Im Detail: Lewandowski 2005, Kap. 6
  • 8.
    15.04.13 8 Popularität als Hilfskonstruktionzur Messung von Glaubwürdigkeit (Lewandowski, 2012) Trefferpräsentation in Suchmaschinen •  Text 8 | •  x Anzeigen Organische Ergebnisse Universal- Search- Ergebnisse
  • 9.
    15.04.13 9 Ergebnisseite als Ganzes • Suchergebnisseite –  Search Engine Results Page (SERP) •  Drei Bereiche: –  Organische Ergebnisse –  Navigationselemente –  Werbung •  Wahrnehmung der SERP: Der Knick („fold“) –  Above the fold –  Below the fold Treffer 1 Treffer 2 Treffer 3 Treffer 4 Treffer 4 Suchfeld, Optionen Werbung WerbungNavigation, Optionen
  • 10.
    15.04.13 10 Das typische Verhaltender Suchmaschinennutzer •  Suchanfragen sind kurz und ungenau –  „Die meisten Nutzer sind nicht willens, bei der Formulierung ihres Suchziels allzu viel kognitive und zeitliche Energie aufzuwenden.“ (Machill et al., 2003) •  Trefferselektion beeinflusst durch –  Suchmaschinenmarke (Jansen et al. 2007) –  Position des Treffers (Keane, O'Brien, & Smyth, 2008) –  Treffer steht im sichtbaren Bereich (Granka et al. 2005; Cutrell 2007) –  Aussagekräftige Beschreibungen, hervorgehobene Keywords (Lewandowski 2008) –  Treffer ist besonders hervorgehoben – Universal Search xxxx •  xxxx
  • 11.
  • 12.
    15.04.13 12 Anfragetypen in derWebsuche nach Broder (2002) •  Informational (informationsorientiert) –  Nutzer möchte sich zu einem Thema informieren. –  Ziel sind mehrere Dokumente. •  Navigational (navigationsorientiert) –  Ziel ist es, eine bestimmte Seite (wieder) zu finden. –  Typisch: Suche nach Homepage („Uni Regensburg“). –  Ziel ist i.d.R. ein Dokument. •  Transactional (transaktionsorientiert) –  Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden soll. –  Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei. Anteile der Anfragetypen (Lewandowski, Drechsler & von Mach, 2012)
  • 13.
    15.04.13 13 Vielen Dank fürdie Aufmerksamkeit. Prof. Dr. Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Department Information http://www.bui.haw-hamburg.de/lewandowski.html dirk.lewandowski@haw-hamburg.de @Dirk_Lew