SlideShare ist ein Scribd-Unternehmen logo
Web-Suchmaschinen:
Suchverhalten, Informationsqualität, Trends
Prof. Dr. Dirk Lewandowski
dirk.lewandowski@haw-hamburg.de
Agenda




 Nutzerverhalten

 Wie gut sind die gängigen Suchmaschinen?

 Suche und Web 2.0

 Fazit




1 |
Agenda




 Nutzerverhalten

 Wie gut sind die gängigen Suchmaschinen?

 Suche und Web 2.0

 Fazit




2 |
Bedeutung der Suchmaschinen




 • Suchmaschinen sind der Zugang zu Informationen im Netz.
    – Andere Zugänge (Kataloge, usw.) haben kaum noch Bedeutung.
    – Suchmaschinen bestimmen über die sichtbaren Inhalte des Web.
    – Suchmaschinen bestimmen das Nutzerverhalten (auch für andere
      Informationssysteme).




3 |
Drei Anfragetypen

 Anfragetypen nach Broder (2002)



 • Informational (informationsorientiert)
      – Nutzer möchte sich zu einem Thema informieren.
      – Ziel sind mehrere Dokumente.

 • Navigational (navigationsorientiert)
      – Ziel ist es, eine bestimmte Seite (wieder) zu finden.
      – Typisch: Suche nach Homepage („Daimler Chrysler“).
      – Ziel ist i.d.R. ein Dokument.

 • Transactional (transaktionsorientiert)
      – Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden soll.
      – Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei.


4 |
„Die meisten Nutzer sind nicht willens, bei der Formulierung ihres
 Suchziels allzu viel kognitive und zeitliche Energie aufzuwenden.“
                                                                          (Machill et al. 2003)




 • Boolesche Operatoren
    – Bei weniger als 10% der Anfragen; keine Veränderung im Lauf der Jahre
      (Spink&Jansen 2004).
    – Nur etwa die Hälfte der Nutzer weiß, dass es Operatoren gibt (Machill et al.
      2003).
    – 20% der Nutzer geben an, sie öfter zu verwenden (Machill et al. 2003).
    – Etwa die Hälfte der Anfragen mit Operatoren enthält Fehler (Spink et al. 2000),
      bei der Verwendung von Plus-/Minuszeichen lag die Fehlerquote bei 2/3.

 • Profisuche
    – 59% der Nutzer kennen die Profisuche (Machill et al. 2003).
    – Nur 14% nutzen sie öfter (Machill et al. 2003).



5 |
Grunddaten zum Nutzerverhalten (2)




 • Auswertung der Treffer
    – 80% der Nutzer betrachten nur die erste Ergebnisseite (= 10 Treffer)
      (Spink&Jansen 2004).
    – Vor allem die Treffer auf den ersten Listenplätzen werden angesehen; möglichst
      kein Scrollen
    – Pro Session werden nur etwa fünf Dokumente gesichtet (Spink&Jansen 2004).
    – Sessions dauern weniger als 15 Minuten.

 • Kaum Veränderungen im Lauf der Zeit




6 |
Google groß




7 |

                   

               

Google klein
9 |
Selektionsverhalten (Top11 Treffer)




                                       (Granka et al. 2004)



10 |
Eye-tracking




11 |            (Enquiro Eye Tracking Report II)
Agenda




 Nutzerverhalten

 Wie gut sind die gängigen Suchmaschinen?

 Suche und Web 2.0

 Fazit




12 |
Die Qualität von Suchmaschinen kann nur durch eine
 Kombination unterschiedlicher Faktoren gemessen werden.
 Qualitätsfaktoren für Suchmaschinen


 • Qualität des Index
    – Größe des Datenbestands, Abdeckung des Web
    – Abdeckung bestimmter Bereiche (Sprachräume, Länder)
    – Überschneidungen der Indices
    – Aktualität des Datenbestands

 • Qualität der Suchresultate
    – Retrievaleffektivität
    – Zufriedenheit der Nutzer
    – Überschneidungen der (Top-)Ergebnisse

 • Qualität der Suchfunktionen

 • Nutzerfreundlichkeit + Benutzerführung                   (Lewandowski & Höchstötter 2007)

13 |
Web-Abdeckung




 Keine Suchmaschine deckt das gesamte Web ab!
    – Aber: keine genauen Zahlen; aktuelle Untersuchungen fehlen.
    – Größe des Web ist unbekannt; die großen Suchmaschinen haben einige
      Milliarden Dokumente indexiert.
    – Wenig erforschter Bereich: Invisible Web.

 Definitionen Invisible/Deep Web
    – “Text pages, files, or other often high-quality authoritative information available
      via the World Wide Web that general-purpose search engines cannot, due to
      technical limitations, or will not, due to deliberate choice, add to their indices of
      Web pages" (Sherman u. Price 2001).
    – “The deep Web - those pages do not exist until they are created dynamically as
      the result of a specific search“ (Bergman 2001).

14 |
Country Bias




15 |
Überschneidung der Datenbestände




 • Überschneidung der Indices
    – Relativ gering, daher lohnt sich die Suche in mehreren Suchmaschinen.

 • Überschneidung der Suchergebnisse
    – Sehr gering innerhalb der Top10, 20.




16 |
Überschneidung der Trefferlisten (Top10)




17 |
Aktualität der Datenbestände




 • Wichtig wegen
    – Auffinden und Erfassen neuer Dokumente.
    – Aktualisierung veränderter Dokumente; korrekte Repräsentation der URLs.

 • Untersuchung 2005-2007
    – Beobachtungszeitraum jeweils sechs Wochen.
    – 40 täglich aktualisierte Seiten (+ 30 unregelmäßig aktualisierte).




18 |
Auch aktuelle Seiten werden nicht zuverlässig regelmäßig
 indexiert.




19 |
Aktualität der Datenbestände




20 |
Aktualität der Datenbestände




21 |

                                Quelle: Lewandowski et al. 2006
Retrievaleffektivität: Navigationsorientierte Anfragen




22 |
Retrievaleffektivität: Informationsorientierte Anfragen

 Klassische Tests


 • Welche Suchmaschine liefert die besten Treffer?

 • Test anhand von
    – einer bestimmten Anzahl von Suchanfragen (50).
    – einer bestimmten Anzahl von Treffern pro Suchmaschine (20).
    – Bewertungen durch Juroren (wichtige Frage: wer bewertet?).
    – Ja/Nein-Entscheidungen über Relevanz, verschiedenen Skalen.




23 |
Precision ist das am häufigsten verwendete Retrievalmaß.

 Klassische Retrievalmaße


 • Precision
    – Anteil der relevanten ausgegebenen Treffer an der Gesamtheit der
      ausgegebenen Treffer.
    – Wird bei Suchmaschinen i.d.R. bis zu einem Cut-Off-Wert bestimmt (z.B. 20).

 • Recall
    – Anteil der relevanten ausgegebenen Treffer an der Gesamtheit aller überhaupt
      vorhandenen Treffer (= aller im Web vorhandener relevanter Dokumente).
    – Bei Suchmaschinen nicht messbar (Ausweg evtl. über Pooling-Methoden).

 • Fallout
    – Anteil der ausgegebenen nicht relevanten Treffer an der Gesamtzahl der nicht
       relevanten Treffer im Datenbestand.
 • Generality
    – Anteil der relevanten Dokumente im zugrunde liegenden Datenbestand.
24 |
Precision@10 zwischen 0,43 und 0,60.




25 |
Skalenbewertung zeigt die Gruppierung der Suchmaschinen
 noch deutlicher.




26 |
Keine klare Reihung der Suchmaschinen, wenn einzelne
 Anfragen betrachtet werden.




27 |
Offene Frage: Wie können Retrievalmaße dem spezifischen
 Verhalten der Suchmaschinen-Nutzer angepasst werden?
 Problembereiche


 • Such-Sessions
    – Nur Treffer auf der ersten Ergebnisseite (bzw. auf dem direkt sichtbaren Bildschirmbereich)
      werden angesehen.
    – In der Regel werden maximal fünf Dokumente angesehen.
    – Recherche wird oft abgebrochen, sobald ein passendes Dokument gefunden wurde.
     Wie können die Maße dem Bedürfnis nach nur einem/wenigen relevanten Treffern
      angepasst werden?

 • Zusammensetzung der Trefferlisten
     – Abbildung mehrerer Facetten eines Themas auf den vorderen Plätzen der Trefferlisten.
      Wie kann in der Evaluierung auf Facetten eingegangen werden?

 • Interaktion
     – Allgemeines IR-Evaluationsproblem: Recherche ist immer als interaktiver Prozess
       anzusehen.
      Wie können die Maße an den tatsächlichen Suchprozess angepasst werden?
28 |
Agenda




 Nutzerverhalten

 Wie gut sind die gängigen Suchmaschinen?

 Suche und Web 2.0

 Fazit




29 |
„Such-Ansätze“ des Web 2.0




 • Social Bookmarking
    – Nutzer speichern Lesezeichen online und machen diese öffentlich zugänglich.
    – Lesezeichen werden mit tags verschlagwortet.
    – Beispiele: Mr. Wong; del.icio.us

 • Frage-Antwort-Dienste
     – Nutzer stellen Fragen, Community antwortet.
     – Fragen und Antworten werden mit tags verschlagwortet.
     – Beispiele: Yahoo Clever, Lycos IQ




30 |
Suchmaschinen, Social Bookmarking, Frage-Antwort-Dienste



Suchmaschinen



F&A-Diente


Social Bookmarking




                                                    (Gammer et al. 2008)


     31 |
Fazit Web 2.0 Dienste für die Suche




 • Web 2.0 Dienste bieten bisher keine den Suchmaschinen vergleichbare
   Trefferqualität.

 • Bislang kaum Ausnutzung der klassischen IR-Verfahren in diesen
   Anwendungen.

 • Mashup der Ergebnisse aus allen Quellen könnte zu Qualitätssteigerung
   führen.




32 |
Agenda




 Nutzerverhalten

 Wie gut sind die gängigen Suchmaschinen?

 Suche und Web 2.0

 Fazit




33 |
Fazit




 • Suchmaschinen prägen das Nutzerverhalten auch für andere
   Informationssysteme.
     – „Google kann das doch auch!“

 • Qualität der Suchmaschinen ist nur durch eine Kombination verschiedener
   Faktoren messbar.
    – Empirische Untersuchungen zeigen deutliche Unterschiede.
    – Beliebtheit von Google lässt sich nicht allein durch die Qualität erklären.

 • Web 2.0 Dienste verbessern die Suche bislang nicht.
    – Potential ist aber durchaus vorhanden.




34 |
Vielen Dank für Ihre
Aufmerksamkeit.

www.bui.haw-hamburg.de/lewandowski.html

Alle in der Präsentation genannten
Artikel zum Download.


Bücher:
Handbuch Internet-Suchmaschinen
(erscheint im Oktober)

Web-2.0-Dienste als Ergänzung zu
algorithmischen Suchmaschinen


E-Mail:
dirk.lewandowski@haw-hamburg.de

Weitere ähnliche Inhalte

Was ist angesagt?

Evaluierungsläufe
EvaluierungsläufeEvaluierungsläufe
Evaluierungsläufe
Christiane Behnert
 
Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Wie gut sind Google und Co.?
Wie gut sind Google und Co.?
Dirk Lewandowski
 
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Dirk Lewandowski
 
Suchmaschinen verstehen
Suchmaschinen verstehenSuchmaschinen verstehen
Suchmaschinen verstehen
Dirk Lewandowski
 
Perspektiven eines Open Web Index
Perspektiven eines Open Web IndexPerspektiven eines Open Web Index
Perspektiven eines Open Web Index
Dirk Lewandowski
 
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenInternet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Dirk Lewandowski
 
Wie entwickeln sich Suchmaschinen heute, was kommt morgen?
Wie entwickeln sich Suchmaschinen heute, was kommt morgen?Wie entwickeln sich Suchmaschinen heute, was kommt morgen?
Wie entwickeln sich Suchmaschinen heute, was kommt morgen?
Dirk Lewandowski
 
Ausgewählte Forschungsfragen im Bereich Suche
Ausgewählte Forschungsfragen im Bereich SucheAusgewählte Forschungsfragen im Bereich Suche
Ausgewählte Forschungsfragen im Bereich Suche
Dirk Lewandowski
 

Was ist angesagt? (8)

Evaluierungsläufe
EvaluierungsläufeEvaluierungsläufe
Evaluierungsläufe
 
Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Wie gut sind Google und Co.?
Wie gut sind Google und Co.?
 
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (1)
 
Suchmaschinen verstehen
Suchmaschinen verstehenSuchmaschinen verstehen
Suchmaschinen verstehen
 
Perspektiven eines Open Web Index
Perspektiven eines Open Web IndexPerspektiven eines Open Web Index
Perspektiven eines Open Web Index
 
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und EntwicklungsperspektivenInternet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
Internet-Suchmaschinen: Aktueller Stand und Entwicklungsperspektiven
 
Wie entwickeln sich Suchmaschinen heute, was kommt morgen?
Wie entwickeln sich Suchmaschinen heute, was kommt morgen?Wie entwickeln sich Suchmaschinen heute, was kommt morgen?
Wie entwickeln sich Suchmaschinen heute, was kommt morgen?
 
Ausgewählte Forschungsfragen im Bereich Suche
Ausgewählte Forschungsfragen im Bereich SucheAusgewählte Forschungsfragen im Bereich Suche
Ausgewählte Forschungsfragen im Bereich Suche
 

Ähnlich wie Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends

Suchmaschinen, Bürde für Informationsspezialisten?
Suchmaschinen, Bürde für Informationsspezialisten?Suchmaschinen, Bürde für Informationsspezialisten?
Suchmaschinen, Bürde für Informationsspezialisten?
Dirk Lewandowski
 
Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Wie gut sind Google und Co.?
Wie gut sind Google und Co.?
Dirk Lewandowski
 
Ist meine Suchmaschine wirklich so gut, wie ich glaube?
Ist meine Suchmaschine wirklich so gut, wie ich glaube?Ist meine Suchmaschine wirklich so gut, wie ich glaube?
Ist meine Suchmaschine wirklich so gut, wie ich glaube?
Dirk Lewandowski
 
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Die Macht der Suchmaschinen und ihr Einfluss auf unsere EntscheidungenDie Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Dirk Lewandowski
 
Web-Suche? Gibt‘s nicht mehr!
Web-Suche? Gibt‘s nicht mehr!Web-Suche? Gibt‘s nicht mehr!
Web-Suche? Gibt‘s nicht mehr!
Dirk Lewandowski
 
Wissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen
Wissensarmut trotz (oder gar durch) Nutzung von SuchmaschinenWissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen
Wissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen
Dirk Lewandowski
 
Warum Suche (trotzdem) bedeutend ist
Warum Suche (trotzdem) bedeutend istWarum Suche (trotzdem) bedeutend ist
Warum Suche (trotzdem) bedeutend ist
Dirk Lewandowski
 
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...
Dirk Lewandowski
 
Wie Web 2.0 und Suche zusammenwachsen
Wie Web 2.0 und Suche zusammenwachsenWie Web 2.0 und Suche zusammenwachsen
Wie Web 2.0 und Suche zusammenwachsen
Dirk Lewandowski
 
Von wem wir abhängig sind: Über die Auffindbarkeit von Informationen
Von wem wir abhängig sind: Über die Auffindbarkeit von InformationenVon wem wir abhängig sind: Über die Auffindbarkeit von Informationen
Von wem wir abhängig sind: Über die Auffindbarkeit von Informationen
Dirk Lewandowski
 
Was Nutzer in Suchmaschinen wirklich sehen
Was Nutzer in Suchmaschinen wirklich sehenWas Nutzer in Suchmaschinen wirklich sehen
Was Nutzer in Suchmaschinen wirklich sehen
Dirk Lewandowski
 
Ethnographische Studien und Kontextinterviews bei eResult
Ethnographische Studien und Kontextinterviews bei eResultEthnographische Studien und Kontextinterviews bei eResult
Ethnographische Studien und Kontextinterviews bei eResult
eResult_GmbH
 
Das Nutzerverhalten in der Web-Suche
Das Nutzerverhalten in der Web-SucheDas Nutzerverhalten in der Web-Suche
Das Nutzerverhalten in der Web-Suche
Dirk Lewandowski
 
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Dirk Lewandowski
 
[Mobile Usability Testing] Zahlen, Daten, Fakten Mobil - World Usability Day ...
[Mobile Usability Testing] Zahlen, Daten, Fakten Mobil - World Usability Day ...[Mobile Usability Testing] Zahlen, Daten, Fakten Mobil - World Usability Day ...
[Mobile Usability Testing] Zahlen, Daten, Fakten Mobil - World Usability Day ...
UserZoom Deutschland
 
Webcast "Not provided – was nun?
Webcast "Not provided – was nun?Webcast "Not provided – was nun?
Webcast "Not provided – was nun?
Unic
 

Ähnlich wie Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends (20)

Suchmaschinen, Bürde für Informationsspezialisten?
Suchmaschinen, Bürde für Informationsspezialisten?Suchmaschinen, Bürde für Informationsspezialisten?
Suchmaschinen, Bürde für Informationsspezialisten?
 
Wie gut sind Google und Co.?
Wie gut sind Google und Co.?Wie gut sind Google und Co.?
Wie gut sind Google und Co.?
 
Ist meine Suchmaschine wirklich so gut, wie ich glaube?
Ist meine Suchmaschine wirklich so gut, wie ich glaube?Ist meine Suchmaschine wirklich so gut, wie ich glaube?
Ist meine Suchmaschine wirklich so gut, wie ich glaube?
 
Web-Index-Workshop 2014
Web-Index-Workshop 2014Web-Index-Workshop 2014
Web-Index-Workshop 2014
 
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Die Macht der Suchmaschinen und ihr Einfluss auf unsere EntscheidungenDie Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
Die Macht der Suchmaschinen und ihr Einfluss auf unsere Entscheidungen
 
Web-Suche? Gibt‘s nicht mehr!
Web-Suche? Gibt‘s nicht mehr!Web-Suche? Gibt‘s nicht mehr!
Web-Suche? Gibt‘s nicht mehr!
 
Alternativen zu Google
Alternativen zu GoogleAlternativen zu Google
Alternativen zu Google
 
Wissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen
Wissensarmut trotz (oder gar durch) Nutzung von SuchmaschinenWissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen
Wissensarmut trotz (oder gar durch) Nutzung von Suchmaschinen
 
Warum Suche (trotzdem) bedeutend ist
Warum Suche (trotzdem) bedeutend istWarum Suche (trotzdem) bedeutend ist
Warum Suche (trotzdem) bedeutend ist
 
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...
User Experience vs. Retrievaltests - Wie lässt sich die Relevanz von Sucherge...
 
Suchmaschinen-Update
Suchmaschinen-UpdateSuchmaschinen-Update
Suchmaschinen-Update
 
Wie Web 2.0 und Suche zusammenwachsen
Wie Web 2.0 und Suche zusammenwachsenWie Web 2.0 und Suche zusammenwachsen
Wie Web 2.0 und Suche zusammenwachsen
 
Von wem wir abhängig sind: Über die Auffindbarkeit von Informationen
Von wem wir abhängig sind: Über die Auffindbarkeit von InformationenVon wem wir abhängig sind: Über die Auffindbarkeit von Informationen
Von wem wir abhängig sind: Über die Auffindbarkeit von Informationen
 
Suchmaschinen vs. OPAC
Suchmaschinen vs. OPACSuchmaschinen vs. OPAC
Suchmaschinen vs. OPAC
 
Was Nutzer in Suchmaschinen wirklich sehen
Was Nutzer in Suchmaschinen wirklich sehenWas Nutzer in Suchmaschinen wirklich sehen
Was Nutzer in Suchmaschinen wirklich sehen
 
Ethnographische Studien und Kontextinterviews bei eResult
Ethnographische Studien und Kontextinterviews bei eResultEthnographische Studien und Kontextinterviews bei eResult
Ethnographische Studien und Kontextinterviews bei eResult
 
Das Nutzerverhalten in der Web-Suche
Das Nutzerverhalten in der Web-SucheDas Nutzerverhalten in der Web-Suche
Das Nutzerverhalten in der Web-Suche
 
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?
 
[Mobile Usability Testing] Zahlen, Daten, Fakten Mobil - World Usability Day ...
[Mobile Usability Testing] Zahlen, Daten, Fakten Mobil - World Usability Day ...[Mobile Usability Testing] Zahlen, Daten, Fakten Mobil - World Usability Day ...
[Mobile Usability Testing] Zahlen, Daten, Fakten Mobil - World Usability Day ...
 
Webcast "Not provided – was nun?
Webcast "Not provided – was nun?Webcast "Not provided – was nun?
Webcast "Not provided – was nun?
 

Mehr von Dirk Lewandowski

The Need for and fundamentals of an Open Web Index
The Need for and fundamentals of an Open Web IndexThe Need for and fundamentals of an Open Web Index
The Need for and fundamentals of an Open Web Index
Dirk Lewandowski
 
In a World of Biased Search Engines
In a World of Biased Search EnginesIn a World of Biased Search Engines
In a World of Biased Search Engines
Dirk Lewandowski
 
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
Dirk Lewandowski
 
Künstliche Intelligenz bei Suchmaschinen
Künstliche Intelligenz bei SuchmaschinenKünstliche Intelligenz bei Suchmaschinen
Künstliche Intelligenz bei Suchmaschinen
Dirk Lewandowski
 
Analysing search engine data on socially relevant topics
Analysing search engine data on socially relevant topicsAnalysing search engine data on socially relevant topics
Analysing search engine data on socially relevant topics
Dirk Lewandowski
 
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertGoogle Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Dirk Lewandowski
 
Suchverhalten und die Grenzen von Suchdiensten
Suchverhalten und die Grenzen von SuchdienstenSuchverhalten und die Grenzen von Suchdiensten
Suchverhalten und die Grenzen von Suchdiensten
Dirk Lewandowski
 
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?
Dirk Lewandowski
 
Are Ads on Google search engine results pages labeled clearly enough?
Are Ads on Google search engine results pages labeled clearly enough?Are Ads on Google search engine results pages labeled clearly enough?
Are Ads on Google search engine results pages labeled clearly enough?
Dirk Lewandowski
 
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...
Dirk Lewandowski
 
Verwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen
Verwendung von Skalenbewertungen in der Evaluierung von SuchmaschinenVerwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen
Verwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen
Dirk Lewandowski
 
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
Dirk Lewandowski
 
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
Dirk Lewandowski
 
Medientage 2013: Die Zukunft der Suche
Medientage 2013: Die Zukunft der SucheMedientage 2013: Die Zukunft der Suche
Medientage 2013: Die Zukunft der Suche
Dirk Lewandowski
 
Suchmaschinen: Googlerisierung der Gesellschaft
Suchmaschinen: Googlerisierung der GesellschaftSuchmaschinen: Googlerisierung der Gesellschaft
Suchmaschinen: Googlerisierung der Gesellschaft
Dirk Lewandowski
 
Wie beeinflussen Suchmaschinen den Informationsmarkt?
Wie beeinflussen Suchmaschinen den Informationsmarkt?Wie beeinflussen Suchmaschinen den Informationsmarkt?
Wie beeinflussen Suchmaschinen den Informationsmarkt?
Dirk Lewandowski
 
Alternatives to Google
Alternatives to GoogleAlternatives to Google
Alternatives to Google
Dirk Lewandowski
 
Warum wir Alternativen zu Google benötigen
Warum wir Alternativen zu Google benötigenWarum wir Alternativen zu Google benötigen
Warum wir Alternativen zu Google benötigen
Dirk Lewandowski
 
Why we need an independent index of the Web
Why we need an independent index of the WebWhy we need an independent index of the Web
Why we need an independent index of the Web
Dirk Lewandowski
 

Mehr von Dirk Lewandowski (20)

The Need for and fundamentals of an Open Web Index
The Need for and fundamentals of an Open Web IndexThe Need for and fundamentals of an Open Web Index
The Need for and fundamentals of an Open Web Index
 
In a World of Biased Search Engines
In a World of Biased Search EnginesIn a World of Biased Search Engines
In a World of Biased Search Engines
 
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...
 
Künstliche Intelligenz bei Suchmaschinen
Künstliche Intelligenz bei SuchmaschinenKünstliche Intelligenz bei Suchmaschinen
Künstliche Intelligenz bei Suchmaschinen
 
Analysing search engine data on socially relevant topics
Analysing search engine data on socially relevant topicsAnalysing search engine data on socially relevant topics
Analysing search engine data on socially relevant topics
 
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertGoogle Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändert
 
Suchverhalten und die Grenzen von Suchdiensten
Suchverhalten und die Grenzen von SuchdienstenSuchverhalten und die Grenzen von Suchdiensten
Suchverhalten und die Grenzen von Suchdiensten
 
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?
Können Nutzer echte Suchergebnisse von Werbung in Suchmaschinen unterscheiden?
 
Are Ads on Google search engine results pages labeled clearly enough?
Are Ads on Google search engine results pages labeled clearly enough?Are Ads on Google search engine results pages labeled clearly enough?
Are Ads on Google search engine results pages labeled clearly enough?
 
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...
 
Verwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen
Verwendung von Skalenbewertungen in der Evaluierung von SuchmaschinenVerwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen
Verwendung von Skalenbewertungen in der Evaluierung von Suchmaschinen
 
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (3)
 
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
Neue Entwicklungen bei Suchmaschinen und deren Relevanz für Bibliotheken (2)
 
Nutzer verstehen
Nutzer verstehenNutzer verstehen
Nutzer verstehen
 
Medientage 2013: Die Zukunft der Suche
Medientage 2013: Die Zukunft der SucheMedientage 2013: Die Zukunft der Suche
Medientage 2013: Die Zukunft der Suche
 
Suchmaschinen: Googlerisierung der Gesellschaft
Suchmaschinen: Googlerisierung der GesellschaftSuchmaschinen: Googlerisierung der Gesellschaft
Suchmaschinen: Googlerisierung der Gesellschaft
 
Wie beeinflussen Suchmaschinen den Informationsmarkt?
Wie beeinflussen Suchmaschinen den Informationsmarkt?Wie beeinflussen Suchmaschinen den Informationsmarkt?
Wie beeinflussen Suchmaschinen den Informationsmarkt?
 
Alternatives to Google
Alternatives to GoogleAlternatives to Google
Alternatives to Google
 
Warum wir Alternativen zu Google benötigen
Warum wir Alternativen zu Google benötigenWarum wir Alternativen zu Google benötigen
Warum wir Alternativen zu Google benötigen
 
Why we need an independent index of the Web
Why we need an independent index of the WebWhy we need an independent index of the Web
Why we need an independent index of the Web
 

Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends

  • 1. Web-Suchmaschinen: Suchverhalten, Informationsqualität, Trends Prof. Dr. Dirk Lewandowski dirk.lewandowski@haw-hamburg.de
  • 2. Agenda Nutzerverhalten Wie gut sind die gängigen Suchmaschinen? Suche und Web 2.0 Fazit 1 |
  • 3. Agenda Nutzerverhalten Wie gut sind die gängigen Suchmaschinen? Suche und Web 2.0 Fazit 2 |
  • 4. Bedeutung der Suchmaschinen • Suchmaschinen sind der Zugang zu Informationen im Netz. – Andere Zugänge (Kataloge, usw.) haben kaum noch Bedeutung. – Suchmaschinen bestimmen über die sichtbaren Inhalte des Web. – Suchmaschinen bestimmen das Nutzerverhalten (auch für andere Informationssysteme). 3 |
  • 5. Drei Anfragetypen Anfragetypen nach Broder (2002) • Informational (informationsorientiert) – Nutzer möchte sich zu einem Thema informieren. – Ziel sind mehrere Dokumente. • Navigational (navigationsorientiert) – Ziel ist es, eine bestimmte Seite (wieder) zu finden. – Typisch: Suche nach Homepage („Daimler Chrysler“). – Ziel ist i.d.R. ein Dokument. • Transactional (transaktionsorientiert) – Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden soll. – Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei. 4 |
  • 6. „Die meisten Nutzer sind nicht willens, bei der Formulierung ihres Suchziels allzu viel kognitive und zeitliche Energie aufzuwenden.“ (Machill et al. 2003) • Boolesche Operatoren – Bei weniger als 10% der Anfragen; keine Veränderung im Lauf der Jahre (Spink&Jansen 2004). – Nur etwa die Hälfte der Nutzer weiß, dass es Operatoren gibt (Machill et al. 2003). – 20% der Nutzer geben an, sie öfter zu verwenden (Machill et al. 2003). – Etwa die Hälfte der Anfragen mit Operatoren enthält Fehler (Spink et al. 2000), bei der Verwendung von Plus-/Minuszeichen lag die Fehlerquote bei 2/3. • Profisuche – 59% der Nutzer kennen die Profisuche (Machill et al. 2003). – Nur 14% nutzen sie öfter (Machill et al. 2003). 5 |
  • 7. Grunddaten zum Nutzerverhalten (2) • Auswertung der Treffer – 80% der Nutzer betrachten nur die erste Ergebnisseite (= 10 Treffer) (Spink&Jansen 2004). – Vor allem die Treffer auf den ersten Listenplätzen werden angesehen; möglichst kein Scrollen – Pro Session werden nur etwa fünf Dokumente gesichtet (Spink&Jansen 2004). – Sessions dauern weniger als 15 Minuten. • Kaum Veränderungen im Lauf der Zeit 6 |
  • 9.   Google klein
  • 10. 9 |
  • 11. Selektionsverhalten (Top11 Treffer) (Granka et al. 2004) 10 |
  • 12. Eye-tracking 11 | (Enquiro Eye Tracking Report II)
  • 13. Agenda Nutzerverhalten Wie gut sind die gängigen Suchmaschinen? Suche und Web 2.0 Fazit 12 |
  • 14. Die Qualität von Suchmaschinen kann nur durch eine Kombination unterschiedlicher Faktoren gemessen werden. Qualitätsfaktoren für Suchmaschinen • Qualität des Index – Größe des Datenbestands, Abdeckung des Web – Abdeckung bestimmter Bereiche (Sprachräume, Länder) – Überschneidungen der Indices – Aktualität des Datenbestands • Qualität der Suchresultate – Retrievaleffektivität – Zufriedenheit der Nutzer – Überschneidungen der (Top-)Ergebnisse • Qualität der Suchfunktionen • Nutzerfreundlichkeit + Benutzerführung (Lewandowski & Höchstötter 2007) 13 |
  • 15. Web-Abdeckung Keine Suchmaschine deckt das gesamte Web ab! – Aber: keine genauen Zahlen; aktuelle Untersuchungen fehlen. – Größe des Web ist unbekannt; die großen Suchmaschinen haben einige Milliarden Dokumente indexiert. – Wenig erforschter Bereich: Invisible Web. Definitionen Invisible/Deep Web – “Text pages, files, or other often high-quality authoritative information available via the World Wide Web that general-purpose search engines cannot, due to technical limitations, or will not, due to deliberate choice, add to their indices of Web pages" (Sherman u. Price 2001). – “The deep Web - those pages do not exist until they are created dynamically as the result of a specific search“ (Bergman 2001). 14 |
  • 17. Überschneidung der Datenbestände • Überschneidung der Indices – Relativ gering, daher lohnt sich die Suche in mehreren Suchmaschinen. • Überschneidung der Suchergebnisse – Sehr gering innerhalb der Top10, 20. 16 |
  • 19. Aktualität der Datenbestände • Wichtig wegen – Auffinden und Erfassen neuer Dokumente. – Aktualisierung veränderter Dokumente; korrekte Repräsentation der URLs. • Untersuchung 2005-2007 – Beobachtungszeitraum jeweils sechs Wochen. – 40 täglich aktualisierte Seiten (+ 30 unregelmäßig aktualisierte). 18 |
  • 20. Auch aktuelle Seiten werden nicht zuverlässig regelmäßig indexiert. 19 |
  • 22. Aktualität der Datenbestände 21 | Quelle: Lewandowski et al. 2006
  • 24. Retrievaleffektivität: Informationsorientierte Anfragen Klassische Tests • Welche Suchmaschine liefert die besten Treffer? • Test anhand von – einer bestimmten Anzahl von Suchanfragen (50). – einer bestimmten Anzahl von Treffern pro Suchmaschine (20). – Bewertungen durch Juroren (wichtige Frage: wer bewertet?). – Ja/Nein-Entscheidungen über Relevanz, verschiedenen Skalen. 23 |
  • 25. Precision ist das am häufigsten verwendete Retrievalmaß. Klassische Retrievalmaße • Precision – Anteil der relevanten ausgegebenen Treffer an der Gesamtheit der ausgegebenen Treffer. – Wird bei Suchmaschinen i.d.R. bis zu einem Cut-Off-Wert bestimmt (z.B. 20). • Recall – Anteil der relevanten ausgegebenen Treffer an der Gesamtheit aller überhaupt vorhandenen Treffer (= aller im Web vorhandener relevanter Dokumente). – Bei Suchmaschinen nicht messbar (Ausweg evtl. über Pooling-Methoden). • Fallout – Anteil der ausgegebenen nicht relevanten Treffer an der Gesamtzahl der nicht relevanten Treffer im Datenbestand. • Generality – Anteil der relevanten Dokumente im zugrunde liegenden Datenbestand. 24 |
  • 26. Precision@10 zwischen 0,43 und 0,60. 25 |
  • 27. Skalenbewertung zeigt die Gruppierung der Suchmaschinen noch deutlicher. 26 |
  • 28. Keine klare Reihung der Suchmaschinen, wenn einzelne Anfragen betrachtet werden. 27 |
  • 29. Offene Frage: Wie können Retrievalmaße dem spezifischen Verhalten der Suchmaschinen-Nutzer angepasst werden? Problembereiche • Such-Sessions – Nur Treffer auf der ersten Ergebnisseite (bzw. auf dem direkt sichtbaren Bildschirmbereich) werden angesehen. – In der Regel werden maximal fünf Dokumente angesehen. – Recherche wird oft abgebrochen, sobald ein passendes Dokument gefunden wurde.  Wie können die Maße dem Bedürfnis nach nur einem/wenigen relevanten Treffern angepasst werden? • Zusammensetzung der Trefferlisten – Abbildung mehrerer Facetten eines Themas auf den vorderen Plätzen der Trefferlisten.  Wie kann in der Evaluierung auf Facetten eingegangen werden? • Interaktion – Allgemeines IR-Evaluationsproblem: Recherche ist immer als interaktiver Prozess anzusehen.  Wie können die Maße an den tatsächlichen Suchprozess angepasst werden? 28 |
  • 30. Agenda Nutzerverhalten Wie gut sind die gängigen Suchmaschinen? Suche und Web 2.0 Fazit 29 |
  • 31. „Such-Ansätze“ des Web 2.0 • Social Bookmarking – Nutzer speichern Lesezeichen online und machen diese öffentlich zugänglich. – Lesezeichen werden mit tags verschlagwortet. – Beispiele: Mr. Wong; del.icio.us • Frage-Antwort-Dienste – Nutzer stellen Fragen, Community antwortet. – Fragen und Antworten werden mit tags verschlagwortet. – Beispiele: Yahoo Clever, Lycos IQ 30 |
  • 32. Suchmaschinen, Social Bookmarking, Frage-Antwort-Dienste Suchmaschinen F&A-Diente Social Bookmarking (Gammer et al. 2008) 31 |
  • 33. Fazit Web 2.0 Dienste für die Suche • Web 2.0 Dienste bieten bisher keine den Suchmaschinen vergleichbare Trefferqualität. • Bislang kaum Ausnutzung der klassischen IR-Verfahren in diesen Anwendungen. • Mashup der Ergebnisse aus allen Quellen könnte zu Qualitätssteigerung führen. 32 |
  • 34. Agenda Nutzerverhalten Wie gut sind die gängigen Suchmaschinen? Suche und Web 2.0 Fazit 33 |
  • 35. Fazit • Suchmaschinen prägen das Nutzerverhalten auch für andere Informationssysteme. – „Google kann das doch auch!“ • Qualität der Suchmaschinen ist nur durch eine Kombination verschiedener Faktoren messbar. – Empirische Untersuchungen zeigen deutliche Unterschiede. – Beliebtheit von Google lässt sich nicht allein durch die Qualität erklären. • Web 2.0 Dienste verbessern die Suche bislang nicht. – Potential ist aber durchaus vorhanden. 34 |
  • 36. Vielen Dank für Ihre Aufmerksamkeit. www.bui.haw-hamburg.de/lewandowski.html Alle in der Präsentation genannten Artikel zum Download. Bücher: Handbuch Internet-Suchmaschinen (erscheint im Oktober) Web-2.0-Dienste als Ergänzung zu algorithmischen Suchmaschinen E-Mail: dirk.lewandowski@haw-hamburg.de