Suchmaschinen ermöglichen es Nutzern, leicht an relevante Informationen zu gelangen. Doch wie entstehen eigentlich "relevante" Ergebnisse und welche Rolle spielt das Verhalten der Nutzer für die Bewertung der Dokumente durch die Suchmaschinen? Ausgehend von den Charakteristika des Nutzerverhaltens betrachtet der Vortrag vor allem den Interpretationsspielraum bei der Generierung von Suchergebnissen. Ausgangspunkt ist dabei die These, dass es zu den meisten Suchanfragen weit mehr relevante Dokumente gibt als ein Nutzer bereit ist anzusehen. Daraus ergibt sich eine Unterscheidung nicht mehr zwischen relevanten und nicht relevanten Dokumenten, sondern eine (algorithmische) Entscheidung zwischen unterschiedlichen relevanten Dokumenten. Daraus ergeben sich Implikationen für die Informationssuche, für das Design von Suchmaschinen und für den Zugang zu Informationen.
Zurzeit werden verschiedene Wege diskutiert, um das „Problem Google“ zu lösen. Vordergründig geht es dabei darum, Maßnahmen zu ergreifen, um Googles Monopol auf dem Suchmaschinenmarkt einzudämmen. Weitergehend geht es allerdings darum, wer zu welchen Bedingungen Zugriff auf die im Web verstreut vorliegenden Daten bekommt.
Die bisherigen Vorschläge reichen dabei von einem schlichten Hoffen auf den Markt bis hin zur Forderung nach dem Aufbau einer öffentlich-rechtlichen Suchmaschine. Allerdings würde als Ergebnis stets nur ein weiterer Marktteilnehmer (oder bestenfalls ein paar wenige) entsteht. An diesem Punkt setzt die Idee des “Open Web Index” an: Der Index wird als eine Infrastrukturmaßnahme angesehen, die von allen zu fairen Bedingungen genutzt werden kann. Auf der Basis des Index kann dann eine Vielzahl von Diensten aufgebaut werden, darunter natürlich Suchmaschinen, aber auch jede andere Form von Dienst, der Web-Daten in großem Umfang benötigt.
Der Vortrag setzt sich mit den wirtschaftlichen und technischen Fragen eines solchen offenen Web-Index auseinander und berichtet von den Fortschritten der Initiative Open Web Index.
Suchmaschinen sind der meistgenutzte Dienst des Internet; täglich werden viele Milliarden Suchanfragen an Google und Co. gestellt. Doch dieser immensen Nutzung steht ein nur mangelhaftes Wissen über die Suchmaschinen gegenüber. Dabei geht es auf der einen Seite natürlich um ein Verständnis der zugrunde liegenden Technik; Suchmaschinen sind aber weit mehr: Hinter ihnen stehen Unternehmen, die mit der Suche im Web Geld verdienen wollen, Suchmaschinen spielen eine wichtige Rolle für den Informationserwerb in der Gesellschaft, und schließlich spielen Suchmaschinen als Plattform für das Online-Marketing eine bedeutende Rolle bei der Vermittlung zwischen Suchenden und Unternehmen.
Im Vortrag werden die zentralen Akteure auf dem Suchmaschinenmarkt vorgestellt und ausgeführt, warum ein Verständnis von Suchmaschinen aus nur einer Perspektive (sei diese technisch, wirtschaftlich oder gesellschaftlich) nicht ausreicht, sondern wir Suchmaschinen tatsächlich nur verstehen können, wenn wir sie ganzheitlich betrachten.
Wie entwickeln sich Suchmaschinen heute, was kommt morgen?Dirk Lewandowski
Vortrag bei der Online Marketing Konferenz (OMK 2015). Ein Blick in die technische Zukunft der Web-Suchmaschinen und deren gesellschaftliche Auswirkungen.
Zurzeit werden verschiedene Wege diskutiert, um das „Problem Google“ zu lösen. Vordergründig geht es dabei darum, Maßnahmen zu ergreifen, um Googles Monopol auf dem Suchmaschinenmarkt einzudämmen. Weitergehend geht es allerdings darum, wer zu welchen Bedingungen Zugriff auf die im Web verstreut vorliegenden Daten bekommt.
Die bisherigen Vorschläge reichen dabei von einem schlichten Hoffen auf den Markt bis hin zur Forderung nach dem Aufbau einer öffentlich-rechtlichen Suchmaschine. Allerdings würde als Ergebnis stets nur ein weiterer Marktteilnehmer (oder bestenfalls ein paar wenige) entsteht. An diesem Punkt setzt die Idee des “Open Web Index” an: Der Index wird als eine Infrastrukturmaßnahme angesehen, die von allen zu fairen Bedingungen genutzt werden kann. Auf der Basis des Index kann dann eine Vielzahl von Diensten aufgebaut werden, darunter natürlich Suchmaschinen, aber auch jede andere Form von Dienst, der Web-Daten in großem Umfang benötigt.
Der Vortrag setzt sich mit den wirtschaftlichen und technischen Fragen eines solchen offenen Web-Index auseinander und berichtet von den Fortschritten der Initiative Open Web Index.
Suchmaschinen sind der meistgenutzte Dienst des Internet; täglich werden viele Milliarden Suchanfragen an Google und Co. gestellt. Doch dieser immensen Nutzung steht ein nur mangelhaftes Wissen über die Suchmaschinen gegenüber. Dabei geht es auf der einen Seite natürlich um ein Verständnis der zugrunde liegenden Technik; Suchmaschinen sind aber weit mehr: Hinter ihnen stehen Unternehmen, die mit der Suche im Web Geld verdienen wollen, Suchmaschinen spielen eine wichtige Rolle für den Informationserwerb in der Gesellschaft, und schließlich spielen Suchmaschinen als Plattform für das Online-Marketing eine bedeutende Rolle bei der Vermittlung zwischen Suchenden und Unternehmen.
Im Vortrag werden die zentralen Akteure auf dem Suchmaschinenmarkt vorgestellt und ausgeführt, warum ein Verständnis von Suchmaschinen aus nur einer Perspektive (sei diese technisch, wirtschaftlich oder gesellschaftlich) nicht ausreicht, sondern wir Suchmaschinen tatsächlich nur verstehen können, wenn wir sie ganzheitlich betrachten.
Wie entwickeln sich Suchmaschinen heute, was kommt morgen?Dirk Lewandowski
Vortrag bei der Online Marketing Konferenz (OMK 2015). Ein Blick in die technische Zukunft der Web-Suchmaschinen und deren gesellschaftliche Auswirkungen.
Digitale Methoden in den Sozial- und Geisteswissenschaften: Chancen und Herau...Cornelius Puschmann
Held on December 17th, 2012, as part of the Göttingen Center for Digital Humanities' lecture series on Internet and society. My thanks to Heidi Hanekop for the kind invitation.
http://www.gcdh.de/en/events/calendar-view/dr.-cornelius-puschmann-digitale-methoden-in-den-sozial-und-geisteswissenschaften-chancen-und-herausforderungen
Lambert Heller: Digitale Selbstvermarktung als WissenschaftlerInstudiumdigitale
Vortrag von Lambert Heller (Technische Informationsbibliothek Hannover) im Rahmen der MultimediaWerkstatt von studiumdigitale, 14.02.2017, Goethe-Universität Frankfurt
Das macht bei uns die Hilfskraft. Über Potenziale des Web 2.0 für die Sozialw...Tina Guenther
Der Titel meines Vortrags ist bildlich gemeint. Damit möchte ich die weisungsbezogene Gestaltung institutioneller Internetseiten im Gegensatz zur eigenverantwortlichen internetöffentlichen Gestaltung außerhalb des Institutsumfelds wie in der Praxis des Bloggens thematisieren, und als Erklärungsansatz habe ich die Theorie der organisationalen Felder gewählt.Korrigierte Version der Präsentation mit Überarbeitung v.a. auf Folie 27.
Search Engine Bias - sollen wir Googles Suchergebnissen vertrauen?Dirk Lewandowski
Suchmaschinen sind das wichtigste Tor zu den Inhalten des Web – das Web wäre ohne Suchmaschinen gar nicht benutzbar. Doch was wird uns eigentlich auf den Suchergebnisseiten von Google angezeigt? Handelt es sich einfach um neutrale Informationen, die vollautomatisch zusammengestellt werden?
Der Vortrag zeigt, wie die unterschiedlichen Interessen von Suchmaschinenbetreibern, den Inhalteanbietern, den Suchmaschinenoptimierern und uns Nutzern erst im Zusammenspiel die Ergebnisse von Google und Co. generieren. Dabei geht es um die Frage, was diese Einflüsse für uns alles bedeuten, die wir Suchmaschinen zur Informationsrecherche benutzen.
Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotent...Hendrik Kalb
Zwischenpräsentation der Diplomarbeit von Christopher Schulz zum Thema Kontextbasiertes Information Retrieval: Eine Systematik der Anwendungspotentiale von Semantik zur Erhöhung der Ergebnisqualität
Nicht gehaltener Lightning Talk auf dem 2. Deutschen VuFind-Anwendertreffen in der TUB Hamburg-Harburg. Den Folien fehlt zum Verständnis evtl. Kontext und der fehlende "Talk".
KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) ÜberblickGeorg Rehm
Georg Rehm. KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) Überblick. Interdisziplinärer Forschungsverbund Digital Humanities in Berlin (ifDHb), 23. Berliner DH-Rundgang im Deutschen Forschungszentrum für Künstliche Intelligenz, Berlin, Germany, February 05, 2018.
Die Zielgruppe für Basisbildung über das Internet erreichenwrauter
Die Zielgruppe für Basisbildung über das Internet erreichen
Der Beitrag greift das Thema Gestaltung von Informationen zu Basisbildungsangeboten im Internet auf. Nach einer Definition von Usability, der Definition der Zielgruppe sowie der Schilderung von Gründen, die für ein verstärktes Onlineangebot sprechen, werden als Ergebnis Handlungs- und Gestaltungsempfehlungen für Anbieter von Basisbildungsangeboten präsentiert.
Zwei wichtige Aspekte sprechen grundsätzlich für eine bedürfnisorientierte Verstärkung von Online-Informationen zu Basisbildungsangeboten:
Österreich gilt als Land mit hoher Internetnutzung. 83,9% der ÖsterreicherInnen waren in den letzten drei Monaten online (vgl. Statistik Austria 2015).
Die Anonymität des Webs gibt „people the courage to go places and do things that they otherwise wouldn’t.“ (Suler 2004, S. 323). Online-Informationen zu Basisbildungsangeboten könnten daher verstärkt Personen ansprechen, die ansonsten aus Scham von Bildungsberatungen Abstand nehmen.
The Need for and fundamentals of an Open Web IndexDirk Lewandowski
The document proposes the creation of an Open Web Index (OWI) to address the lack of a comprehensive, public index of web content. It argues that current initiatives like Common Crawl are insufficient as they are not kept fully up-to-date, lack search functionality, and do not address spam removal. The OWI would separate the crawling and indexing of web content from proprietary search services built on top of the index. Building such a major public project requires political and financial support as well as technical expertise. The goal is an independent index that serves as a public library of web content.
Search engines like Google have a massive influence on what information users get to see, and on what search results users select. This leads to search engines having a significant impact on what information we as a society acquire.
It has been often lamented that search engines are biased. I, however, argue that we have only scratched the surface because search engine bias is a multifaceted concept and the discussion usually solely focuses on some aspects.
Search engine bias can be classified into four different areas. Firstly, there are biases on the side of the search engine, e.g., in their ranking functions. Secondly, there are biases through external influencing of search engine results, predominantly through “search engine optimization”.
Thirdly, biases occur on the side of the user (e.g., position bias, confirmation bias, visual attraction bias). And fourthly, there are self-interests of search engine providers which influence the search results.
Further to giving an overview of the topic, I will show how search engine providers (and regulators) can take steps towards making search fair. Whereas a bias-free search engine is impossible, a fair search is. Here, I will not only focus on the big web search engines but also on how developers and product owners can make their search systems fair. Or, to put it another way, I will show what can we learn from these “worst practices” in web search when designing our own systems.
EIN ANDERER BLICK AUF GOOGLE: Wie interpretieren Nutzer/innen die Suchergebni...Dirk Lewandowski
Die Suche im Internet ist eine einfache Sache: Suchanfrage eingeben, Ergebnis auswählen, lesen, fertig! Doch wie wählen wir eigentlich Ergebnisse aus? Und welche Ergebnisse werden uns überhaupt zur Auswahl angeboten?
In diesem Vortrag werde ich zeigen, wie Nutzer durch bestimmte Formen von Ergebnissen und deren Darstellung beeinflusst werden. Dabei geht es um die Kennzeichnung von Anzeigen, um Googles Eigeninteressen bei der Anzeige seiner eigenen Inhalte (bspw. YouTube) und um die Beeinflussung der Suchergebnisse durch Externe.
Also: Nach diesem Vortrag kann man nicht nur selbst besser suchen, sondern auch besser einschätzen, welchen Einfluss Google darauf hat, welche Informationen wir alle aus dem Web erhalten.
Selbstfahrende Autos, Roboter, Flugtaxis – wenn von künstlicher Intelligenz (KI) die Rede ist, werden oft plastische bis drastische Beispiele gebraucht. Meist werden grundlegende Fragen der künstlichen Intelligenz anhand von Zukunftsszenarien diskutiert. Es lohnt sich jedoch ein Blick auf einen der Bereiche, in denen Verfahren der KI bereits heute deutlich ausgeprägt sind, nämlich die Suchmaschinen im Web.
Suchmaschinen haben sich zu „Next-Generation Search Systems“ (White, 2016) entwickelt. Die von den Suchmaschinen bekannte Technologie wurde erweitert und angepasst, um intelligente Dienste wie Siri, Cortana und Alexa möglich zu machen. Diese zeichnen sich zum einen dadurch aus, dass sie unterschiedliche Eingabeformate (wie Text oder Sprache) verstehen, zum anderen dadurch, dass sie nicht mehr nur Listen von potentiell relevanten Dokumenten, sondern echte Antworten geben.
Der Vortrag zeigt, wie sich Suchmaschinen auf der Basis von Technologien der künstlichen Intelligenz entwickelt haben und was diese Entwicklung für die Informationsrecherche bedeutet. Dass Suchmaschinen einen erheblichen Einfluss darauf haben, welche Informationen gesehen werden, steht außer Zweifel. Sie sind der von den Nutzern bei weitem bevorzugte Weg, um an Informationen (aus dem Web) zu gelangen (Koch & Frees, 2016) und genießen ein hohes Vertrauen (Purcell, Brenner, & Raine, 2012; Stark, Magin, & Jürgens, 2014). Doch ist dieses Vertrauen gerechtfertigt?
Analysing search engine data on socially relevant topicsDirk Lewandowski
This document summarizes a presentation on analyzing search engine data for socially relevant topics. It discusses collecting search results data at scale by automatically querying search engines and scraping results pages. A case study on insurance comparisons is presented where over 20,000 search results were analyzed for 121 queries. The results showed that a small number of domains and providers dominated the top search positions. Limitations and future work are also outlined.
Google Assistant, Alexa & Co.: Wie sich die Welt der Suche verändertDirk Lewandowski
Suchmaschinen haben sich grundlegend geändert: Sie erlauben Eingaben über Text, Sprache und Bilder und geben anstelle der altbekannten Suchergebnislisten zunehmend auch direkte Antworten auf Fragen aus. Um dies zu ermöglichen, analysieren sie neben den Suchanfragen auch persönliche Informationen der Nutzer und ihrer sozialen Netzwerke sowie Massendaten aus vergangenen Suchvorgängen und anderen Interaktionen. Dies verändert die Weise, wie wir suchen und was wir finden.
Doch wie gehen Nutzer mit diesen „Next Generation Search Systems“ in Form von Suchmaschinen, sprachbasierten persönlichen Assistenten und anderen Assistenzsystemen im Alltag um? Und was bedeutet dies auf der einen Seite für das Online-Marketing, auf der anderen Seite für den nach Informationen suchenden Nutzer?
Are Ads on Google search engine results pages labeled clearly enough?Dirk Lewandowski
In an online experiment using a representative sample of the German online population (n=1,000), we compare users’ selection behavior on two versions of the same Google search engine results page (SERP), one showing advertisements and organic results, the other showing organic results only. Selection behavior is analyzed in relation to users’ knowledge on Google’s business model, on SERP design, and on these users’ actual performance in marking advertisements on SERPs correctly. We find that users who were not able to mark ads correctly selected ads significantly more often. This leads to the conclusion that ads need to be labeled more clearly, and that there is a need for more information literacy in search engine users.
Ordinary Search Engine Users Assessing Difficulty, Effort and Outcome for Sim...Dirk Lewandowski
This document discusses a study that examined how ordinary search engine users assess the difficulty, effort, and outcomes of simple and complex search tasks.
The study involved 60 participants who were given 12 search tasks (6 simple, 6 complex) and asked to complete pre- and post-task questionnaires rating the difficulty, time effort, query effort, and likelihood of finding the right information. Results showed that users were generally able to correctly judge simple tasks (~90% accuracy) but accuracy dropped to ~2/3 for complex tasks. Statistical analysis found users were significantly better at judging the complexity of simple vs. complex tasks. The study aimed to provide insights into how well users can estimate efforts and outcomes for different types of search tasks.
The document discusses alternatives to Google for web searching. It notes that Google dominates the market, influencing how users perceive and interact with search results. Few true alternatives exist due to economic barriers to creating comprehensive indexes. The author proposes an independent, openly accessible web index to promote diversity and innovation in search applications beyond what any single company can offer. This could motivate new types of search tools and encourage alternatives to the current market dominance.
Dirk Lewandowski argues that an independent index of the web is needed to ensure competition in the search market and representation of different viewpoints. Currently, most search engines rely on Google's index, and it is too costly for alternatives to build their own. Lewandowski proposes creating an index that can be accessed fairly by all to enable new search applications to be developed and motivate more competition. Funding would need to come from a pan-European initiative and the index would be operated by an independent research institution. This could spur innovation and provide alternatives to current search engine models.
Wie Suchmaschinen die Inhalte des Web interpretieren
1. Wie Suchmaschinen die Inhalte des Web interpretieren
Prof. Dr. Dirk Lewandowski
dirk.lewandowski@haw-hamburg.de
http://www.bui.haw-hamburg.de/lewandowski.html
@Dirk_Lew
Humboldt-Universität zu Berlin, Institut für Bibliotheks- und
Informationswissenschaft,
Berliner Bibliothekswissenschaftliches Kolloquium
7. Juni 2016
2.
3. Einordnung des Themas
• Suchmaschinen sind der beliebteste Dienst des Internet (Frees & Koch
2015)
• Google allein verarbeitet mehr als 2.000.000.000.000 Suchanfragen pro
Jahr (Sullivan 2016)
• Suchmaschinen sind der zentrale Weg, um an Informationen im Web zu
gelangen (vgl. Lewandowski 2015, Kapitel 2)
• Suchmaschinen als Gatekeeper (Introna & Nissenbaum 2000; Machill &
Beiler 2008)
4. Gliederung
1. Das Verhalten der Suchmaschinennutzer
2. Das Ranking der Suchergebnisse
3. Die Interpretationsleistung der Suchmaschinen
4. Fazit und Implikationen
6. Das Verhalten der Suchmaschinennutzer
• Charakteristika des Nutzerverhaltens (Lewandowski 2015, Kapitel 4):
– Kurze Suchanfragen
– Kaum Verwendung von Operatoren und Befehlen
– Individuell unterschiedliche Formulierung der Suchanfragen (Stark,
Magin & Jürgens 2014)
– Power-Law-Verteilung der Suchanfragehäufigkeiten
– Nutzer geben sich schnell zufrieden
7. Einflüsse auf die Ergebnisselektion
• Relevanz der Trefferbeschreibung
• Trefferreihung
• Bereich “über dem Knick”
• Größe der Trefferbeschreibung
• Grafische Elemente
• Erweiterte Trefferbeschreibungen
Nutzerverhalten führt zu einem
erhöhten Bedarf an Interpretation...
8. Vertrauen in Suchmaschinen
• … und Nutzer verlassen sich auf diese Interpretation:
– Durch Suchmaschinen gefundene Informationen werden als akkurat
und vertrauenswürdig angesehen (Purcell, Brenner & Raine 2012)
– Suchmaschinen-Ranking wird von Nutzern als Kriterium für
Vertrauenswürdigkeit betrachtet (Westerwick 2013)
– Relevanzbeurteilung der Suchmaschinen wird nicht reflektiert (Tremel
2010)
– Nutzer vertrauen Googles Ranking stärker als ihrer eigenen Bewertung
(Pan et al. 2007)
9. Anfragetypen in der Websuche
(Broder 2002)
• Informational (informationsorientiert)
– Nutzer möchte sich zu einem Thema informieren.
– Ziel sind mehrere Dokumente.
• Navigational (navigationsorientiert)
– Ziel ist es, eine bestimmte Seite (wieder) zu finden.
– Typisch: Suche nach Website („Facebook“).
– Ziel ist i.d.R. ein Dokument.
• Transactional (transaktionsorientiert)
– Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden soll.
– Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei.
10. Zufriedenheit mit den Suchergebnissen
(Lewandowski 2014b)
Navigations-
orientiert
Informationsorientiert Transaktionsorientiert
Eindeutig
bewertbar
Suche nach
einem bereits
bekannten
Dokument
1. Suche nach einem Faktum
2. Suche nach Trivia
3. Informationsorientierte
Suche, zu der
Informationen aus einer
bestimmten Quelle erwartet
werden (bspw. Wikipedia)
Suche nach einer
bekannten Website, auf der
eine Transaktion
durchgeführt werden soll
Nicht
eindeutig
bewertbar
– Klassische Informationssuche
mit dem Anspruch, ein
vollständiges Bild zu gewinnen
bzw. einen umfassenden
Überblick
Mehrere Varianten einer
Transaktion möglich
12. Rankingfaktoren der Suchmaschinen
(Lewandowski 2015, Kapitel 5)
• Textstatistik
– Abgleich des Texts der Suchanfrage mit dem Text der Dokumente
• Popularität
– Linkpopularität (linktopologisches Modell, bspw. PageRank)
– Klickpopularität (Nutzungsmodell)
• Aktualität
– Datumsangaben, Linkstruktur, ...
• Lokalität (=Nutzermodell/Standort)
– „Nähe“ zwischen Nutzer und Dokument
• Personalisierung
– Anpassung der Ergebnisse an den individuellen Nutzer
• Technische Rankingfaktoren
– Technische Eigenschaften von Websites bzw. Webservern
14. Wer entscheidet über das Ranking?
Akteursverbünde und ihre Interessen (Röhle 2010, S. 81f.):
• Google: Informationen sammeln und bereitstellen
• Inhalteanbieter: langfristig: Reputation stärken; kurzfristig: Geld verdienen
• Suchmaschinenoptimierer: Bündelung von Aufmerksamkeit auf individuelle Inhalte
• Nutzer: Interesse an einer möglichst kostengünstigen und schnellen Selektions- und
Sortiermöglichkeit von Informationen
Alle Akteure haben Einfluss auf das Ranking.
19. Wie viele relevante Dokumente gibt es eigentlich zu einer
Suchanfrage?
• Es gibt für informationsorientierte Suchanfragen meist mehr relevante
Dokumente, als auf den vorderen Positionen angezeigt werden können.
• Nutzer sehen in der Regel eine geringere Zahl relevanter Dokumente an,
als insgesamt von einer Suchmaschine ausgegeben werden.
• Auch auf niedrigen Positionen finden sich noch relevante Ergebnisse
(Podgajnik 2013; Schaer, Mayr, Sünkler & Lewandowski 2016).
• Nutzer bewerten die Relevanz der Dokumente unterschiedlich.
20. Was bekommen Nutzer tatsächlich zu sehen? Woraus wählen sie aus?
• Auf Top-Positionen tauchen besonders häufig Dokumente aus einigen
besonders populären Quellen auf (Höchstötter & Lewandowski 2009).
• Etwa 80 Prozent aller Klicks auf den Trefferseiten entfallen auf nur 10.000
Websites (Goel, Broder, Gabrilovich & Pang 2010).
21. Ausweg Personalisierung?
• Das Versprechen der Personalisierung: Bessere Suchergebnisse (Re-
Ranking) durch die Auswertung des individuellen Nutzerverhaltens.
• Effekt und/oder Nutzen der Personalisierung wurde bislang nicht
nachgewiesen.
• Probleme der Personalisierung
– Benötigt Daten des individuellen Nutzers
– Führt zu noch stärkerer Intransparenz der Rankings
23. Fazit (1/4): Zusammenfassung
• Suchmaschinen interpretieren die Inhalte des Web.
• Die starke (und implizite) Interpretation ist auch eine Reaktion auf das
Nutzerverhalten.
• Die Qualitätsbewertung orientiert sich vor allem an der Popularität der
Dokumente und versucht darüber, Vertrauenswürdigkeit und
Glaubwürdigkeit zu messen.
• Jeder algorithmischen Interpretation der Dokumente sind Annahmen
inhärent, die zu Verzerrungen bzw. „Fehlinterpretationen“ führen.
24. Fazit (2/4): Forschungsbedarf
• Effekte der Interpretation durch Suchmaschinen, abseits von Fallstudien
• Einfluss der algorithmischen Interpretation auf die Meinungsbildung
• Untersuchungen zum Einfluss von Suchmaschinenoptimierung auf die
Suchergebnisse
• Auswirkungen der Personalisierung
25. Fazit (3/4): Gesellschaftliche Implikationen
• Erheblicher Einfluss von Suchmaschinen, speziell Google, auf den
Wissenserwerb in der Gesellschaft – eine dominierende Interpretation.
• Wie kann Vielfalt erreicht werden?
– Selbstregulierung des Marktes (Monopolkommission 2015)
– Schaffung einer alternativen Suchmaschine (Hege & Flecken 2014)
– Aufbau eines Offenen Web-Index (Lewandowski 2014a)
26. Fazit (4/4): Übertragbarkeit
• Verfahren, die bei Suchmaschinen verwendet werden, aber
weiterreichend von Bedeutung sind:
– Ranking
– Personalisierung
– Predictive Analytics
– Empfehlungssysteme
• Vergleichbare algorithmische Interpretationen bei
– Empfehlungssystemen (Bsp. Spotify, Netflix, Amazon)
– Social Media (Bsp. Zusammenstellung der Facebook-Timeline)
– Online Dating
– Zusammenstellung von Nachrichtenseiten (Bsp. Google News)
27. Vielen Dank für Ihre Aufmerksamkeit
Prof. Dr. Dirk Lewandowski
Hochschule für Angewandte Wissenschaften Hamburg,
Department Information
dirk.lewandowski@haw-hamburg.de
Website:
www.searchstudies.org
28. Literatur
• Ballatore, A. (2015). Google chemtrails: A methodology to analyze topic representation in search engine results. First Monday, 20(7).
• Bar-Ilan, J. (2006). Web links and search engine ranking: The case of Google and the query “Jew.” Journal of the American Society for
Information & Techology, 57(12), 1581–1589.
• Frees, B., & Koch, W. (2015). Internetnutzung : Frequenz und Vielfalt nehmen in allen Altersgruppen zu. Media Perspektiven, (10), 366–377.
• Goel, S., Broder, A., Gabrilovich, E., & Pang, B. (2010). Anatomy of the long tail: Ordinary people with extraordinary tastes. In Proceedings of the
third ACM international conference on Web search and data mining (pp. 201–210). ACM.
• Hege, H., & Flecken, E. (2014). Debattenbeitrag: Gibt es ein öffentliches Interesse an einer alternativen Suchmaschine? In B. Stark, D. Dörr, & S.
Aufenanger (Eds.), Die Googleisierung der Informationssuche (pp. 224–244). Berlin: De Gruyter.
• Höchstötter, N., & Lewandowski, D. (2009). What users see – Structures in search engine results pages. Information Sciences, 179(12), 1796–
1812. doi:10.1016/j.ins.2009.01.028
• Introna, L. D., & Nissenbaum, H. (2000). Shaping the Web: Why the Politics of Search Engines Matters. The Information Society, 16(3), 169–185.
• Lewandowski, D. (2012). Credibility in Web Search Engines. In M. Folk & S. Apostel (Eds.), Online Credibility and Digital Ethos: Evaluating
Computer-Mediated Communication (pp. 131–146). Hershey, PA: IGI Global.
• Lewandowski, D. (2014a). Why we need an independent index of the Web. In R. König & M. Rasch (Eds.), Society of the Query Reader:
Reflections on Web Search (pp. 49–58). Information Retrieval; Digital Libraries, Amsterdam: Institute of Network Culture.
• Lewandowski, D. (2014b). Wie lässt sich die Zufriedenheit der Suchmaschinennutzer mit ihren Suchergebnissen erklären? In H. Krah & R. Müller-
Terpitz (Eds.), Suchmaschinen (Passauer Schriften zur interdisziplinären Medienforschung, Band 4) (pp. 35–52). Münster: LIT.
• Lewandowski, D., Drechsler, J., & Mach, S. Von. (2012). Deriving Query Intents From Web Search Engine Queries. Journal of the American
Society for Information Science and Technology, 63(9), 1773–1788.
29. Literatur
• Engine Queries. Journal of the American Society for Information Science and Technology, 63(9), 1773–1788.
• Lewandowski, D., & Sünkler, S. (2013). Representative online study to evaluate the revised commitments proposed by Google on 21 October 2013
as part of EU competition investigation AT.39740-Google Report for Germany.
• Machill, M., & Beiler, M. (2008). Suchmaschinen als Vertrauensgüter. Internet-Gatekeeper für die Informationsgesellschaft ? In D. Klumpp, H.
Kubicek, A. Roßnagel, & W. Schulz (Eds.), Informationelles Vertrauen für die Informationsgesellschaft (pp. 159–172). Heidelberg: Springer.
• Machill, M., Neuberger, C., Schweiger, W., & Wirth, W. (2003). Wegweiser im Netz: Qualität und Nutzung von Suchmaschinen. In M. Machill & C.
Welp (Eds.), Wegweiser im Netz (pp. 13–490). Gütersloh: Bertelsmann Stiftung.
• Monopolkommission. (2015). Wettbewerbspolitik: Herausforderung digitale Märkte. Sondergutachten der Monopolkommission gemäß § 44 Abs. 1
Satz 4 GWB.
• Noble, S. U. (2013). Google Search: Hyper-visibility as a Means of Rendering Black Women and Girls Invisible. InVisible Culture: An Electronic
Journal for Visual Culture. Retrieved November 13, 2015, from http://ivc.lib.rochester.edu/google-search-hyper-visibility-as-a-means-of-rendering-
black-women-and-girls-invisible/
• Pan, B., Hembrooke, H., Joachims, T., Lorigo, L., Gay, G., & Granka, L. (2007). In Google we trust: users’ decisions on rank, position, and
relevance. Journal of Computer-Mediated Communication, 12(3), 801–823.
• Piper, P. S. (2000). Better Read That Again: Web Hoaxes and Misinformation. Searcher. Searcher, 8(8), 40.
• Purcell, K., Brenner, J., & Raine, L. (2012). Search Engine Use 2012. Search. Washington, DC.
• Röhle, T. (2010). Der Google-Komplex: Über Macht im Zeitalter des Internets. Bielefeld: Transcript.
• Stark, B., Magin, M., & Jürgens, P. (2014). Navigieren im Netz – Befunde einer qualitativen und quantitativen Nutzerbefragung. In B. Stark, D. Dörr,
& S. Aufenanger (Eds.), Die Googleisierung der Informationssuche - Suchmaschinen im Spannungsfeld zwischen Nutzung und Regulierung (pp.
20–74). Berlin: De Gruyter.
30. Literatur
• Sullivan, D. (2016). Google now handles at least 2 trillion searches per year. Search Engine Land. Retrieved from http://searchengineland.com/
google-now-handles-2-999-trillion-searches-per-year-250247
• Tavani, H. (2012, August 27). Search Engines and Ethics. Retrieved August 12, 2015, from http://plato.stanford.edu/entries/ethics-search/
• Tremel, A. (2010). Suchen, finden–glauben?: Die Rolle der Glaubwürdigkeit von Suchergebnissen bei der Nutzung von Suchmaschinen. Ludwig-
Maximilians-Universität München.
• Westerwick, A. (2013). Effects of Sponsorship, Web Site Design, and Google Ranking on the Credibility of Online Information. Journal of
Computer-Mediated Communication, 18(2), 80–97. doi:10.1111/jcc4.12006
• White, R. W., & Horvitz, E. (2009). Cyberchondria. ACM Transactions on Information Systems, 27(4), Article No. 23. doi:10.1145/1629096.1629101
• Zetter, K. (2008). Six-year old news story causes United Airlines stock to plummet - update Google placed wrong date on story. Wired. Retrieved
from http://www.wired.com/2008/09/six-year-old-st/