Query Understanding
Prof. Dr. Dirk Lewandowski
Hochschule für Angewandte Wissenschaften Hamburg, Department Information
dirk.lewandowski@haw-hamburg.de
Kurzvorstellung

 •  Prof. Dr. Dirk Lewandowski

 •  Professor für
    Information Research & Information Retrieval
    an der Hochschule für Angewandte Wissenschaften
    Hamburg

 •  Forschung vor allem zur Qualität von Suchmaschinen,
    Nutzerverhalten, Query Understanding




1 |
Worum soll‘s heute gehen?




 1.  Wie kann man aus den Suchanfragen der Nutzer ihre Wünsche/Ziele
     herauslesen?

 2.  Mit welchen Hilfsmitteln kann man hier arbeiten?

 3.  Was nützt es, die Suchanfragen besser zu verstehen?




2 | Dirk Lewandowski
Hätten Sie‘s verstanden?




 •     vatikan
 •     stockbrot
 •     bmw
 •     fußball
 •     drehscheibe
 •     frauentausch
 •     seelenfarben
 •     berliner bank
 •     osterei
 •     wow


3 | Dirk Lewandowski
•     x




4 | Dirk Lewandowski
•     x




5 | Dirk Lewandowski
•     x




6 | Dirk Lewandowski
•     x




7 | Dirk Lewandowski
Die Suchintention kann sich verändern




8 | Dirk Lewandowski
Die Suchintention kann sich verändern




9 | Dirk Lewandowski
Was kann man aus einer Suchanfrage herauslesen?




 •     Genre (Bsp. Nachrichten)
 •     Thema (grob)
 •     Intention (informationsorientiert, navigationsorientiert, transaktionsorientiert)
 •     Ziel (Aktion oder Ressource)
 •     Spezifität (Bsp. „Mindestlohn“)
 •     Bandbreite/Mehrdeutigkeit (Ergebnisse ausdifferenzieren)
 •     Autoritätsbezug
 •     Ortsbezug
 •     Zeitbezug (explizit; implizit; aus dem Suchanfrage-Volumen)



10 | Dirk Lewandowski                                                (nach Calderon-Benavides et al. 2010)
Was kann man aus einer Suchanfrage herauslesen?




 •     Genre (Bsp. Nachrichten)
 •     Thema (grob)
 •     Intention (informationsorientiert, navigationsorientiert, transaktionsorientiert)
 •     Ziel (Aktion oder Ressource)
 •     Spezifität (Bsp. „Mindestlohn“)
 •     Bandbreite/Mehrdeutigkeit (Ergebnisse ausdifferenzieren)
 •     Autoritätsbezug
 •     Ortsbezug
 •     Zeitbezug (explizit; implizit; aus dem Suchanfrage-Volumen)



11 | Dirk Lewandowski                                             (nach Calderon-Benavides et al. 2010)
Top1000 Suchanfragen




 12 |
Top10000 Suchanfragen (logarithmisch)




    13 |
Position des Treffers




                         (Granka et al. 2004)
14 |
Ebenen der Analyse: Daten




15 | Dirk Lewandowski
Suchanfragen im Kontext




16 |
Konkreter vs. problemorientierter Informationsbedarf

 Frants, Shapiro und Voiskunskii 1997, Übersetzung Stock



       CIN                                            POIN

       Thematische Grenzen sind klar abgesteckt.      Thematische Grenzen sind nicht exakt
                                                      bestimmbar.

       Die Suchfrageformulierung ist durch exakte     Die Suchfrageformulierung lässt mehrere
       Terme ausdrückbar.                             terminologische Varianten zu.

       Eine Fakteninformation reicht i.d.R. aus, um   In der Regel müssen diverse Dokumente
       den Bedarf zu decken.                          beschafft werden. Ob der Informationsbedarf
                                                      damit abschließend gedeckt ist, bleibt offen.
       Mit der Übermittlung der Fakteninformation     Mit der Übermittlung der
       ist das Informationsproblem erledigt.          Literaturinformationen wird ggf. das
                                                      Informationsproblem modifiziert oder ein
                                                      neuer Bedarf geweckt.



17 |
Drei Anfragetypen

 Anfragetypen nach Broder (2002)



 •  Informational (informationsorientiert)
       –  Nutzer möchte sich zu einem Thema informieren.
       –  Ziel sind mehrere Dokumente.

 •  Navigational (navigationsorientiert)
       –  Ziel ist es, eine bestimmte Seite (wieder) zu finden.
       –  Typisch: Suche nach Homepage („Daimler Chrysler“).
       –  Ziel ist i.d.R. ein Dokument.

 •  Transactional (transaktionsorientiert)
       –  Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden
          soll.
       –  Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei.

18 |
Anwendungsfälle: Konkreter vs. problemorientierter
 Informationsbedarf
  Anwendungsfall       Konkret                       Problemorientiert


  Websuche             Ebay-Homepage                 Informationen über die
                                                     neue Sherlock-Holmes-
                                                     Serie der BBC

  Bibliothekskatalog   Ist das Buch „Information     Welche Bücher gibt es zum
                       Retrieval“ von Stock in der   Thema kollaborative
                       HAW-Bibliothek                Suche?
                       vorhanden?

  Online-Dating        Welche Hobbies hat            Wer passt zu mir?
                       Natalia73?

  Produktsuche         Was kostet der Roomba         Welcher Staubsaugroboter
                       581?                          ist der beste?

19 |
Anteile der Anfragetypen




                            (Lewandowski 2007, p. 267)

20 |
Navigationsorientierte Suchanfragen anhand von Klicks
 bestimmen




21 |
Transaktionsorientierte Suchanfragen anhand der Klicks
 bestimmen




22 |
Einsatzmöglichkeiten von Query Understanding




 •     Anfrageerweiterung
 •     Generierung von Suchvorschlägen
 •     Steuerung der organischen Ergebnisse
 •     Steuerung der Werbung
 •     Steuerung der Universal Search




23 | Dirk Lewandowski
Anzeigen



        Nachrichten



           Bilder

 x




         Videos

       Blogbeiträge


24 |
Vielen Dank für Ihre
Aufmerksamkeit.

www.bui.haw-hamburg.de/lewandowski.html



Aktuelles Buch:
Handbuch Internet-Suchmaschinen 2


E-Mail:
dirk.lewandowski@haw-hamburg.de

Query Understanding

  • 1.
    Query Understanding Prof. Dr.Dirk Lewandowski Hochschule für Angewandte Wissenschaften Hamburg, Department Information dirk.lewandowski@haw-hamburg.de
  • 2.
    Kurzvorstellung •  Prof.Dr. Dirk Lewandowski •  Professor für Information Research & Information Retrieval an der Hochschule für Angewandte Wissenschaften Hamburg •  Forschung vor allem zur Qualität von Suchmaschinen, Nutzerverhalten, Query Understanding 1 |
  • 3.
    Worum soll‘s heutegehen? 1.  Wie kann man aus den Suchanfragen der Nutzer ihre Wünsche/Ziele herauslesen? 2.  Mit welchen Hilfsmitteln kann man hier arbeiten? 3.  Was nützt es, die Suchanfragen besser zu verstehen? 2 | Dirk Lewandowski
  • 4.
    Hätten Sie‘s verstanden? •  vatikan •  stockbrot •  bmw •  fußball •  drehscheibe •  frauentausch •  seelenfarben •  berliner bank •  osterei •  wow 3 | Dirk Lewandowski
  • 5.
    •  x 4 | Dirk Lewandowski
  • 6.
    •  x 5 | Dirk Lewandowski
  • 7.
    •  x 6 | Dirk Lewandowski
  • 8.
    •  x 7 | Dirk Lewandowski
  • 9.
    Die Suchintention kannsich verändern 8 | Dirk Lewandowski
  • 10.
    Die Suchintention kannsich verändern 9 | Dirk Lewandowski
  • 11.
    Was kann manaus einer Suchanfrage herauslesen? •  Genre (Bsp. Nachrichten) •  Thema (grob) •  Intention (informationsorientiert, navigationsorientiert, transaktionsorientiert) •  Ziel (Aktion oder Ressource) •  Spezifität (Bsp. „Mindestlohn“) •  Bandbreite/Mehrdeutigkeit (Ergebnisse ausdifferenzieren) •  Autoritätsbezug •  Ortsbezug •  Zeitbezug (explizit; implizit; aus dem Suchanfrage-Volumen) 10 | Dirk Lewandowski (nach Calderon-Benavides et al. 2010)
  • 12.
    Was kann manaus einer Suchanfrage herauslesen? •  Genre (Bsp. Nachrichten) •  Thema (grob) •  Intention (informationsorientiert, navigationsorientiert, transaktionsorientiert) •  Ziel (Aktion oder Ressource) •  Spezifität (Bsp. „Mindestlohn“) •  Bandbreite/Mehrdeutigkeit (Ergebnisse ausdifferenzieren) •  Autoritätsbezug •  Ortsbezug •  Zeitbezug (explizit; implizit; aus dem Suchanfrage-Volumen) 11 | Dirk Lewandowski (nach Calderon-Benavides et al. 2010)
  • 13.
  • 14.
  • 15.
    Position des Treffers (Granka et al. 2004) 14 |
  • 16.
    Ebenen der Analyse:Daten 15 | Dirk Lewandowski
  • 17.
  • 18.
    Konkreter vs. problemorientierterInformationsbedarf Frants, Shapiro und Voiskunskii 1997, Übersetzung Stock CIN POIN Thematische Grenzen sind klar abgesteckt. Thematische Grenzen sind nicht exakt bestimmbar. Die Suchfrageformulierung ist durch exakte Die Suchfrageformulierung lässt mehrere Terme ausdrückbar. terminologische Varianten zu. Eine Fakteninformation reicht i.d.R. aus, um In der Regel müssen diverse Dokumente den Bedarf zu decken. beschafft werden. Ob der Informationsbedarf damit abschließend gedeckt ist, bleibt offen. Mit der Übermittlung der Fakteninformation Mit der Übermittlung der ist das Informationsproblem erledigt. Literaturinformationen wird ggf. das Informationsproblem modifiziert oder ein neuer Bedarf geweckt. 17 |
  • 19.
    Drei Anfragetypen Anfragetypennach Broder (2002) •  Informational (informationsorientiert) –  Nutzer möchte sich zu einem Thema informieren. –  Ziel sind mehrere Dokumente. •  Navigational (navigationsorientiert) –  Ziel ist es, eine bestimmte Seite (wieder) zu finden. –  Typisch: Suche nach Homepage („Daimler Chrysler“). –  Ziel ist i.d.R. ein Dokument. •  Transactional (transaktionsorientiert) –  Ziel ist das Auffinden einer Website, auf der dann eine Transaktion stattfinden soll. –  Beispiele für Transaktionen: Kauf eines Produkts, Download einer Datei. 18 |
  • 20.
    Anwendungsfälle: Konkreter vs.problemorientierter Informationsbedarf Anwendungsfall Konkret Problemorientiert Websuche Ebay-Homepage Informationen über die neue Sherlock-Holmes- Serie der BBC Bibliothekskatalog Ist das Buch „Information Welche Bücher gibt es zum Retrieval“ von Stock in der Thema kollaborative HAW-Bibliothek Suche? vorhanden? Online-Dating Welche Hobbies hat Wer passt zu mir? Natalia73? Produktsuche Was kostet der Roomba Welcher Staubsaugroboter 581? ist der beste? 19 |
  • 21.
    Anteile der Anfragetypen (Lewandowski 2007, p. 267) 20 |
  • 22.
  • 23.
  • 24.
    Einsatzmöglichkeiten von QueryUnderstanding •  Anfrageerweiterung •  Generierung von Suchvorschlägen •  Steuerung der organischen Ergebnisse •  Steuerung der Werbung •  Steuerung der Universal Search 23 | Dirk Lewandowski
  • 25.
    Anzeigen Nachrichten Bilder x Videos Blogbeiträge 24 |
  • 26.
    Vielen Dank fürIhre Aufmerksamkeit. www.bui.haw-hamburg.de/lewandowski.html Aktuelles Buch: Handbuch Internet-Suchmaschinen 2 E-Mail: dirk.lewandowski@haw-hamburg.de