http://www.dkd.deSonntag, 12. Februar 12
dkd                          development                          kommunikation                          designSonntag, 12...
Willkommen        TYPO3 Akademie 12        Olivier Dobberkau, Geschäftsführer dkd        Member of the Expert Advisory Boa...
Alles was Sie über Suche wissen        wollten, aber bisher nicht zu        fragten wagten.Sonntag, 12. Februar 12
Woody Allen        Inspiration zu diesem Talk:        Woody Allen Film: „Was Sie schon immer über Sex        wissen wollte...
Agenda              Historie der Suche              Fachbegriffe              Das Bedürfnis „Suchen“              Wer such...
Historie        Ein kurzer Abriss über die Historie von        Suchlösungen im Zeitalter der EDV.        Wirklich kurz, wi...
Scratch your own itch, IBM.              Am Anfang stand der Mainframe              IBM entwickelt 1969 STAIRS (storage an...
Internet years are dog years              Mit dem Internet verändert sich der Anspruch an              eine Volltextsuche ...
And then came GOOGLE              Wer kennt das Erfolgsgeheimnis von Google              nicht?              The Anatomy o...
Fachbegriffe        Keine Erkenntnis ohne Fachbegriffe.        Warnhinweis: Jargon-Gefahr!Sonntag, 12. Februar 12
Alles rund ums Wort              Irformation Retrieval (IR)              Term versus Query              Index             ...
Bedürfnis Suche        Welche Motive leiten uns bei der Suche?        Wie suchen wir und was nden wir dann?Sonntag, 12. Fe...
People are like Bears        (only less fur)              Wie suchen wir?              Marcia Bates, 1989              THE...
Marcia J. Bates Berrypicking techniques for the online search interface (1989)Sonntag, 12. Februar 12
Carrots & Sticks              Search Behavior Patterns, John Ferrara              http://www.boxesandarrows.com/view/searc...
Neo: Die Matrix              Matrix der Informationsbedürfnisse                                  Scope & Type -Tyler Tate....
Suchen als Handwerk        Welche Lösungsansätze gibt es um eine gute Suche        zu realisieren?        Wie sieht das To...
Komponenten        ÜberblickSonntag, 12. Februar 12
IndexierungSonntag, 12. Februar 12
AbfrageSonntag, 12. Februar 12
ErgebnisSonntag, 12. Februar 12
AnalyseSonntag, 12. Februar 12
ZusatzkomponentenSonntag, 12. Februar 12
Solr-Komponenten              Indizierung              Abfrage       Abfrage             Ergebnis            Indexierung  ...
TYPO3 & Suche        Am Beispiel der Apache Solr Integration.        Schamlos zugegeben.        (Ich habe noch ein paar „I...
Indexierung        Indexierung von Content        Anwendungsmöglichkeiten der IndexierungSonntag, 12. Februar 12
Indexierbarer Content              TYPO3 Content              Datenbank-Tabellen              Externe Websites            ...
Möglichkeiten Indexierung              Erstellen von Synonymen              Auslassen von Stopwords              Extern vo...
Abfrage        Optionen        FunktionsumfangSonntag, 12. Februar 12
Abfrage-Optionen              Operatoren                    “+” und “-” für Erzwingen oder Ausschluss                    z...
Abfrage-Funktionalität              Berücksichtigung der Benutzerberechtigungen              Autovervollständigung        ...
Ergebnis        Funktionen        FacettenSonntag, 12. Februar 12
Ergebnis-Funktionen              Suchtreffer (Link auf das Ergebnis)              Page Browser              Sortierung    ...
Ergebnis-Funktionen              View-Helper um z.B. Zusatzinformationen zum              Treffer abzurufen (kundenindivid...
Ergebnis-Funktionen              Field Boosting (Treffer im Titel ist mehr Wert als              Treffer im Content. Werti...
Ergebnis-Funktionen              Template Engine: Ergebnisdarstellung einfach              anpassbar durch exibles Templat...
Facetten              Typ-Facetten                    Autor (z.B. bei News)                    Typ (z.B. Seite, News, Akti...
Facetten              Geo-Search (in Arbeit)              (z.B. wenn indizierte Elemente geographische Information        ...
Analyse        Analysemöglichkeiten        RoadmapSonntag, 12. Februar 12
Analysemöglichkeiten              Query Logging              Statistiken über die Suchanfragen (in Arbeit)              Le...
ZusatzkomponentenSonntag, 12. Februar 12
Zusatzkomponenten              Auf einer Ergebnisseite kann über die Nutzung              des Index z.B. eine "more like t...
Konzepte im Detail        Scoring        SynonymeSonntag, 12. Februar 12
Scoring              term frequency (tf)              Je häufiger ein Term in einem Dokument auftritt, desto höher         ...
Scoring - Zusammenfassung              Dokumente, die alle Suchterme enthalten sind              gut.              Treffer...
Scoring – Beispiel              Indizierung und Boost verschiedener Felder                    Content (z.B. 20x)          ...
Synonyme              Werden bei Indizierung erstellt              Können gerichtet sein                    Stewardess = F...
Synonyme: Beispiel Verkettung              Enjoy Toy Fair City = Messestadt Nürnberg =              Kulturangebot = Restau...
Synonyme: Beispiel Verkettung              Suche nach: “Restaurant”              Restaurant = Enjoy Toy Fair City         ...
Synonyme: Beispiel Verkettung              Die resultierende Suchanfrage (nicht komplett):                    Enjoy Toy Fa...
Synonyme: Seiteneffekte              Beispiel Synonymsuche                    TV = Television                    Im Index ...
dkd                                development                                kommunikation                               ...
Quellenangaben                    Lucene Scoring for dummies: http://                    www.supermind.org/blog/378/lucene...
Nächste SlideShare
Wird geladen in …5
×

Alles was-sie-ueber-suche-wissen-wollten

2.355 Aufrufe

Veröffentlicht am

Veröffentlicht in: Technologie
0 Kommentare
4 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

Keine Downloads
Aufrufe
Aufrufe insgesamt
2.355
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
70
Aktionen
Geteilt
0
Downloads
14
Kommentare
0
Gefällt mir
4
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Alles was-sie-ueber-suche-wissen-wollten

  1. 1. http://www.dkd.deSonntag, 12. Februar 12
  2. 2. dkd development kommunikation designSonntag, 12. Februar 12
  3. 3. Willkommen TYPO3 Akademie 12 Olivier Dobberkau, Geschäftsführer dkd Member of the Expert Advisory Board TYPO3 Assoc. Twitter @T3RevNeverend olivier.dobberkau@dkd.deSonntag, 12. Februar 12
  4. 4. Alles was Sie über Suche wissen wollten, aber bisher nicht zu fragten wagten.Sonntag, 12. Februar 12
  5. 5. Woody Allen Inspiration zu diesem Talk: Woody Allen Film: „Was Sie schon immer über Sex wissen wollten, aber bisher nicht zu fragen wagten“ Internet Movie Database: http://www.imdb.de/title/tt0068555/Sonntag, 12. Februar 12
  6. 6. Agenda Historie der Suche Fachbegriffe Das Bedürfnis „Suchen“ Wer sucht und wie sucht dieser? Suchen als Handwerk Suche in TYPO3 mit Apache SolrSonntag, 12. Februar 12
  7. 7. Historie Ein kurzer Abriss über die Historie von Suchlösungen im Zeitalter der EDV. Wirklich kurz, wirklich unvollständig und bestimmt nicht wissenschaftlich.Sonntag, 12. Februar 12
  8. 8. Scratch your own itch, IBM. Am Anfang stand der Mainframe IBM entwickelt 1969 STAIRS (storage and information retrieval system) Volltext Suche für Terminal Anwendungen Performance: „far below anyone‘s expectations“ Erster großer Einsatz bei einem Verfahren des DOJ gegen IBM Quelle: A history of online information services, 1963-1976 von Charles P. Bourne,Trudi BellardoSonntag, 12. Februar 12
  9. 9. Internet years are dog years Mit dem Internet verändert sich der Anspruch an eine Volltextsuche Mit Lycos, Alltheweb (Fast) , Infoseek, Excite, AltaVista treten Suchseiten als Lösung für das Problem: „Wie nde ich etwas im Internet?“ an Ab 1995 wechseln sich Suchseiten in der Gunst der Internetnutzer regelmäßig ab Yahoo fungiert als Verzeichnis von WebseitenSonntag, 12. Februar 12
  10. 10. And then came GOOGLE Wer kennt das Erfolgsgeheimnis von Google nicht? The Anatomy of a Large-Scale Hypertextual Web Search Engine http://infolab.stanford.edu/~backrub/google.html Visionäres Konzept Viele der erwähnten Technologien sind heute Industrie-Standard und verändern immer noch die Informationstechnologie. Lesen!Sonntag, 12. Februar 12
  11. 11. Fachbegriffe Keine Erkenntnis ohne Fachbegriffe. Warnhinweis: Jargon-Gefahr!Sonntag, 12. Februar 12
  12. 12. Alles rund ums Wort Irformation Retrieval (IR) Term versus Query Index Recall & Precision Relevancy Index, Inverted Index & Posting List Recency & AuthoritySonntag, 12. Februar 12
  13. 13. Bedürfnis Suche Welche Motive leiten uns bei der Suche? Wie suchen wir und was nden wir dann?Sonntag, 12. Februar 12
  14. 14. People are like Bears (only less fur) Wie suchen wir? Marcia Bates, 1989 THE DESIGN OF BROWSING AND BERRYPICKING TECHNIQUES FOR THE ONLINE SEARCH INTERFACE http://pages.gseis.ucla.edu/faculty/bates/ berrypicking.html Jede Art von Suchverhalten hat dieses MusterSonntag, 12. Februar 12
  15. 15. Marcia J. Bates Berrypicking techniques for the online search interface (1989)Sonntag, 12. Februar 12
  16. 16. Carrots & Sticks Search Behavior Patterns, John Ferrara http://www.boxesandarrows.com/view/search- behavior Domain Expertise Such Expertise Kognitiver Stil Ziel der Suche Modus der Suche Umstände der SucheSonntag, 12. Februar 12
  17. 17. Neo: Die Matrix Matrix der Informationsbedürfnisse Scope & Type -Tyler Tate. Sohn et al. Church & Smyth http://twigkit.com/blog/2011/12/06/mobile-information-needs.htmlSonntag, 12. Februar 12
  18. 18. Suchen als Handwerk Welche Lösungsansätze gibt es um eine gute Suche zu realisieren? Wie sieht das Toolset aus? Wohin geht die Reise?Sonntag, 12. Februar 12
  19. 19. Komponenten ÜberblickSonntag, 12. Februar 12
  20. 20. IndexierungSonntag, 12. Februar 12
  21. 21. AbfrageSonntag, 12. Februar 12
  22. 22. ErgebnisSonntag, 12. Februar 12
  23. 23. AnalyseSonntag, 12. Februar 12
  24. 24. ZusatzkomponentenSonntag, 12. Februar 12
  25. 25. Solr-Komponenten Indizierung Abfrage Abfrage Ergebnis Indexierung Analyse Analyse Ergebnis Zusatzkomponenten ZusatzkomponentenSonntag, 12. Februar 12
  26. 26. TYPO3 & Suche Am Beispiel der Apache Solr Integration. Schamlos zugegeben. (Ich habe noch ein paar „I like Indexed Search“ Buttons zum Verschenken!)Sonntag, 12. Februar 12
  27. 27. Indexierung Indexierung von Content Anwendungsmöglichkeiten der IndexierungSonntag, 12. Februar 12
  28. 28. Indexierbarer Content TYPO3 Content Datenbank-Tabellen Externe Websites RSS-Feeds DateienSonntag, 12. Februar 12
  29. 29. Möglichkeiten Indexierung Erstellen von Synonymen Auslassen von Stopwords Extern vorgehaltener Content wie z.B. Online- Katalog Aggregation von Brancheninformation Integration von Information aus weiteren Plattformen wie z.B. Microsites oder ApplikationenSonntag, 12. Februar 12
  30. 30. Abfrage Optionen FunktionsumfangSonntag, 12. Februar 12
  31. 31. Abfrage-Optionen Operatoren “+” und “-” für Erzwingen oder Ausschluss zukünftig “and” und “or” zur Verkettung Anführungszeichen zur Zusammenfassung z.B. “Suchbegriff aus mehreren Worten” Diakritische Zeichen cuvée = cuvee Søren = Sören = Soeren = Sœren = SorenSonntag, 12. Februar 12
  32. 32. Abfrage-Funktionalität Berücksichtigung der Benutzerberechtigungen Autovervollständigung SuggestionsSonntag, 12. Februar 12
  33. 33. Ergebnis Funktionen FacettenSonntag, 12. Februar 12
  34. 34. Ergebnis-Funktionen Suchtreffer (Link auf das Ergebnis) Page Browser Sortierung Relevanz (Score) Autor Datum (Indexierungsdatum, cr_date einer TYPO3-Seite) Eigene KriterienSonntag, 12. Februar 12
  35. 35. Ergebnis-Funktionen View-Helper um z.B. Zusatzinformationen zum Treffer abzurufen (kundenindividuelle Preise, Vorschaubild, Vorschau des Dokument-Inhalts) Filter vorbelegen (Facetten können im Vorfeld angewendet werden)Sonntag, 12. Februar 12
  36. 36. Ergebnis-Funktionen Field Boosting (Treffer im Titel ist mehr Wert als Treffer im Content. Wertigkeit ist frei de nierbar.) Boost-Functions (Funktionen auf Werte aus Dokumenten. Z.B. je neuer ein Dokument, desto höher der Boost auf ein Feld.) Query-Manipulationen (bevor die Anfrage an Solr übergeben wird, kann dieser noch mal bearbeitet werden.) Elevation (in Arbeit)Sonntag, 12. Februar 12
  37. 37. Ergebnis-Funktionen Template Engine: Ergebnisdarstellung einfach anpassbar durch exibles Templating Suchwort-Hervorhebung Spell-Checking: "Meinten Sie?" Common Searches (Tag Cloud bzw. die meistgesuchten Begriffe) Recent Searches Ähnlich Common Searches: zeigt die letzten durchgeführten SuchenSonntag, 12. Februar 12
  38. 38. Facetten Typ-Facetten Autor (z.B. bei News) Typ (z.B. Seite, News, Aktienkurs, ...) Bereichs-Facetten (in Arbeit) (z.B. 1-10 EUR oder Slider) Hierarchische Facetten (Wenn baumartige Strukturen vorliegen, können diese auch als Facette dargestellt werden. z.B. News Kategorien) Multiple Auswahl von Facettenausprägungen (z.B. Facette Preis 20 EUR & 30 EUR)Sonntag, 12. Februar 12
  39. 39. Facetten Geo-Search (in Arbeit) (z.B. wenn indizierte Elemente geographische Information besitzen. Eine Google Map dient als Interface um alle Treffer innerhalb des sichtbaren Fensters zu zeigen.) Georelevante Informationen auf Basis der IP- Adresse des Benutzers (z.B. wo ist der nächste Service-Point in meiner Nähe) Darstellung der Facettenlabel erfolgt als TYPO3 Content Objekt (beliebige Darstellung z.B. über GIFBUILDER möglich) Filter vorbelegen (bestimmte Facetten können im Vorfeld angewendet werden)Sonntag, 12. Februar 12
  40. 40. Analyse Analysemöglichkeiten RoadmapSonntag, 12. Februar 12
  41. 41. Analysemöglichkeiten Query Logging Statistiken über die Suchanfragen (in Arbeit) Lernen durch Userinput (in Arbeit) (Wenn User ein Ergebnis anklickt, erhält das Ergebnis Zusatzpunkte.)Sonntag, 12. Februar 12
  42. 42. ZusatzkomponentenSonntag, 12. Februar 12
  43. 43. Zusatzkomponenten Auf einer Ergebnisseite kann über die Nutzung des Index z.B. eine "more like this"-Empfehlung erfolgen um thematisch relevante Themen anzuzeigen. Eigenentwicklungen, die Zugriff auf die Indexdaten benötigen, möglichSonntag, 12. Februar 12
  44. 44. Konzepte im Detail Scoring SynonymeSonntag, 12. Februar 12
  45. 45. Scoring term frequency (tf) Je häufiger ein Term in einem Dokument auftritt, desto höher der Score. inverse document frequency (idf) Je häufiger ein Term in verschiedenen Dokumenten auftritt, desto geringer sein Score. number of terms in the query that were found in the document (coord) Je mehr Terme der Suchanfrage im Dokument vorkommen, desto höher sein Score. BoostSonntag, 12. Februar 12
  46. 46. Scoring - Zusammenfassung Dokumente, die alle Suchterme enthalten sind gut. Treffer auf seltene Worte sind besser als Treffer auf häu ge Worte. Kurze Dokumente sind besser als lange Dokumente. Dokumente, die Suchterme mehrfach enthalten sind gut.Sonntag, 12. Februar 12
  47. 47. Scoring – Beispiel Indizierung und Boost verschiedener Felder Content (z.B. 20x) Keywords (z.B. 20x) Seitentitel (z.B. 25x) Sortierung nach Typ News kommen z.B. immer am Ende des Suchergebnisses nach allen SeitentreffernSonntag, 12. Februar 12
  48. 48. Synonyme Werden bei Indizierung erstellt Können gerichtet sein Stewardess = Flugbegleiter Spielwaren => Toy aber Toy ≠> Spielwaren Können Ketten bilden Durch Synonymketten können Suchanfragen sehr ungenau werdenSonntag, 12. Februar 12
  49. 49. Synonyme: Beispiel Verkettung Enjoy Toy Fair City = Messestadt Nürnberg = Kulturangebot = Restaurant = Essen = Bar = Gastrosuche = Kultur = Nürnberg spielt mit = Museum = Einkaufen = Nürnberg = Abendessen = Gasthäuser Spielwarenmesse = Fachmesse für Spielwaren = Toy Fair = International Toy Fair = Toy Fair Nürnberg = Spielzeugmesse = Spielzeugmesse Nürnberg = Nürnbergmesse für Spielwaren = Spielwarenmesse 2011 Spielzeug = Spielwaren = SpielsachenSonntag, 12. Februar 12
  50. 50. Synonyme: Beispiel Verkettung Suche nach: “Restaurant” Restaurant = Enjoy Toy Fair City Enjoy Toy Fair City = Enjoy Fachmesse für Spielwaren City Enjoy Fachmesse Spielwaren City = Enjoy Fachmesse Spielzeug CitySonntag, 12. Februar 12
  51. 51. Synonyme: Beispiel Verkettung Die resultierende Suchanfrage (nicht komplett): Enjoy Toy Fair City Messestadt Nürnberg Kulturangebot Restaurant Essen Bar Gastrosuche Kultur spielt Museum Einkaufen Abendessen Gasthäuser Spielwarenmesse Fachmesse International Spielzeugmesse Nürnbergmesse 2011 Spielzeug Spielwaren SpielsachenSonntag, 12. Februar 12
  52. 52. Synonyme: Seiteneffekte Beispiel Synonymsuche TV = Television Im Index ca. 1.000 Dokumente mit “TV” Im Index ca. 50 Dokumente mit “Television” Suche nach “TV” bringt Dokumente mit “Television” nach vorne, da “bessere Treffer”Sonntag, 12. Februar 12
  53. 53. dkd development kommunikation design sagt danke.Sonntag, 12. Februar 12
  54. 54. Quellenangaben Lucene Scoring for dummies: http:// www.supermind.org/blog/378/lucene-scoring- for-dummies Fotos: Søren SchaffsteinSonntag, 12. Februar 12

×