Suche mit Apache Solr

6.366 Aufrufe

Veröffentlicht am

Mit Apache Solr können Website-Betreiber mit überschaubarem Aufwand eine relevantere und performantere Suche implementieren als dies bspw. mit MySQL Full-Text Search möglich ist.

Unsere Präsentation gibt einen kurzen Einblick in die Kernfunktionen und zeigt verschiedene Beispiele.

Veröffentlicht in: Technologie
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
6.366
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
1.873
Aktionen
Geteilt
0
Downloads
0
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie



  • compuccino wurde 2007 von Klas Roggenkamp & Nader Cserny gegründet
    Organisch auf 15 Mitarbeiter gewachsen
    Spezialisierung auf Entwicklung und Design von komplexen Inhalten

  • Cnet: Medien-Unternehmen aus den USA
    Multi-Plattform: Windows, Mac, Linux
    Apache Lizenz: frei verwenden, Änderungen müssen nicht veröffentlicht werden


  • Faceted: Kategorisierung nach Autor, Kategorie, Datum, Inhaltstyp, etc.
    Ranking: relevante Faktoren flexibel konfigurierbar
    Stammworterkennung: Haus findet Häuser, Porter-/Snowball-Stemmer für versch. Sprachen
    Meinten Sie: Korrektur von „schwäbich“ zu „schwäbisch“
  • Synonyme: Fahrzeug = Auto, Computer = PC
    Hervorheben mit CSS-Attributen
    Verfeinerung durch Auswahl von Parametern
  • Flexibel, ...: Suchfunktionalitäten mit Plugins erweiterbar
    Caching: je mehr Suchanfragen umso schneller => Zwischenspeicher
  • Daten-Import Handler: CSV, URLs, Files

  • Faceted Search => Filterungsoptionen
    Sortierung nach Relevanz, Titel, ..., Datum auf-/absteigend
  • Kategorien: Product Reviews, Downloads, News & Photos, Videos
    Darstellung des Suchergebnisses frei wählbar
    Narrow your results
  • Auto-Vervollständigung bei Eingabe des Suchbegriffs
    „Michael“ findet „Michael Jackson“, „Michael Jackson Music Videos“ auf Basis der häufigsten Suchbegriff-Nennung
  • Suche in Videos per Auto-Vervollständigung
  • „Surprise Me“ wählt zufälliges Suchergebnis aus und leitet direkt auf die Produktseite
  • „Toy Story“ findet den aktuellsten Film „Toy Story 3“

  • Erweiterte Suche: Datum von/bis, Autor, etc.
    Foto: Direkte Anzeige von anderen Inhaltstypen

  • DB Import: Felder definiert, Inhalte & Dokumente geparsed, etc.
    Initialer Import hat ca. 10 Stunden gedauert
    Bereits mit der Standardinstallation erzielt man bessere Suchergebnisse als mit MySQL Full-Text Search




  • Suche mit Apache Solr

    1. 1. Suche mit Apache Solr Nader Cserny, compuccino
    2. 2. Agenda • Vorstellung • Einführung • Funktionen • Beispiele • Praxis • Fragen
    3. 3. Vorstellung
    4. 4. Vorstellung Hamburg.de, BILD, WELT, Moneywise, Berliner Morgenpost, Merian, FAZ, WWF, Entwicklung, Design, Hedgemedia, Schwäbische Post, 24h Berlin, Mercedes, Berliner Bank, Pernod Ricard, Konzeption, Beratung Milchverband, easyJet, XAVER.de, OTTO Nader Cserny Klas Roggenkamp 15! 2007!
    5. 5. Einführung
    6. 6. Einführung – Was ist Solr? • Enterprise Suchmaschine • Ursprung bei CNET Networks Inc. • seit 2004 in Entwicklung, aktive Community • Open Source > kostenlos • Multi-Plattform dank Java • Apache Lizenz
    7. 7. Funktionen
    8. 8. Funktionen – Was kann Solr? (1) • Volltext-Suche • Ranking und Relevanz • Faceted Search => vielfältige Kategorisierung • Stammworterkennung / Rechtstrunkierung • Filterung mit regulären Ausdrücken, phonetische Filter • „Meinten Sie...?“ => Rechtschreibvorschläge
    9. 9. Funktionen – Was kann Solr? (2) • Unterstützung von Synonymen, Stop-Wortlisten • Auto-Vervollständigung • Hervorheben des Suchbegriffs in Ergebnissen • Verfeinerung des Suchergebnisses durch Filter, Sortierung • Vorschläge für ähnliche Treffer • Indizierung von Inhalten in Dokumenten (Word, PDF, ... mit Tika)
    10. 10. Funktionen – Was kann Solr? (3) • Schnell, schneller, am schnellsten bei vielen Zugriffen (Caching) • Skalierbar durch verteilte Indizes auf mehreren Rechnern • Mehr Performance, ausfallsicher • Flexibel erweiterbar durch Plugins • Schnittstellen (RESTful API) zur Eingabe / Ausgabe von Daten • Administrationsober äche
    11. 11. Funktionen – Was kann Solr? (4) • Monitoring, Logging von Suchanfragen • Kon guration über XML-Dateien • Multiple Daten-Schemas • numerisch, Datum, dynamisch, eindeutiger Schlüssel (UUID) • Daten-Import Handler • CSV, URL, Dateien, ...
    12. 12. Beispiele
    13. 13. Beispiele – White House Sortierung Suchergebnis Filter
    14. 14. Beispiele – CNET Networks Inc. Verwandte Suchbegriffe Suchergebnis
    15. 15. Beispiele – MTV Auto-Vervollständigung
    16. 16. Beispiele – Net ix Auto-Vervollständigung
    17. 17. Beispiele – Mattel Zufalls-Produkt aus Ergebnis Filter
    18. 18. Beispiele – Disney Filter
    19. 19. Beispiele – CNN Suchergebnis Filter
    20. 20. Beispiele – la Repubblica Erweiterte Suche Anderer Inhaltstyp
    21. 21. Praxis
    22. 22. Praxis – Prototyp • Langsamer, alter Rechner im Büro (Kosten: EUR 200,00) • AMD, 512 MB RAM => trotzdem schnell • Webserver, CMS & Solr installiert • Datenbank-Inhalte eingespielt • 400.000 kategorisierte Artikel, PDF-Dokumente (Stand: 19.05.2010) • Standardinstallation bringt bessere Ergebnisse als MySQL Full-Text Search
    23. 23. Praxis – Suchanfragen • Suche: „schwäbich“ => Meinen Sie: „schwäbisch“ • Auto-Vervollständigung: „Polizei“ => „Polizeibericht“, „Polizeirevier“, „Polizeidirektion“, ... • Suche: „einkaufen aalen mitternacht“ (785 Treffer, vgl. SP => 12 Treffer und kein direktes Ergebnis) • Suche: „Schatzsuche Umweltmuseum“ => Meinen Sie: „Schatzsuche Urweltmuseum“ (vgl. SP => Unterschriften) • Suche: „Gmünder Pferdetage“ => Findet etwas im PDF (vgl. SP: kein direktes Ergebnis) • Suche: „Aalen Wandern“ => Findet im Titel „Wandern in Aalen“
    24. 24. Fragen
    25. 25. Abschließend...
    26. 26. Abschließend... • Mehr über uns: • http://compuccino.com • Fragen: • of ce@compuccino.com • T: 030 247 24 000

    ×