2. WER BIN ICH?
Peter Schuhmann
2007 erstes TYPO3-Projekt
Certified TYPO3 Integrator
!
2014 erstes TYPO3-Neos
Projekt
!
seit 2014 als Freelancer tätig
PETER SCHUHMANN www.peterschuhmann.de
3. WARUM DIESER VORTRAG?
Alle finden Indexed-Search
nicht wirklich gut
Solr bietet alles was man
braucht
!
Mein erstes Projekt mit Solr war
recht „holprig“ aufgrund der
etwas spärlichen
Dokumentation
!
…und ich war schon viel zu
lange nicht mehr bei MTUG
PETER SCHUHMANN www.peterschuhmann.de
4. INDEXED SEARCH
Vorteile Nachteile
Einfache Installation (bei
jeder TYPO3-Installation
vorhanden)
Leicht zu handeln
!
fest/tief integriert in das
TYPO3 System
Langsam
stößt an Grenzen bei großen
Seiten
!
Wenig bis keine
Optimierungsmöglichkeiten
!
…u.v.m.
PETER SCHUHMANN www.peterschuhmann.de
5. WAS IST APACHE SOLR?
Solr (pronounced "solar") is an open source enterprise
search platform from the Apache Lucene project.
!
Its major features include full-text search, hit highlighting,
faceted search, dynamic clustering, database integration,
and rich document (e.g., Word, PDF) handling. Providing
distributed search and index replication, Solr is highly
scalable.
!
Solr is the most popular enterprise search engine.
!
Solr 4 adds NoSQL features.
!
!
Quelle: http://en.wikipedia.org/wiki/Apache_Solr
PETER SCHUHMANN www.peterschuhmann.de
6. VORTEILE SOLR (PART 1)
Volltext-Suche
Ranking und Relevanz
Faceted Search => vielfältige Kategorisierung
Stammworterkennung/Rechtstrunkierung - d.h. gesucht
wird nach Almhütte, Almkäse aber auch nach Bergalm
Filterung mit regulären Ausdrücken, phonetische Filter -
d.h. gesucht wird nach ähnlich klingende Wörter
"Meinten Sie...?" => Rechtschreibvorschläge
Unterstützung von Synonymen, Stopp-Wortlisten
Auto-Vervollständigung
Hervorheben des Suchbegriffs in Ergebnissen
Verfeinerung des Suchergebnisses durch Filter, Sortierung
Vorschläge für ähnliche Treffer
Indizierung von Inhalten in Dokumenten (Word, PDF, ...
mit Tika)
PETER SCHUHMANN www.peterschuhmann.de
7. VORTEILE SOLR (PART 2)
Schnell, schneller, am schnellsten bei vielen Zugriffen
(Caching)
Skalierbar durch verteilte Indizes auf mehreren Rechnern
Gute Performance, ausfallsicher
Flexibel erweiterbar durch Plugins
Schnittstellen zur Eingabe/Ausgabe von Daten
Administrationsoberfläche
Monitoring, Logging von Suchanfragen
Konfiguration über XML-Dateien
Multiple Daten-Schemata (numerisch, Datum, dynamisch,
eindeutiger Schlüssel (UUID)
Daten-Import Handler (CSV, URL, Dateien, …)
!
!
Quelle: http://www.comundus.com/produkte/solr-enterprise-search/
PETER SCHUHMANN www.peterschuhmann.de
8. WANN SOLR?
Sobald die Anforderungen über eine normale Suche
(indexed search) hinaus gehen (in der Regel bei größeren
Seiten)
!
Ausreden wie „Unser Provider bietet kein Solr-Hosting“
zählen nicht! (Solr ist ein Web-Service)
!
!
!
PETER SCHUHMANN www.peterschuhmann.de
12. LINKS & LITERATUR
LINKS
TYPO3-Extension WIKI (Solr Setup):
https://forge.typo3.org/projects/extension-solr/wiki
TYPO3-Extension Github:
https://github.com/TYPO3-extensions/solr
!
LITERATUR
Einführung in Apache Solr (ISBN: 978-3955614218)
http://www.amazon.de/Einf%C3%BChrung-Apache-Solr-Markus-Klose/dp/
3955614212/ref=tmm_hrd_title_0?ie=UTF8&qid=1412530743&sr=8-2-fkmr0
We are here
PETER SCHUHMANN www.peterschuhmann.de