Technology 
Drives 
Business 
APACHE SOLR VS ELASTICSEARCH 
AND THE WINNER IS…! 
EIN VERGLEICH DER SHOOTING STARS 
Webinar...
UP-COMING EVENTS 
13.02.2014: Setting-up Elasticsearch, Logstash, Kibana 
24.02.-27.02.2014: Apache Solr Trainings 
(zwei ...
DANIEL WRIGLEY 
Consultant für Search & Big Data Technologies 
Computerlinguist 
Durch LucidWorks zertifizierter Apache So...
AGENDA 
Up-coming Events 
Vorstellung 
Einführung 
“Ease of Use” 
Skalierbarkeit & Architektur 
Suche & Features 
Indexier...
UNSERE MISSION 
Seit 1994 hersteller-unabhängiges Unternehmen für IT Consulting und Software 
Engineering. 
Wir bieten Lös...
WAS WIR TUN 
MIT SERVICES 
DURCH 
ANWENDUNG 
DES KNOW-HOWS 
REALISIEREN 
LÖSUNGEN 
ZUR 
OPTIMALEN 
NUTZUNG 
VON DATEN 
• S...
WARUM VERGLEICHEN?
SOLR VS ELASTICSEARCH 
ÄPFEL VS BIRNEN?
EINFÜHRUNG 
SOLR 
• NoSQL 
• Lucene 4.6.1 
• Java 
• Aktuelle Version: 4.6.1 
• Lizenz: Apache 2.0 
• Apache Top Level Pro...
„EASE OF USE“ 
Herunterladen & entpacken 
Starten 
Indexieren 
Alternativ 
Suchen 
1 
2 
3 
4 
java –jar start.jar 
java –...
„EASE OF USE“ 
Herunterladen & entpacken 
Starten 
Indexieren 
Suchen 
1 
2 
3 
4 
bin/elasticsearch 
curl –XPUT 'http://l...
„EASE OF USE“ & CLUSTER SET-UP 
Jeder Clusternode muss mit dem "Wissen" 
der Administrationseinheiten (ZooKeeper) 
gestart...
„EASE OF USE“ & CLUSTER SET-UP 
Starten weiterer Nodes durch erneute 
Ausführung von 
bin/elasticsearch 
Clusternodes find...
„EASE OF USE“ 
HIMMEL ODER HÖLLE?
ANFORDERUNGSPROFIL 
Hohe Verfügbarkeit 
Skalierbarkeit 
Features für umfangreiche Volltextsuche 
Fehlertoleranz 
Unstruktu...
SKALIERBARKEIT & ARCHITEKTUR 
SOLR 
• Master/Slave Architektur 
• SolrCloud (ab Solr 4.0) 
• Collections API 
• Collection...
SUCHE & FEATURES 
SOLR 
• Grouping 
• Pivot Faceting 
• Solr Join 
• Spell Checking 
• IndexBasedSpellChecker 
• WordBreak...
INDEXIERUNG & DATENSTRUKT. 
SOLR 
• Indexierung 
• UpdateHandler 
• XML, CSV, JSON 
• DataImportHandler 
• JDBC, XPath, HT...
INDEXIERUNG & DATENSTRUKT. 
SOLR 
• Kann schemafrei sein (Solr 4.4) 
• Mehr Analysemöglichkeiten 
• ICU Tokenizer und Filt...
ADMINISTRATION 
Ausgereiftes Admin User Interface
ADMINISTRATION 
Kein Admin User Interface vorhanden 
Per Plug-in nachrüstbar
ELASTICSEARCH MARVEL 
Elasticsearch Installationen bequem und sicher administrieren
KOORDINATION & VERWALTUNG 
SOLR 
• Läuft in einem beliebigen 
Servlet Container 
• ZooKeeper 
• Mehr Konfigurationsaufwand...
COMMUNITY & STATS. 
150 
100 
50 
0 
Committer 
Apache Solr Elasticsearch 
150 
100 
50 
0 
Issues 
Apache Solr Elasticsea...
COMMUNITY & DOCS &PLUG-INS 
SOLR 
• Zahlreiche Patches 
• Unmengen Dokumentation 
vorhanden 
• Wiki 
• Reference Guide 
• ...
KOMMERZIELLER SUPPORT 
SOLR 
• LucidWorks 
• 24/7 SLAs 
• LucidWorks Search 
• SHI & Co. 
• Entwicklung 
• Trainings 
• De...
BACK TO THE FUTURE 
SOLR 
• Solr 5.0 
• Distributed IDF 
• Saved Searches ≈ Percolator 
• Indexierung via Hadoop 
MapReduc...
AND THE WINNER IS…! 
Viele Gemeinsamkeiten 
Kleine, aber bedeutende Unterschiede 
Keine einfache Entscheidung 
Kleinigkeit...
Q & A
KONTAKT 
SHI GmbH & Co. KG 
Curt-Frenzel-Str. 12 
D - 86167 Augsburg 
info@shi-gmbh.com 
+49.821.74 82 633 - 0 
@SHIEngine...
WEITERFÜHRENDE INFOS 
SHI Blog: www.shi-gmbh.com/blog/ 
LucidWorks Products: http://www.lucidworks.com/product-overview/ 
...
BILDERNACHWEIS 
Fire - http://www.flickr.com/photos/mikeporesky/5106441340/ 
fresh & fruity - http://www.flickr.com/photos...
Nächste SlideShare
Wird geladen in …5
×

Apache Solr vs. Elasticsearch - And The Winner Is...! Ein Vergleich der Shooting Stars

3.234 Aufrufe

Veröffentlicht am

Wenn Sie Solr vs. Elasticsearch in Google eingeben, bekommen Sie eine ganze Reihe von Blogs, Artikeln, Vergleichen, Meinungen und Gedanken, die sich diesem Thema widmen. Warum sollten Sie sich dieses Webinar also anhören und ansehen? Weil keiner der Links, die Sie über Google finden, tatsächlich die aktuellen Versionen der beiden Technologien aus dem Bereich Open Source Suchmaschinen abdeckt, sondern auf teilweise sehr betagte Artikel führen. Gerade im Open Source Bereich ist Aktualität jedoch entscheidend, denn hier werden Entwicklungen in teilweise rasantem Tempo vorangetrieben.
Aber nicht nur die Tatsache, dass es sich hierbei um ein tagesaktuelles Webinar handelt, sondern auch die Tatsache, dass es zwei führende Open Source Suchserver gibt, macht die Notwendigkeit, diese beiden Projekte zu vergleichen, offensichtlich. Ist Elasticsearch ein momentaner Trend, dem man folgen sollte? In welchen Gebieten ist Apache Solr die wegweisende Technologie? Gibt es Branchen, in denen sich der Einsatz einer Technologie verbietet oder besonders anbietet? Ist Elasticsearch im Gegensatz zu Solr wirklich schemafrei und warum bringt mir das einen Vorteil? Diesen und noch mehr Fragen werden wir auf den Grund gehen, um Sie letztendlich bei der Beantwortung der Frage zu unterstützen, auf welches Pferd Sie in Ihrem Unternehmen setzen sollten.
Als neutraler Technologieberater, der Partnerschaften zu LucidWorks und Elasticsearch pflegt, sind wir in der Lage, diesen Vergleich technisch, strategisch und konzeptionell zu ziehen. Verpassen Sie diese einmalige Gelegenheit also nicht!

Veröffentlicht in: Software
  • Als Erste(r) kommentieren

Apache Solr vs. Elasticsearch - And The Winner Is...! Ein Vergleich der Shooting Stars

  1. 1. Technology Drives Business APACHE SOLR VS ELASTICSEARCH AND THE WINNER IS…! EIN VERGLEICH DER SHOOTING STARS Webinar am 6. Februar 2014 Apache Solr, Solr, Apache Lucene, Lucene and their logos are trademarks of the Apache Software Foundation. Elasticsearch, Kibana, Marvel, Logstash are trademarks of Elasticsearch BV, registered in the U.S. and in other countries.
  2. 2. UP-COMING EVENTS 13.02.2014: Setting-up Elasticsearch, Logstash, Kibana 24.02.-27.02.2014: Apache Solr Trainings (zwei Module je zwei Tage) 27.02.2014: Suche und Navigation in Online-Shops. Mit Solr und Elasticsearch 06.03.2014: Elasticsearch Monitoring mit Elasticsearch Marvel In Planung: Sentiment Analysis von Twitter Streams In Planung: Benutzerverhalten in Echtzeit analysieren In Planung: Analyse von Datenströmen & Fraud Detection In Planung: Scalable architectures for massive data acquisition & analysis 1 2 3 4 5 6 7 8
  3. 3. DANIEL WRIGLEY Consultant für Search & Big Data Technologies Computerlinguist Durch LucidWorks zertifizierter Apache Solr Trainer Autor zahlreicher Blogs und Coautor des Buchs „Einführung in Apache Solr“ @wrigley_dan
  4. 4. AGENDA Up-coming Events Vorstellung Einführung “Ease of Use” Skalierbarkeit & Architektur Suche & Features Indexierung & Datenstruktur Administration Koordination & Verwaltung Community Kommerzieller Support Ausblick And the winner is …!
  5. 5. UNSERE MISSION Seit 1994 hersteller-unabhängiges Unternehmen für IT Consulting und Software Engineering. Wir bieten Lösungen rund um Semantic Search, Big Data und Explorative Datenanalyse auf der Basis etablierter Open-Source Software. Wir stellen Werkzeuge bereit, die durch optimale Nutzung der Technologie und Daten unsere Kunden beim Erreichen ihrer Geschäftsziele unterstützen.
  6. 6. WAS WIR TUN MIT SERVICES DURCH ANWENDUNG DES KNOW-HOWS REALISIEREN LÖSUNGEN ZUR OPTIMALEN NUTZUNG VON DATEN • Strategy Consulting • Technical Consulting • Architecture Review • Development Support • Team Enablement Through Workshops and Trainings • Technology Comparison • Tuning & Troubleshooting • Migration Services • Experts to Hire • Service Level Agreements • Software Architecture • Coding Services for Java, C++/C, .NET, PHP for multiple OSs. • Continuous Integration and Test Driven Development • Managing Software Project Lifecycle • Explorative Data Analytics • Commerce Search • Identity Search • Call Center Search • Cyber Security • Website Search • Fraud Detection • Governance and Compliance UND ETABLIERTEN PRODUKTEN UND PARTNERN • Apache Solr/Lucene • Apache Mahout • Apache Hadoop, Pig, Hive • LucidWorks Search • LucidWorks Search Big Data
  7. 7. WARUM VERGLEICHEN?
  8. 8. SOLR VS ELASTICSEARCH ÄPFEL VS BIRNEN?
  9. 9. EINFÜHRUNG SOLR • NoSQL • Lucene 4.6.1 • Java • Aktuelle Version: 4.6.1 • Lizenz: Apache 2.0 • Apache Top Level Projekt • Ursprung: 2006 ELASTICSEARCH • NoSQL • Lucene 4.6.1 • Java • Aktuelle Version: 0.90.11 • Lizenz: Apache 2.0 • Gründung der Firma: 2012
  10. 10. „EASE OF USE“ Herunterladen & entpacken Starten Indexieren Alternativ Suchen 1 2 3 4 java –jar start.jar java –jar post.jar *.xml curl 'http://localhost:8983/solr/update/json?commit=true' -H 'Content-type:application/json' –d '[{"id" : "1", "title" : "Solr vs. Elasticsearch"}]' curl –XGET 'http://localhost:8983/solr/select?q=solr'
  11. 11. „EASE OF USE“ Herunterladen & entpacken Starten Indexieren Suchen 1 2 3 4 bin/elasticsearch curl –XPUT 'http://localhost:9200/webinar/comments/1' –d '{ "speaker" : "Daniel Wrigley", "comment" : "Elasticsearch is pretty easy! " }' curl -XGET 'http://localhost:9200/webinar/_search?q=speaker:wrigley'
  12. 12. „EASE OF USE“ & CLUSTER SET-UP Jeder Clusternode muss mit dem "Wissen" der Administrationseinheiten (ZooKeeper) gestartet werden java -Djetty.port=7500 -DzkHost=localhost:9983,localhost:8574,localhost:9900 -jar start.jar Administrationseinheiten erledigen den Rest
  13. 13. „EASE OF USE“ & CLUSTER SET-UP Starten weiterer Nodes durch erneute Ausführung von bin/elasticsearch Clusternodes finden sich automatisch
  14. 14. „EASE OF USE“ HIMMEL ODER HÖLLE?
  15. 15. ANFORDERUNGSPROFIL Hohe Verfügbarkeit Skalierbarkeit Features für umfangreiche Volltextsuche Fehlertoleranz Unstrukturierte Daten, unterschiedlichste Datenquellen Real Time Search
  16. 16. SKALIERBARKEIT & ARCHITEKTUR SOLR • Master/Slave Architektur • SolrCloud (ab Solr 4.0) • Collections API • Collection erstellen • Collection löschen • Collection umbenennen • Collection Aliasing • Shard Splitting ELASTICSEARCH • Cluster bestehend aus Nodes • Index API • Erstellung • Löschen • Öffnen/Schließen • Refresh
  17. 17. SUCHE & FEATURES SOLR • Grouping • Pivot Faceting • Solr Join • Spell Checking • IndexBasedSpellChecker • WordBreakSpellChecker • DirectSolrSpellChecker • FileBasedSpellChecker ELASTICSEARCH • Percolator • Histogram Facet • Nested Documents • Rescoring Einfache Termsuche, Boolesche Operatoren, Fuzzy Search, Range, Phrasen, Real Time, Sortierung, Filter, Highlighting, MoreLikeThis, Suggestions…
  18. 18. INDEXIERUNG & DATENSTRUKT. SOLR • Indexierung • UpdateHandler • XML, CSV, JSON • DataImportHandler • JDBC, XPath, HTML, PDF,… • Solr Cell • PDF, HTML,… • Atomic Update • Manipulation der Indexierung • UpdateRequestProcessor ELASTICSEARCH • JSON • River • Twitter • Wikipedia • CouchDB • RabbitMQ • Index API • Partial Update via Update API
  19. 19. INDEXIERUNG & DATENSTRUKT. SOLR • Kann schemafrei sein (Solr 4.4) • Mehr Analysemöglichkeiten • ICU Tokenizer und Filter • Document Routing beeinflussbar ELASTICSEARCH • Schemafrei • Manche Analysemöglichkeiten per Plugin "nachinstallierbar" • Document Routing beeinflussbar
  20. 20. ADMINISTRATION Ausgereiftes Admin User Interface
  21. 21. ADMINISTRATION Kein Admin User Interface vorhanden Per Plug-in nachrüstbar
  22. 22. ELASTICSEARCH MARVEL Elasticsearch Installationen bequem und sicher administrieren
  23. 23. KOORDINATION & VERWALTUNG SOLR • Läuft in einem beliebigen Servlet Container • ZooKeeper • Mehr Konfigurationsaufwand • Leichtgewichtig • Praxisbewährt • Keine Split Brain Situation ELASTICSEARCH • Läuft nur im mitgelieferten Netty • Interner Mechanismus "Zen Discovery" • Automatische Erkennung von Clusternodes • Kein zusätzliches Tool notwendig • Split Brain möglich • Cluster Stats API
  24. 24. COMMUNITY & STATS. 150 100 50 0 Committer Apache Solr Elasticsearch 150 100 50 0 Issues Apache Solr Elasticsearch 300 200 100 0 Resolved Issues Apache Solr Elasticsearch 1300 1200 1100 1000 Mails Apache Solr Elasticsearch
  25. 25. COMMUNITY & DOCS &PLUG-INS SOLR • Zahlreiche Patches • Unmengen Dokumentation vorhanden • Wiki • Reference Guide • Mailing Listen • Blogs • HowTos • Konferenzvideos ELASTICSEARCH • River Plugins • CSV, JDBC, Neo4j, … • Site Plugins • HQ, Paramedic, Head • Clustering (carrot2) • Terms Component • Dokumentation in Kinderschuhen • Aktiv bei Webinaren/Blogs
  26. 26. KOMMERZIELLER SUPPORT SOLR • LucidWorks • 24/7 SLAs • LucidWorks Search • SHI & Co. • Entwicklung • Trainings • Development Support ELASTICSEARCH • Elasticsearch • 24/7 SLAs • Trainings • Logstash und Kibana eingeschlossen • SHI & Co. • Entwicklung • Development Support
  27. 27. BACK TO THE FUTURE SOLR • Solr 5.0 • Distributed IDF • Saved Searches ≈ Percolator • Indexierung via Hadoop MapReduce • ScriptSearchComponent • Distributionen • Heliosearch • LucidWorks Search/Big Data • Logstash4Solr • Kibana4Solr ELASTICSEARCH • Elasticsearch 1.0.0 • cat API • Snapshot/Restore • Aggregations Framework • ELK: Elasticsearch, Logstash & Kibana • Marvel
  28. 28. AND THE WINNER IS…! Viele Gemeinsamkeiten Kleine, aber bedeutende Unterschiede Keine einfache Entscheidung Kleinigkeiten können den Ausschlag geben Gleichwertiger Einsatz beider Technologien möglich
  29. 29. Q & A
  30. 30. KONTAKT SHI GmbH & Co. KG Curt-Frenzel-Str. 12 D - 86167 Augsburg info@shi-gmbh.com +49.821.74 82 633 - 0 @SHIEngineers Michael Marheineke Markus Klose Daniel Wrigley
  31. 31. WEITERFÜHRENDE INFOS SHI Blog: www.shi-gmbh.com/blog/ LucidWorks Products: http://www.lucidworks.com/product-overview/ Split Brain in Elasticsearch: http://www.shi-gmbh.com/blog/split-brain-in-elastic-search/ Elasticsearch Plugins: http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/modules-plugins. html Monitoring Elasticsearch – Marvel: http://www.elasticsearch.com/marvel Download Elasticsearch/Logstash/Kibana: http://www.elasticsearch.org/overview/elkdownloads/ Heliosearch – Solr Evolved: http://heliosearch.com/ Elasticsearch: www.elasticsearch.org & www.elasticsearch.com Elasticsearch Resources: http://www.elasticsearch.org/resources/ LucidWorks: http://www.lucidworks.com/support-services/
  32. 32. BILDERNACHWEIS Fire - http://www.flickr.com/photos/mikeporesky/5106441340/ fresh & fruity - http://www.flickr.com/photos/dtron/4029692821 Heaven or Hell - http://pixabay.com/en/sky-hell-road-sign-direction-right-115393/ Do You Remember … The Future? - http://www.flickr.com/photos/jdhancock/9544541664 Lizenz: http://creativecommons.org/licenses/by/2.0/ Weitere Bilder wurden über iStockphoto.com bezogen

×