SlideShare ist ein Scribd-Unternehmen logo
1 von 23
Technology 
Drives 
Business 
WHAT‘S NEW IN 
APACHE SOLR 4.7 & 
ELASTICSEARCH 1.1 
Webinar am 27. März 2014 
Apache Solr, Solr, Apache Lucene, Lucene and their logos are trademarks of the Apache Software Foundation. 
Elasticsearch, Kibana, Marvel, Logstash are trademarks of Elasticsearch BV, registered in the U.S. and in other countries.
DANIEL WRIGLEY 
Consultant für Search & Big Data Technologies 
Computerlinguist 
Durch LucidWorks zertifizierter Apache Solr Trainer 
Autor zahlreicher Blogs und 
Coautor des Buchs „Einführung in Apache Solr“ 
@wrigley_dan
AGENDA 
Kurzvorstellung SHI 
Releaseübersicht 
What's new in Solr 4.7? 
What's new in Elasticsearch 1.0/1.1? 
Q & A
Heute 
2013 
2011 
SEIT 1994 
Hersteller-unabhängiges Unternehmen. Lösungen rund um 
Suche, Navigation und Datenanalyse mit Fokus auf Open Source. 
Partnerschaft mit 
Partnerschaft mit 
2000 Erste Projekte mit Open Source 
1994 Unternehmensgründung und Entwicklung eines Produkts
UNSERE MISSION 
Seit 1994 hersteller-unabhängiges Unternehmen für IT Consulting und Software 
Engineering. 
Wir bieten Lösungen rund um Semantic Search, Analytics und Big Data auf Basis 
etablierter Open-Source Software. 
Wir stellen Werkzeuge bereit, die durch optimale Nutzung der Technologie und Daten 
unsere Kunden beim Erreichen Ihrer Geschäftsziele unterstützen.
WAS WIR TUN 
MIT SERVICES 
DURCH 
ANWENDUNG 
DES KNOW-HOWS 
REALISIEREN 
LÖSUNGEN, 
UM DATEN 
NUTZBAR ZU 
MACHEN! 
• Strategy Consulting 
• Technical Consulting 
• Architecture Review 
• Development Support 
• Team Enablement 
Through Workshops and 
Trainings 
• Technology Comparison 
• Tuning & Troubleshooting 
• Migration Services 
• Experts to Hire 
• Service Level Agreements 
• Software Architecture 
• Coding Services for Java, 
C++/C, .NET, PHP for 
multiple OSs. 
• Continuous Integration 
and Test Driven 
Development 
• Managing Software 
Project Lifecycle 
• Commerce Search 
• Intranet Portal Search 
• Website Search 
• Search Knowledge 
Management 
• Analytics 
• Social Media Monitoring 
UND 
ETABLIERTEN 
PRODUKTEN 
UND 
PARTNERN 
• Apache Solr/Lucene 
• Apache Mahout 
• Apache Hadoop, Pig, Hive 
• LucidWorks Search 
• LucidWorks Search Big Data
IHR DRAHT ZU UNS 
SHI GmbH & Co. KG 
Curt-Frenzel-Str. 12 
D - 86167 Augsburg 
info@shi-gmbh.com 
+49.821.74 82 633 - 0 
@SHIEngineers 
Michael Marheineke Markus Klose Daniel Wrigley
RELEASEÜBERSICHT 
Solr 4.6.1 Solr 4.7.0 
"Solr 4.8 
will require Java 7" 
Januar 2014 Heute 
Elasticsearch 1.0.0 RC2 
Elasticsearch 0.90.11 
Elasticsearch 1.0.0 
Elasticsearch 1.1.0 
Elasticsearch 1.0.2 
Elasticsearch 0.90.13 
Elasticsearch 1.0.1 
Elasticsearch 0.90.12
STATUS QUO 
SOLR 
• NoSQL 
• Lucene 4.7.0 
• Java 
• Aktuelle Version: 4.7.0 
• Lizenz: Apache 2.0 
• Apache Top Level Projekt 
• Ursprung: 2006 
ELASTICSEARCH 
• NoSQL 
• Lucene 4.7.0 
• Java 
• Aktuelle Version: 1.1 
• Lizenz: Apache 2.0 
• Gründung der Firma: 2012
WHAT'S NEW IN SOLR 4.7.0? 
SimpleQueryParser 
Tri-Level CompositeId Routing 
Migration von Dokumenten zu anderen 
Collections 
SolrCloud SSL Support 
Deep Paging 
Indexierung via Hadoop MapReduce
SIMPLEQUERYPARSER 
Ähnlichkeit zu eDismax QueryParser 
Ziel: Query Handling ohne Exceptions 
Keine volle Lucene Syntax Unterstützung 
Definition der Operatoren mit q.operator 
http://localhost:8983/solr/q=clever search –terms 
&defType=simple&q.operators=WHITESPACE,NOT&qf=text description^0.5
TRI-LEVEL 
COMPOSITEID ROUTING 
Bisher: Routing mit einer Bedingung 
{"id" : "shi!1234567890", …} 
Jetzt: Mehrere Level definierbar 
{"id" : "shi!webinar!solr!1234567890", …} 
Zur Queryzeit: Ein oder mehrere route keys 
http://localhost:8983/solr/q=clever search terms&_route_=shi!solr!
DOCUMENT MIGRATION 
Migration von Dokumenten einer Collection 
zu einer anderen 
Basierend auf _route_ 
Weiterleitung von Updates zur Target- 
Collection während des Kopiervorgangs 
http://localhost:8983/solr/admin/collections?action=MIGRATE&collection= 
my_source&split.key=webinar!&target.collection=my_target
WHAT'S NEW IN 
ELASTICSEARCH 1.0/1.1? 
Aggregations Framework 
Snapshot & Restore API 
Cat API 
Tribe Nodes 
Distributed Percolator
AGGREGATIONS FRAMEWORK 
"Nächste Generation" von Facetten 
Verschachtelungen möglich 
Bucketing: 
Einteilung der Dokumentenmenge 
anhand Kriterien 
Metrics: 
Berechnungen auf extrahierten 
Feldwerten 
Einzelne oder mehrere Werte
SNAPSHOT & RESTORE API 
Backup und Wiederherstellung per API 
Unterstützung von Dateisystem und HDFS 
Repositories 
Komplettes Cluster-Backup möglich 
curl -XPOST 
"localhost:9200/_snapshot/backup/snapshot_1?wait_for_completion=true" 
Nur Wiederherstellung von geschlossenen 
Indexen
CAT API 
Erleichterung der Clusterverwaltung 
"Log-Ausgrabungen" werden durch einfache 
Aufrufe ersetzt: 
curl "localhost:9200/_cat/master" 
8FRS1XIpRTGywgwZZg8mAA DWR-MOBIL AAA.BBB.CCC.DD webinar1 
curl "localhost:9200/_cat/nodes" 
DWR-MOBIL AAA.BBB.CCC.DD 1 61 d * webinar1 
DWR-MOBIL AAA.BBB.CCC.DD 1 61 d m webinar1 
Kommandos für health, nodes, master und 
shards
FEDERATED SEARCH – 
TRIBE NODES 
Verbindung mehrerer Cluster möglich 
Koordination von Cluster-Events 
Cluster übergreifende Suchen 
Cluster übergreifendes Monitoring mit 
Marvel
BACK TO THE FUTURE 
SOLR 
• Solr 5.0 
• Distributed IDF 
• Saved Searches ≈ Percolator 
• ScriptSearchComponent 
• AnalyticsComponent 
• Java 7 
• Distributionen 
• Heliosearch 
• LucidWorks Search/Big Data 
• SiLK: Solr, Logstash, Kibana 
ELASTICSEARCH 
• ELK: 
Elasticsearch, Logstash & 
Kibana 
• Marvel 
• Langfristig: Analytics, Data 
Mining, Machine Learning
Q & A
KONTAKT 
SHI GmbH & Co. KG 
Curt-Frenzel-Str. 12 
D - 86167 Augsburg 
info@shi-gmbh.com 
+49.821.74 82 633 - 0 
@SHIEngineers 
Michael Marheineke Markus Klose Daniel Wrigley
WEITERFÜHRENDE INFOS 
SHI Blog: www.shi-gmbh.com/blog/ 
LucidWorks Products: http://www.lucidworks.com/product-overview/ 
Monitoring Elasticsearch – Marvel: http://www.elasticsearch.com/marvel 
Download Elasticsearch/Logstash/Kibana: http://www.elasticsearch.org/overview/elkdownloads/ 
Heliosearch – Solr Evolved: http://heliosearch.com/ 
Heliosearch – Solr 4.7 Features - http://heliosearch.org/solr-4-7-features/ 
Elasticsearch: www.elasticsearch.org & www.elasticsearch.com 
Elasticsearch Resources: http://www.elasticsearch.org/resources/ 
LucidWorks: http://www.lucidworks.com/support-services/ 
SiLK: http://www.lucidworks.com/lucidworks-silk/
BILDERNACHWEIS 
Do You Remember … The Future? - http://www.flickr.com/photos/jdhancock/9544541664 
Lizenz: http://creativecommons.org/licenses/by/2.0/ 
Weitere Bilder wurden über iStockphoto.com bezogen

Weitere ähnliche Inhalte

Andere mochten auch

Unipaces Academy Ambassador Application
Unipaces Academy Ambassador ApplicationUnipaces Academy Ambassador Application
Unipaces Academy Ambassador ApplicationCamille Gautier
 
OLIMPÍADAS NA CONVERGÊNCIA
OLIMPÍADAS NA CONVERGÊNCIAOLIMPÍADAS NA CONVERGÊNCIA
OLIMPÍADAS NA CONVERGÊNCIAL T
 
1. rol del ingeniero del software
1.  rol del ingeniero del software1.  rol del ingeniero del software
1. rol del ingeniero del softwareLeticia Maiza Lmk
 
Presentación
PresentaciónPresentación
Presentaciónaixika12
 
Daisy_Roy_Resume.doc (1)
Daisy_Roy_Resume.doc (1)Daisy_Roy_Resume.doc (1)
Daisy_Roy_Resume.doc (1)Daisy Roy
 
Aspectos generales areas problematicas escolares. (autoguardado)
Aspectos generales areas problematicas escolares. (autoguardado)Aspectos generales areas problematicas escolares. (autoguardado)
Aspectos generales areas problematicas escolares. (autoguardado)yezidangel
 
Grupo 9 crisis y educación
Grupo 9   crisis y educaciónGrupo 9   crisis y educación
Grupo 9 crisis y educaciónMarcoswp11
 
FundAppealLetter2015MAINPDF
FundAppealLetter2015MAINPDFFundAppealLetter2015MAINPDF
FundAppealLetter2015MAINPDFJoyce Hamill
 
ZUMO Colaboratorio Cultural
ZUMO Colaboratorio CulturalZUMO Colaboratorio Cultural
ZUMO Colaboratorio CulturalFabiola Salazar
 
CAPITULO 4. FUNDAMENTOS DE SOFTWARE: EL FANTASMA DE LA MÁQUINA
CAPITULO 4. FUNDAMENTOS DE SOFTWARE: EL FANTASMA DE LA MÁQUINACAPITULO 4. FUNDAMENTOS DE SOFTWARE: EL FANTASMA DE LA MÁQUINA
CAPITULO 4. FUNDAMENTOS DE SOFTWARE: EL FANTASMA DE LA MÁQUINAJake Naranjo
 
poverty in pakistan by kamran khan
poverty in pakistan by kamran khanpoverty in pakistan by kamran khan
poverty in pakistan by kamran khankamran khan
 
Fundamentos de Ingenieria de Software - Unidad 1 modelo de negocios
Fundamentos de Ingenieria de Software - Unidad 1 modelo de negociosFundamentos de Ingenieria de Software - Unidad 1 modelo de negocios
Fundamentos de Ingenieria de Software - Unidad 1 modelo de negociosJosé Antonio Sandoval Acosta
 

Andere mochten auch (20)

Unipaces Academy Ambassador Application
Unipaces Academy Ambassador ApplicationUnipaces Academy Ambassador Application
Unipaces Academy Ambassador Application
 
Promoción de la salud: SIDA
Promoción de la salud: SIDAPromoción de la salud: SIDA
Promoción de la salud: SIDA
 
Electrocompresores
ElectrocompresoresElectrocompresores
Electrocompresores
 
Fiesta del inmigrante 2014, Chascomús.
Fiesta del inmigrante 2014, Chascomús. Fiesta del inmigrante 2014, Chascomús.
Fiesta del inmigrante 2014, Chascomús.
 
OLIMPÍADAS NA CONVERGÊNCIA
OLIMPÍADAS NA CONVERGÊNCIAOLIMPÍADAS NA CONVERGÊNCIA
OLIMPÍADAS NA CONVERGÊNCIA
 
1. rol del ingeniero del software
1.  rol del ingeniero del software1.  rol del ingeniero del software
1. rol del ingeniero del software
 
Presentación
PresentaciónPresentación
Presentación
 
Daisy_Roy_Resume.doc (1)
Daisy_Roy_Resume.doc (1)Daisy_Roy_Resume.doc (1)
Daisy_Roy_Resume.doc (1)
 
Aspectos generales areas problematicas escolares. (autoguardado)
Aspectos generales areas problematicas escolares. (autoguardado)Aspectos generales areas problematicas escolares. (autoguardado)
Aspectos generales areas problematicas escolares. (autoguardado)
 
Grupo 9 crisis y educación
Grupo 9   crisis y educaciónGrupo 9   crisis y educación
Grupo 9 crisis y educación
 
La web 2.0
La web 2.0La web 2.0
La web 2.0
 
Historia de Linux
Historia de LinuxHistoria de Linux
Historia de Linux
 
FundAppealLetter2015MAINPDF
FundAppealLetter2015MAINPDFFundAppealLetter2015MAINPDF
FundAppealLetter2015MAINPDF
 
ZUMO Colaboratorio Cultural
ZUMO Colaboratorio CulturalZUMO Colaboratorio Cultural
ZUMO Colaboratorio Cultural
 
Introduction to Social business
Introduction to Social businessIntroduction to Social business
Introduction to Social business
 
CAPITULO 4. FUNDAMENTOS DE SOFTWARE: EL FANTASMA DE LA MÁQUINA
CAPITULO 4. FUNDAMENTOS DE SOFTWARE: EL FANTASMA DE LA MÁQUINACAPITULO 4. FUNDAMENTOS DE SOFTWARE: EL FANTASMA DE LA MÁQUINA
CAPITULO 4. FUNDAMENTOS DE SOFTWARE: EL FANTASMA DE LA MÁQUINA
 
poverty in pakistan by kamran khan
poverty in pakistan by kamran khanpoverty in pakistan by kamran khan
poverty in pakistan by kamran khan
 
Components of a gis
Components of a gisComponents of a gis
Components of a gis
 
Manual GLPI 0.90.3
Manual GLPI 0.90.3Manual GLPI 0.90.3
Manual GLPI 0.90.3
 
Fundamentos de Ingenieria de Software - Unidad 1 modelo de negocios
Fundamentos de Ingenieria de Software - Unidad 1 modelo de negociosFundamentos de Ingenieria de Software - Unidad 1 modelo de negocios
Fundamentos de Ingenieria de Software - Unidad 1 modelo de negocios
 

Ähnlich wie What’s new in Apache Solr 4.7 und Elasticsearch 1.1

Apache Solr vs. Elasticsearch - And The Winner Is...! Ein Vergleich der Shoot...
Apache Solr vs. Elasticsearch - And The Winner Is...! Ein Vergleich der Shoot...Apache Solr vs. Elasticsearch - And The Winner Is...! Ein Vergleich der Shoot...
Apache Solr vs. Elasticsearch - And The Winner Is...! Ein Vergleich der Shoot...SHI Search | Analytics | Big Data
 
OpenNebula - CeBIT 2013
OpenNebula - CeBIT 2013OpenNebula - CeBIT 2013
OpenNebula - CeBIT 2013NETWAYS
 
OpenNebula - LinuxTag 2013
OpenNebula - LinuxTag 2013OpenNebula - LinuxTag 2013
OpenNebula - LinuxTag 2013NETWAYS
 
20160310_ModernApplicationDevelopment_NoSQL_KPatenge
20160310_ModernApplicationDevelopment_NoSQL_KPatenge20160310_ModernApplicationDevelopment_NoSQL_KPatenge
20160310_ModernApplicationDevelopment_NoSQL_KPatengeKarin Patenge
 
Hadoop Einführung @codecentric
Hadoop Einführung @codecentricHadoop Einführung @codecentric
Hadoop Einführung @codecentricimalik8088
 
Azure SQL Database vs. Azure SQL Data Warehouse
Azure SQL Database vs. Azure SQL Data WarehouseAzure SQL Database vs. Azure SQL Data Warehouse
Azure SQL Database vs. Azure SQL Data WarehousepmOne Analytics GmbH
 
Big Data Konnektivität
Big Data KonnektivitätBig Data Konnektivität
Big Data KonnektivitätTrivadis
 
Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?
Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?
Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?inovex GmbH
 
Suche und Navigation in Online-Shops. Mit Apache Solr und Elasticsearch
Suche und Navigation in Online-Shops. Mit Apache Solr und ElasticsearchSuche und Navigation in Online-Shops. Mit Apache Solr und Elasticsearch
Suche und Navigation in Online-Shops. Mit Apache Solr und ElasticsearchSHI Search | Analytics | Big Data
 
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?KurtStockinger
 
A NoSQL Summer - The Year After
A NoSQL Summer - The Year AfterA NoSQL Summer - The Year After
A NoSQL Summer - The Year AfterMeMo News AG
 
Oracle Database 12c Release 2
Oracle Database 12c Release 2 Oracle Database 12c Release 2
Oracle Database 12c Release 2 oraclebudb
 
Überblick zu Oracle Database 12c Release 2
Überblick zu Oracle Database 12c Release 2Überblick zu Oracle Database 12c Release 2
Überblick zu Oracle Database 12c Release 2Ulrike Schwinn
 
Agile Oracle database modeling and development - APEX Connect 2020
Agile Oracle database modeling and development - APEX Connect 2020Agile Oracle database modeling and development - APEX Connect 2020
Agile Oracle database modeling and development - APEX Connect 2020Torsten Kleiber
 
Azure für SysAdmins Eine Reise durch die Cloud v.0.5
Azure für SysAdmins   Eine Reise durch die Cloud v.0.5 Azure für SysAdmins   Eine Reise durch die Cloud v.0.5
Azure für SysAdmins Eine Reise durch die Cloud v.0.5 Oliver Michalski
 
Oracle Technology Monthly Oktober 2017
Oracle Technology Monthly Oktober 2017Oracle Technology Monthly Oktober 2017
Oracle Technology Monthly Oktober 2017oraclebudb
 
Volltextsuche mit Lucene und Solr
Volltextsuche mit Lucene und SolrVolltextsuche mit Lucene und Solr
Volltextsuche mit Lucene und SolrThomas Koch
 

Ähnlich wie What’s new in Apache Solr 4.7 und Elasticsearch 1.1 (20)

Apache Solr vs. Elasticsearch - And The Winner Is...! Ein Vergleich der Shoot...
Apache Solr vs. Elasticsearch - And The Winner Is...! Ein Vergleich der Shoot...Apache Solr vs. Elasticsearch - And The Winner Is...! Ein Vergleich der Shoot...
Apache Solr vs. Elasticsearch - And The Winner Is...! Ein Vergleich der Shoot...
 
OpenNebula - CeBIT 2013
OpenNebula - CeBIT 2013OpenNebula - CeBIT 2013
OpenNebula - CeBIT 2013
 
OpenNebula - LinuxTag 2013
OpenNebula - LinuxTag 2013OpenNebula - LinuxTag 2013
OpenNebula - LinuxTag 2013
 
20160310_ModernApplicationDevelopment_NoSQL_KPatenge
20160310_ModernApplicationDevelopment_NoSQL_KPatenge20160310_ModernApplicationDevelopment_NoSQL_KPatenge
20160310_ModernApplicationDevelopment_NoSQL_KPatenge
 
Hadoop Einführung @codecentric
Hadoop Einführung @codecentricHadoop Einführung @codecentric
Hadoop Einführung @codecentric
 
Azure SQL Database vs. Azure SQL Data Warehouse
Azure SQL Database vs. Azure SQL Data WarehouseAzure SQL Database vs. Azure SQL Data Warehouse
Azure SQL Database vs. Azure SQL Data Warehouse
 
Big Data Konnektivität
Big Data KonnektivitätBig Data Konnektivität
Big Data Konnektivität
 
Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?
Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?
Wer gewinnt das SQL-Rennen auf der Hadoop-Strecke?
 
Suche und Navigation in Online-Shops. Mit Apache Solr und Elasticsearch
Suche und Navigation in Online-Shops. Mit Apache Solr und ElasticsearchSuche und Navigation in Online-Shops. Mit Apache Solr und Elasticsearch
Suche und Navigation in Online-Shops. Mit Apache Solr und Elasticsearch
 
DSpace 5 und Linked (Open) Data
DSpace 5 und Linked (Open) DataDSpace 5 und Linked (Open) Data
DSpace 5 und Linked (Open) Data
 
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
 
A NoSQL Summer - The Year After
A NoSQL Summer - The Year AfterA NoSQL Summer - The Year After
A NoSQL Summer - The Year After
 
Oracle Database 12c Release 2
Oracle Database 12c Release 2 Oracle Database 12c Release 2
Oracle Database 12c Release 2
 
Überblick zu Oracle Database 12c Release 2
Überblick zu Oracle Database 12c Release 2Überblick zu Oracle Database 12c Release 2
Überblick zu Oracle Database 12c Release 2
 
Agile Oracle database modeling and development - APEX Connect 2020
Agile Oracle database modeling and development - APEX Connect 2020Agile Oracle database modeling and development - APEX Connect 2020
Agile Oracle database modeling and development - APEX Connect 2020
 
Enterprise Java on Steroids
Enterprise Java on SteroidsEnterprise Java on Steroids
Enterprise Java on Steroids
 
Azure für SysAdmins Eine Reise durch die Cloud v.0.5
Azure für SysAdmins   Eine Reise durch die Cloud v.0.5 Azure für SysAdmins   Eine Reise durch die Cloud v.0.5
Azure für SysAdmins Eine Reise durch die Cloud v.0.5
 
Oracle Technology Monthly Oktober 2017
Oracle Technology Monthly Oktober 2017Oracle Technology Monthly Oktober 2017
Oracle Technology Monthly Oktober 2017
 
Apache Solr - die Moderne Open Source Technologie
Apache Solr - die Moderne Open Source TechnologieApache Solr - die Moderne Open Source Technologie
Apache Solr - die Moderne Open Source Technologie
 
Volltextsuche mit Lucene und Solr
Volltextsuche mit Lucene und SolrVolltextsuche mit Lucene und Solr
Volltextsuche mit Lucene und Solr
 

Mehr von SHI Search | Analytics | Big Data

Mehr von SHI Search | Analytics | Big Data (10)

Buzzword Bingo E-Commerce
Buzzword Bingo E-CommerceBuzzword Bingo E-Commerce
Buzzword Bingo E-Commerce
 
E commerce-tag berlin-nichts_im_sortiment_gefunden
E commerce-tag berlin-nichts_im_sortiment_gefundenE commerce-tag berlin-nichts_im_sortiment_gefunden
E commerce-tag berlin-nichts_im_sortiment_gefunden
 
Mit Customer-Journey-Analytics und Recommendations neue Potenziale erschließen
Mit Customer-Journey-Analytics und Recommendations neue Potenziale erschließenMit Customer-Journey-Analytics und Recommendations neue Potenziale erschließen
Mit Customer-Journey-Analytics und Recommendations neue Potenziale erschließen
 
Neue Potentiale durch Recommendations erschliessen und Conversions steigern (...
Neue Potentiale durch Recommendations erschliessen und Conversions steigern (...Neue Potentiale durch Recommendations erschliessen und Conversions steigern (...
Neue Potentiale durch Recommendations erschliessen und Conversions steigern (...
 
Neue Kundenpotenziale durch Recommendations erschließen (Vortrag E-Commerce Tag)
Neue Kundenpotenziale durch Recommendations erschließen (Vortrag E-Commerce Tag)Neue Kundenpotenziale durch Recommendations erschließen (Vortrag E-Commerce Tag)
Neue Kundenpotenziale durch Recommendations erschließen (Vortrag E-Commerce Tag)
 
Custom Solr Tokenizer Flexible Tokenizer with JFlex
Custom Solr Tokenizer Flexible Tokenizer with JFlex Custom Solr Tokenizer Flexible Tokenizer with JFlex
Custom Solr Tokenizer Flexible Tokenizer with JFlex
 
Mehr Umsatz mit einer intelligenten Shop-Suche
Mehr Umsatz mit einer intelligenten Shop-SucheMehr Umsatz mit einer intelligenten Shop-Suche
Mehr Umsatz mit einer intelligenten Shop-Suche
 
Überblick über die Suchplattform LucidWorks Search 2.1
Überblick über die Suchplattform LucidWorks Search 2.1Überblick über die Suchplattform LucidWorks Search 2.1
Überblick über die Suchplattform LucidWorks Search 2.1
 
Relevantes schneller finden – mit-Lucene und Solr
Relevantes schneller finden – mit-Lucene und SolrRelevantes schneller finden – mit-Lucene und Solr
Relevantes schneller finden – mit-Lucene und Solr
 
Jax 2012 - Apache Solr as Enterprise Search Platform
Jax 2012 - Apache Solr as Enterprise Search PlatformJax 2012 - Apache Solr as Enterprise Search Platform
Jax 2012 - Apache Solr as Enterprise Search Platform
 

What’s new in Apache Solr 4.7 und Elasticsearch 1.1

  • 1. Technology Drives Business WHAT‘S NEW IN APACHE SOLR 4.7 & ELASTICSEARCH 1.1 Webinar am 27. März 2014 Apache Solr, Solr, Apache Lucene, Lucene and their logos are trademarks of the Apache Software Foundation. Elasticsearch, Kibana, Marvel, Logstash are trademarks of Elasticsearch BV, registered in the U.S. and in other countries.
  • 2. DANIEL WRIGLEY Consultant für Search & Big Data Technologies Computerlinguist Durch LucidWorks zertifizierter Apache Solr Trainer Autor zahlreicher Blogs und Coautor des Buchs „Einführung in Apache Solr“ @wrigley_dan
  • 3. AGENDA Kurzvorstellung SHI Releaseübersicht What's new in Solr 4.7? What's new in Elasticsearch 1.0/1.1? Q & A
  • 4. Heute 2013 2011 SEIT 1994 Hersteller-unabhängiges Unternehmen. Lösungen rund um Suche, Navigation und Datenanalyse mit Fokus auf Open Source. Partnerschaft mit Partnerschaft mit 2000 Erste Projekte mit Open Source 1994 Unternehmensgründung und Entwicklung eines Produkts
  • 5. UNSERE MISSION Seit 1994 hersteller-unabhängiges Unternehmen für IT Consulting und Software Engineering. Wir bieten Lösungen rund um Semantic Search, Analytics und Big Data auf Basis etablierter Open-Source Software. Wir stellen Werkzeuge bereit, die durch optimale Nutzung der Technologie und Daten unsere Kunden beim Erreichen Ihrer Geschäftsziele unterstützen.
  • 6. WAS WIR TUN MIT SERVICES DURCH ANWENDUNG DES KNOW-HOWS REALISIEREN LÖSUNGEN, UM DATEN NUTZBAR ZU MACHEN! • Strategy Consulting • Technical Consulting • Architecture Review • Development Support • Team Enablement Through Workshops and Trainings • Technology Comparison • Tuning & Troubleshooting • Migration Services • Experts to Hire • Service Level Agreements • Software Architecture • Coding Services for Java, C++/C, .NET, PHP for multiple OSs. • Continuous Integration and Test Driven Development • Managing Software Project Lifecycle • Commerce Search • Intranet Portal Search • Website Search • Search Knowledge Management • Analytics • Social Media Monitoring UND ETABLIERTEN PRODUKTEN UND PARTNERN • Apache Solr/Lucene • Apache Mahout • Apache Hadoop, Pig, Hive • LucidWorks Search • LucidWorks Search Big Data
  • 7. IHR DRAHT ZU UNS SHI GmbH & Co. KG Curt-Frenzel-Str. 12 D - 86167 Augsburg info@shi-gmbh.com +49.821.74 82 633 - 0 @SHIEngineers Michael Marheineke Markus Klose Daniel Wrigley
  • 8. RELEASEÜBERSICHT Solr 4.6.1 Solr 4.7.0 "Solr 4.8 will require Java 7" Januar 2014 Heute Elasticsearch 1.0.0 RC2 Elasticsearch 0.90.11 Elasticsearch 1.0.0 Elasticsearch 1.1.0 Elasticsearch 1.0.2 Elasticsearch 0.90.13 Elasticsearch 1.0.1 Elasticsearch 0.90.12
  • 9. STATUS QUO SOLR • NoSQL • Lucene 4.7.0 • Java • Aktuelle Version: 4.7.0 • Lizenz: Apache 2.0 • Apache Top Level Projekt • Ursprung: 2006 ELASTICSEARCH • NoSQL • Lucene 4.7.0 • Java • Aktuelle Version: 1.1 • Lizenz: Apache 2.0 • Gründung der Firma: 2012
  • 10. WHAT'S NEW IN SOLR 4.7.0? SimpleQueryParser Tri-Level CompositeId Routing Migration von Dokumenten zu anderen Collections SolrCloud SSL Support Deep Paging Indexierung via Hadoop MapReduce
  • 11. SIMPLEQUERYPARSER Ähnlichkeit zu eDismax QueryParser Ziel: Query Handling ohne Exceptions Keine volle Lucene Syntax Unterstützung Definition der Operatoren mit q.operator http://localhost:8983/solr/q=clever search –terms &defType=simple&q.operators=WHITESPACE,NOT&qf=text description^0.5
  • 12. TRI-LEVEL COMPOSITEID ROUTING Bisher: Routing mit einer Bedingung {"id" : "shi!1234567890", …} Jetzt: Mehrere Level definierbar {"id" : "shi!webinar!solr!1234567890", …} Zur Queryzeit: Ein oder mehrere route keys http://localhost:8983/solr/q=clever search terms&_route_=shi!solr!
  • 13. DOCUMENT MIGRATION Migration von Dokumenten einer Collection zu einer anderen Basierend auf _route_ Weiterleitung von Updates zur Target- Collection während des Kopiervorgangs http://localhost:8983/solr/admin/collections?action=MIGRATE&collection= my_source&split.key=webinar!&target.collection=my_target
  • 14. WHAT'S NEW IN ELASTICSEARCH 1.0/1.1? Aggregations Framework Snapshot & Restore API Cat API Tribe Nodes Distributed Percolator
  • 15. AGGREGATIONS FRAMEWORK "Nächste Generation" von Facetten Verschachtelungen möglich Bucketing: Einteilung der Dokumentenmenge anhand Kriterien Metrics: Berechnungen auf extrahierten Feldwerten Einzelne oder mehrere Werte
  • 16. SNAPSHOT & RESTORE API Backup und Wiederherstellung per API Unterstützung von Dateisystem und HDFS Repositories Komplettes Cluster-Backup möglich curl -XPOST "localhost:9200/_snapshot/backup/snapshot_1?wait_for_completion=true" Nur Wiederherstellung von geschlossenen Indexen
  • 17. CAT API Erleichterung der Clusterverwaltung "Log-Ausgrabungen" werden durch einfache Aufrufe ersetzt: curl "localhost:9200/_cat/master" 8FRS1XIpRTGywgwZZg8mAA DWR-MOBIL AAA.BBB.CCC.DD webinar1 curl "localhost:9200/_cat/nodes" DWR-MOBIL AAA.BBB.CCC.DD 1 61 d * webinar1 DWR-MOBIL AAA.BBB.CCC.DD 1 61 d m webinar1 Kommandos für health, nodes, master und shards
  • 18. FEDERATED SEARCH – TRIBE NODES Verbindung mehrerer Cluster möglich Koordination von Cluster-Events Cluster übergreifende Suchen Cluster übergreifendes Monitoring mit Marvel
  • 19. BACK TO THE FUTURE SOLR • Solr 5.0 • Distributed IDF • Saved Searches ≈ Percolator • ScriptSearchComponent • AnalyticsComponent • Java 7 • Distributionen • Heliosearch • LucidWorks Search/Big Data • SiLK: Solr, Logstash, Kibana ELASTICSEARCH • ELK: Elasticsearch, Logstash & Kibana • Marvel • Langfristig: Analytics, Data Mining, Machine Learning
  • 20. Q & A
  • 21. KONTAKT SHI GmbH & Co. KG Curt-Frenzel-Str. 12 D - 86167 Augsburg info@shi-gmbh.com +49.821.74 82 633 - 0 @SHIEngineers Michael Marheineke Markus Klose Daniel Wrigley
  • 22. WEITERFÜHRENDE INFOS SHI Blog: www.shi-gmbh.com/blog/ LucidWorks Products: http://www.lucidworks.com/product-overview/ Monitoring Elasticsearch – Marvel: http://www.elasticsearch.com/marvel Download Elasticsearch/Logstash/Kibana: http://www.elasticsearch.org/overview/elkdownloads/ Heliosearch – Solr Evolved: http://heliosearch.com/ Heliosearch – Solr 4.7 Features - http://heliosearch.org/solr-4-7-features/ Elasticsearch: www.elasticsearch.org & www.elasticsearch.com Elasticsearch Resources: http://www.elasticsearch.org/resources/ LucidWorks: http://www.lucidworks.com/support-services/ SiLK: http://www.lucidworks.com/lucidworks-silk/
  • 23. BILDERNACHWEIS Do You Remember … The Future? - http://www.flickr.com/photos/jdhancock/9544541664 Lizenz: http://creativecommons.org/licenses/by/2.0/ Weitere Bilder wurden über iStockphoto.com bezogen

Hinweis der Redaktion

  1. Agenda erst so spät????
  2. Deutsche Folien?
  3. Wenn Interesse an Fortsetzungen bzw. bestimmten verwandten Themen besteht, können Sie uns gerne schreiben. Es ist durchaus möglich, dass es ein weiteres Webinar aus dieser Reihe gibt. Wir verfolgen Ideen von Zuhörern natürlich gerne weiter, denn dort wissen wir schon sicher von Interessenten. Wenn es Themen gibt, die eher technischer Natur sind und arg in die Tiefe gehen, kann es sein, dass "nur" ein Blog-Beitrag veröffentlicht wird.
  4. SSL Support: Zusätzliche Sicherheitsmaßnahme in der SolrCloud Deep Paging: Bedeutung: Man definiert einen start-Parameter mit einem sehr hohen Wert.  ineffizient, wenn man die "normale" Paging-Funktion verwendet. Zusätzlicher Drawback in verteilten Systemen. Diesen beiden Deep Paging Probleme wurde entgegen gewirkt, indem man mit Cursor-Markierungen arbeitet und nicht mehr mit dem start-Parameter.  Performance-Optimierung  Benchmarks auf dem Heliosearch-Blog Indexierung via Hadoop MapReduce: Wenn bereits die Verarbeitung großer Datenmengen mit Hadoop MapReduce Jobs stattfindet, ist es jetzt eine wesentliche Erleichterung, denn: Im HDFS Verarbeitete Daten müssen nicht mehr exportiert und umgewandelt werden, um sie mit Solr zu indexieren. Die Indexierung kann direkt im HDFS via MapReduce stattfinden. Ebenfalls ist kein neuer Export nötig, wenn neu indexiert werden muss.
  5. defType=simple  Verwende SimpleQueryParser q.operators=WHITESPACE,NOT  WHITESPACE sorgt dafür, dass das MINUS als Operator gesehen wird, NOT sorgt dafür, dass das MINUS der NOT Operator ist
  6. Letztes Beispiel: Dokument muss mit beiden route keys indexiert worden sein. Hashwert wird über beide Keys generiert So kann man also semantisch gesehen z.B. alle Dokumente von SHI suchen, die etwas mit Solr zu tun haben und "clever search terms" beinhalten.
  7. Dokumente nach Commit durchsuchbar und auffindbar Der letzte Monat enthält die Dokumente, die per Default durchsucht werden sollen. Das heißt, die Dokumente des vergangenen Monats können mit dieser Methode einfach verschoben werden.
  8. Verschachtelungen nur bei Bucketing möglich, nicht bei Metrics!  Bucket Aggregations können weiter aggregiert werden, Metrics nicht Bis vor zwei Monaten war es bei ES nicht möglich Gruppierungen durchzuführen. Jetzt hat ES Solr überholt und Solr muss wiederum nachziehen. Es gibt im Trunk aber bereits eine sog. AnalyticsComponent, durch die Solr nachziehen wird. Analytics Use Case wird weiter ausgebaut Möglichkeiten bisher: sum,
  9. In Zukunft soll eine Wiederherstellung von read-only Indexen möglich sein. Aktuell können nur Indexe wiederhergestellt werden, die vorher geschlossen wurden. Inkrementelle Arbeitsweise. Es werden nur Dateien gesichert bzw. wiederhergestellt.
  10. Wenn Interesse an Fortsetzungen bzw. bestimmten verwandten Themen besteht, können Sie uns gerne schreiben. Es ist durchaus möglich, dass es ein weiteres Webinar aus dieser Reihe gibt. Wir verfolgen Ideen von Zuhörern natürlich gerne weiter, denn dort wissen wir schon sicher von Interessenten. Wenn es Themen gibt, die eher technischer Natur sind und arg in die Tiefe gehen, kann es sein, dass "nur" ein Blog-Beitrag veröffentlicht wird.