SlideShare ist ein Scribd-Unternehmen logo
1 von 57
Downloaden Sie, um offline zu lesen
Lucene's Welt:
                     Ordnen,
                      Finden,
                       Klassifizieren
                                                 JAX, 2012

                                                      Andrew Kenworthy
                                                      Christian Meder
                                                      inovex GmbH
19.04.2012    Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   1
Speaker


                                                Andrew Kenworthy
                                                Schwerpunkte
                                                
                                                  Business Intelligence
                                                
                                                  Java
                                                
                                                  Solr
                                                
                                                  Hadoop
                                                andrew.kenworthy@inovex.de


19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   2
Speaker
                                                Christian Meder
                                                Schwerpunkte
                                                
                                                  open source (free
                                                software)
                                                
                                                  Linux
                                                
                                                  Web
                                                
                                                  Java
                                                
                                                  Android
                                                
                                                  CTO@inovex
                                                        Christian Meder
19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   3
Agenda

                                                     
                                                       Motivation
                                                     
                                                       Beispiele
                                                     
                                                       Projektübersicht
                                                     
                                                       Projekte
                                                     
                                                       Möglichkeiten
                                                     
                                                       Bewertung



19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   4
Motivation

19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   5
Motivation
        Google klassisch (2010)




19.04.2012     Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   6
Motivation
        Google klassisch (2010)




       Relevanz



19.04.2012     Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   7
Motivation
        Google klassisch (2010)




       Snippets

   Autovervollstaendigung


19.04.2012     Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   8
Motivation
        Google klassisch (2010)


     Antwortzeiten
     Spellchecker

     Aehnliche Seiten (More like this)

19.04.2012     Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   9
Motivation
        Google Evolution (2011)




19.04.2012     Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   10
Motivation
        Google Evolution (2011)




       Facetten
  Instant Search                                         Vorschau
19.04.2012     Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   11
Motivation
        Google Evolution (2011)




19.04.2012     Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   12
Motivation
        Google Evolution (2011)




                   Facetten


19.04.2012     Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   13
Motivation
        Google Evolution (2012)




                                                                                 SPYW
19.04.2012     Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   14
Motivation
        Google Evolution (2012)




                 SPYW
19.04.2012     Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   15
Motivation
        Amazon




19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   16
Motivation
       usability.de




 „Die Aussage eines Probanden bei einem Usability-Test
 einer Faceted Search Lösung im Rahmen dieser Studie ist
 damit richtungsweisend:

 „Mit dem Filter hier habe ich das Gefühl, dass
 selbst eine schnöde Suche richtig Spaß
 machen kann.””

 Quelle: Faceted Search: Die neue Suche im Usability-Test (zum
 kostenlosen Download unter http://usability.de)
19.04.2012     Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   17
Motivation
       osscensus.org
                                            Rank        Package                Installs
                                            1           firefox                3761           82%
                                            2           zlib                   3118           67%
                                            3           wget                   3000           65%
                                            4           xerces                 2494           54%
                                            5           prototype              2450           53%
                                            6           eclipse                2428           52%
                                            7           c.-logging             2423           52%
                                            8           docbook-xml            1692           52%
                                            9           lucene                 2394           52%
                                            10          xalan                  2363           51%
                                            11          commons-lang           2349           51%
                                            12          wsdl4j                 2242           48%
                                            13          tk                     1557           48%
                                            14          samba                  1554           48%
                                            15          activation             2175           47%

19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.         18
Beispiele

19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   19
Beispiele
       Ebay Kleinanzeigen




19.04.2012    Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   20
Beispiele
       Ebay Kleinanzeigen (aus Olaf Zschiedrich solr@ebay Kleinanzeigen)

  Site metrics:
  • ~ 3.2 M active ads
  • 16 – 24 M PVs per day
  • Peak hours = 1.8 M PVs (~ 500 PVs per
  second)
  Solr request metrics:
  • ~ 60 M requests per day
  • Peak hours = ~ 1500 request per second
  Avg. response time
  • 20 ms (search) and 3 ms for auto-suggest
19.04.2012    Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   21
Beispiele
       Ebay Kleinanzeigen (aus Olaf Zschiedrich solr@ebay Kleinanzeigen)

  • 2 datacenters
  • 1 Master + 6 Slaves per datacenter
  Slaves show very low resource consumption. Could go down
  to 4
  slaves per datacenter while still having 50% overcapacity
  • Master only used for indexing
  • Load balancer in front of slaves
  • Varnish in front of slaves (for dedicated use
  cases)
  • Working closely with SITE-OPS Team
  • DEV-OPS are part of development process
19.04.2012    Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   22
Beispiele
       ElasticSearch




                      
                        IGN's search
                      
                        10 nodes / 2 clusters
                      
                        56 M documents
                      
                        Scala over TCP
                      
                        PHP/JS over HTTP
                      
                        ~5k rpm


19.04.2012    Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   23
Beispiele
       ElasticSearch




                      
                        Sonian Inc.
                      
                        Cloud electronic document search
                      
                        20+ cluster
                      
                        5 billion documents
                      
                        Index into 100s TB



19.04.2012    Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   24
Projektuebersicht

19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   25
Projektübersicht
       Lucene


   
     Lucene: Suchbibliothek
   
     Solr: Suchserver
   
     Nutch: Crawler
   
     Tika: Inhaltsanalyse
   
     ElasticSearch (Compass): Suchserver
   
     Mahout: Machine Learning
   
     ManifoldCF: Repository Connectors
   (incubation)

19.04.2012      Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   26
Projekte

19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   27
Architektur
       Indizierung

 Inhalte


                                                                                                 Solr
             Bereitstellung



                               Aufbereitung


                                                                                           Lucene
                                                 Analyse


                                                                 Indizierung


                                                                                         Index

19.04.2012      Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.      28
Projekte
       Lucene
                                           
                                               Information Retrieval
                                           Bibliothek
                                           
                                               Kern einer Sucharchitektur
                                           
                                               effizient
                                           
                                               skalierbar
                                           
                                               Viele Ports: .Net, C, Python
                                           
                                               Vielfach integriert in
                                           Produkte
19.04.2012      Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   29
Historie
       Lucene


   
     0.01 (2000) Doug Cutting
   
     1.2 (2002) Apache Jakarta Projekt
   
     - 2.9 (2009) Sortieren, Datums- und
   Zahlenfelder, Bereichsfelder, near realtime
   search, neue Analyzer, ...
   
     3.0 (2009) cleanup release, deprecations
   
     3.1 - 3.6 (2011/2012) performance,
   grouping, autocomplete Verbesserungen,
   facet, join, ...
19.04.2012      Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   30
Projekte
       Solr

                                         
                                             Enterprise Suchserver
                                         
                                             XML über HTTP
                                         
                                             skalierbar
                                         
                                             Adminoberfläche
                                         
                                             schema-basiert
                                         
                                             viele Analyse-Klassen
                                         
                                             Handler, Filter, Facetten
19.04.2012    Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   31
Projekte
       Solr: Schema


                                          
                                              enthält Felder / Feldtypen
                                          
                                              Feldtypen mit
                                          unterschiedlichen Analysern
                                          
                                              dynamische Felder
                                          
                                              CopyField
                                          
                                              Konfigurierbare Textanalyse
                                          
                                              Listen von Synonymen, Stopp-
                                          Wörtern, etc.
19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   32
Projekte
       Solr: Schema, Beispiele Felder
         <field name="subject" type="string" indexed="true" stored="true" />

        <field name="contactPhotoURL" type="string" indexed="false"
     stored="true" />

        <field name="priceperhour" type="sfloat" indexed="true"
     stored="true" />

         <field name="created" type="date" indexed="true" stored="true" />

       <field name="subject" type="string" indexed="true" stored="true"
     multiValued="true" />

         <field name="all_text" type="text" indexed="true" stored="false" />

        <dynamicField name="skills_*" type="text" indexed="true"
     stored="true" multiValued="true" />

         <copyField source="subject" dest="all_text" />



19.04.2012     Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   33
Projekte
       Solr: Features

                                         
                                             Markierte Treffer
                                         
                                             Spellchecker
                                         
                                             MoreLikeThis
                                         
                                             Dismax Query
                                         
                                             DataImportHandler: DB,
                                         XML, ...
                                         
                                             Indexanalyse
19.04.2012    Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   34
Historie
       Solr


   
     2006 code donation von CNET
   
     1.1: 17.1.2007 aus incubator zu lucene
   Subprojekt
   
     1.2: 2.6.2007 spellcheck, sounds-like, ...
   
     1.3: 15.9.2008 verteiltes Suchen, ...
   
     1.4: 10.11.2009 db dataimporthandler, ...
   
     3.1 – 3.6 (2011/2012) geospatial support,
   grouping/collapsing, ...

19.04.2012    Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   35
Projekte
         Solr: Queries


     
         HTTP Interface mit verschiedenen Formaten (XML, JSON...)
     
         Mehrfachsortierung
     
         Auto Suggest
     
         Dismax query
     
         Snippets
     
         Spelling suggestions
     
         More Like This
     
         einfache Datumsberechnungen
     
         Function Query
     
         einfache Statistik (min, max, ...)
     
         Facetten Suche (Filtern nach mehreren Facetten)
19.04.2012      Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   36
Projekte
         Solr: Einfache Beispiele für q


     
         +goethe +schiller
     
         +goethe -schiller
     
         title:faust
     
         title:faust AND -all_text:goethe
     
         “romeo and juliet”
     
         water*
     
         water~
     
         created:[1995-12-31T23:59:59.999Z TO 2007-03-06T00:00:00Z]
     
         price:[20 TO 50]
     
         price:[100 TO *]


19.04.2012        Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   37
Projekte
         Solr: Beispiele für Parameter

     
         sort=score asc
     
         sort=created asc
     
         sort=created asc, title asc
     
         start=10
     
         rows=20
     
         fl=*
     
         fl=id, title
     
         fl=*, score
     
         created:[NOW/DAY-1MONTH TO NOW/DAY]
     
         fq=created:[NOW/DAY-2YEARS TO
     NOW/DAY]&fq=all_text:poetry

19.04.2012        Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   38
Projekte
       Nutch
                                          
                                              Web Crawler
                                          
                                              verteilt, parallel
                                          
                                              Erstellt gerichteten
                                          Graphen
                                          
                                              Multi-Format (HTML, PDF,
                                          Office, Tika, ...)
                                          
                                              MapReduce, Hadoop
                                          
                                              Lucene oder Solr
19.04.2012     Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   39
Projekte
       Tika
                                         
                                             Inhaltsanalyse
                                         
                                             Extrahiert Metadaten und
                                         strukturierte Inhalte
                                         
                                             nutzt existierende Parser
                                         
                                             große und wachsende
                                         Anzahl an Formaten
                                         
                                             weitere Parser einfach
                                         ergänzbar
19.04.2012    Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   40
Projekte
       ElasticSearch
                                         
                                             nutzt Lucene
                                         
                                             Facetten, Typen, ...
                                         
                                             elastic: sharding/replicas
                                         automatisch
                                         
                                             schemalos
                                         
                                             Vorgänger: Compass
                                         Framework

19.04.2012    Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   41
Projekte
       Mahout


                                                   
                                                       Machine Learning
                                                   
                                                       Empfehlungen
                                                   
                                                       Clustering
                                                   
                                                       Classification
                                                   
                                                       Hadoop
                                                   
                                                       Zahlreiche Algorithmen


19.04.2012      Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   42
Moeglichkeiten

19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   43
Möglichkeiten
       Beispiel 2009




19.04.2012    Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   44
API




19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   45
Commit Options




19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   46
Concurrency




19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   47
Config

org.apache.solr.common.SolrException: Error opening new searcher.
exceeded limit of maxWarmingSearchers=2, try again later.

request: http://localhost:8983/solr/update?
commit=true&waitFlush=true&waitSearcher=true&...
    at ...

In standard solr configuration:

<maxWarmingSearchers>2</maxWarmingSearchers>




19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   48
Solr Wiki:
"...every time a new index searcher is opened,
some autowarming of the cache occurs before
Solr hands queries over to that version of the
collection. It is crucial to individual query latency
that queries have warmed caches."
→ Near-Real-Time (Lucene since 2.9,
Solr/trunk, ElasticSearch)

19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   49
INDEX
Belkin
→ belkin

QUERY
Belkin
→ belkin

But...

belk*
→ belk


19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   50
MultiCore



<solr persistent="false">
   <cores adminPath="/admin/cores" defaultCoreName="core0">
       <core name="originalcore" instanceDir="core0">
          <property name="dataDir"
value="/data/core0" />
       </core>
       <core name="newcore" instanceDir="core1" >
          <property name="dataDir"
value="/data/core1" />
       </core>
   </cores>
</solr>




19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   51
Schema-less




19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   52
Distributed, Autosharding




19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   53
Multitenancy (cf Multicore)




19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   54
Lucene & Hadoop
     - Hadoop: parallel processing power
     - Lucene: dynamic, rapid search
   But...
     - HDFS: no random read/writes
     - Solr: distributed indexes
   So...
     - Index built in HDFS, export to local
     - HBase
19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   55
Bewertung
       The road ahead


                                           
                                               Solr: einfach, konfigurierbar,
                                           skalierbar, endnutzerfreundlich
                                           
                                               Lucene: lowlevel,
                                           komplexer, volle Flexibilität
                                           
                                               ElasticSearch: relativ neu,
                                           aber automatische Skalierung
                                           
                                               Mahout: komplex, mächtig,
                                           skalierbar
19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   56
Vielen Dank !

19.04.2012   Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst.   57

Weitere ähnliche Inhalte

Andere mochten auch

31. LTG-Sitzung am 5. Oktober 2011
31. LTG-Sitzung am 5. Oktober 201131. LTG-Sitzung am 5. Oktober 2011
31. LTG-Sitzung am 5. Oktober 2011Stephan Tauschitz
 
Penal. decr.fiscal y auto acord.diligencias
Penal. decr.fiscal y auto acord.diligenciasPenal. decr.fiscal y auto acord.diligencias
Penal. decr.fiscal y auto acord.diligenciasHilario Sánchez Díaz
 
Scoutsjoer
ScoutsjoerScoutsjoer
Scoutsjoerairrthum
 
Stressberechnung | weyer spezial
Stressberechnung | weyer spezialStressberechnung | weyer spezial
Stressberechnung | weyer spezialweyer gruppe
 
Descubre los Cuentos Morgau
Descubre los Cuentos Morgau Descubre los Cuentos Morgau
Descubre los Cuentos Morgau Pau Janer
 
24 Jesus - Mit dem Allmächtigen im Alltäglichen
24 Jesus - Mit dem Allmächtigen im Alltäglichen24 Jesus - Mit dem Allmächtigen im Alltäglichen
24 Jesus - Mit dem Allmächtigen im AlltäglichenDominique Pfeiffer
 
Ausschreibungsmanagement | weyer spezial
Ausschreibungsmanagement | weyer spezialAusschreibungsmanagement | weyer spezial
Ausschreibungsmanagement | weyer spezialweyer gruppe
 
Geschäftsanwendungen auf Basis von SharePoint
Geschäftsanwendungen auf Basis von SharePoint Geschäftsanwendungen auf Basis von SharePoint
Geschäftsanwendungen auf Basis von SharePoint HENRICHSEN AG
 
KOROLOWICZ_DESIGN WORK FROM WMU
KOROLOWICZ_DESIGN WORK FROM WMUKOROLOWICZ_DESIGN WORK FROM WMU
KOROLOWICZ_DESIGN WORK FROM WMULauren Korolowicz
 
HENRICHSEN SolutionDay 2013: Einblicke in das HENRICHSEN Innovationslabor
HENRICHSEN SolutionDay 2013: Einblicke in das HENRICHSEN InnovationslaborHENRICHSEN SolutionDay 2013: Einblicke in das HENRICHSEN Innovationslabor
HENRICHSEN SolutionDay 2013: Einblicke in das HENRICHSEN InnovationslaborHENRICHSEN AG
 
Dog shelter
Dog shelterDog shelter
Dog shelterLIsapen9
 
Handyvertrag kündigen mit Aboalarm!
Handyvertrag kündigen mit Aboalarm!Handyvertrag kündigen mit Aboalarm!
Handyvertrag kündigen mit Aboalarm!Aboalarm
 

Andere mochten auch (14)

31. LTG-Sitzung am 5. Oktober 2011
31. LTG-Sitzung am 5. Oktober 201131. LTG-Sitzung am 5. Oktober 2011
31. LTG-Sitzung am 5. Oktober 2011
 
Penal. decr.fiscal y auto acord.diligencias
Penal. decr.fiscal y auto acord.diligenciasPenal. decr.fiscal y auto acord.diligencias
Penal. decr.fiscal y auto acord.diligencias
 
Scoutsjoer
ScoutsjoerScoutsjoer
Scoutsjoer
 
Autoverkäufe 2014
Autoverkäufe 2014Autoverkäufe 2014
Autoverkäufe 2014
 
Stressberechnung | weyer spezial
Stressberechnung | weyer spezialStressberechnung | weyer spezial
Stressberechnung | weyer spezial
 
Descubre los Cuentos Morgau
Descubre los Cuentos Morgau Descubre los Cuentos Morgau
Descubre los Cuentos Morgau
 
24 Jesus - Mit dem Allmächtigen im Alltäglichen
24 Jesus - Mit dem Allmächtigen im Alltäglichen24 Jesus - Mit dem Allmächtigen im Alltäglichen
24 Jesus - Mit dem Allmächtigen im Alltäglichen
 
Ausschreibungsmanagement | weyer spezial
Ausschreibungsmanagement | weyer spezialAusschreibungsmanagement | weyer spezial
Ausschreibungsmanagement | weyer spezial
 
Fer de mestra
Fer de mestra Fer de mestra
Fer de mestra
 
Geschäftsanwendungen auf Basis von SharePoint
Geschäftsanwendungen auf Basis von SharePoint Geschäftsanwendungen auf Basis von SharePoint
Geschäftsanwendungen auf Basis von SharePoint
 
KOROLOWICZ_DESIGN WORK FROM WMU
KOROLOWICZ_DESIGN WORK FROM WMUKOROLOWICZ_DESIGN WORK FROM WMU
KOROLOWICZ_DESIGN WORK FROM WMU
 
HENRICHSEN SolutionDay 2013: Einblicke in das HENRICHSEN Innovationslabor
HENRICHSEN SolutionDay 2013: Einblicke in das HENRICHSEN InnovationslaborHENRICHSEN SolutionDay 2013: Einblicke in das HENRICHSEN Innovationslabor
HENRICHSEN SolutionDay 2013: Einblicke in das HENRICHSEN Innovationslabor
 
Dog shelter
Dog shelterDog shelter
Dog shelter
 
Handyvertrag kündigen mit Aboalarm!
Handyvertrag kündigen mit Aboalarm!Handyvertrag kündigen mit Aboalarm!
Handyvertrag kündigen mit Aboalarm!
 

Ähnlich wie Lucene's Welt

achtQuark Präsentation zum Seminar "Anwendungsbereich Innovatives Wissensmana...
achtQuark Präsentation zum Seminar "Anwendungsbereich Innovatives Wissensmana...achtQuark Präsentation zum Seminar "Anwendungsbereich Innovatives Wissensmana...
achtQuark Präsentation zum Seminar "Anwendungsbereich Innovatives Wissensmana...achtQuark
 
Martin Kaltenböck - Anforderungsanalyse für Open Government Data in Österreich
Martin Kaltenböck - Anforderungsanalyse für Open Government Data in ÖsterreichMartin Kaltenböck - Anforderungsanalyse für Open Government Data in Österreich
Martin Kaltenböck - Anforderungsanalyse für Open Government Data in ÖsterreichSemantic Web Company
 
DNUG 36 2012_Konferenzbroschuere
DNUG 36 2012_KonferenzbroschuereDNUG 36 2012_Konferenzbroschuere
DNUG 36 2012_KonferenzbroschuereFriedel Jonker
 
Dev Day Stephan Pirnbaum.pdf
Dev Day Stephan Pirnbaum.pdfDev Day Stephan Pirnbaum.pdf
Dev Day Stephan Pirnbaum.pdfCarolinaMatthies
 
Continuous Delivery - Nett oder nötig? Erfahrungsbericht der FriendScout24 - ...
Continuous Delivery - Nett oder nötig? Erfahrungsbericht der FriendScout24 - ...Continuous Delivery - Nett oder nötig? Erfahrungsbericht der FriendScout24 - ...
Continuous Delivery - Nett oder nötig? Erfahrungsbericht der FriendScout24 - ...Michael Maretzke
 
Das LASSO für Linked Data – Drei Anwendungsfälle
Das LASSO für Linked Data – Drei AnwendungsfälleDas LASSO für Linked Data – Drei Anwendungsfälle
Das LASSO für Linked Data – Drei AnwendungsfälleHermann Stern
 
knowtech2011-Verwaltung2.0
knowtech2011-Verwaltung2.0knowtech2011-Verwaltung2.0
knowtech2011-Verwaltung2.0TwentyOne AG
 
Webinar-Serie mit LinkedIn: Social Recruiting einsetzen (Suchfilter)
Webinar-Serie mit LinkedIn: Social Recruiting einsetzen (Suchfilter)Webinar-Serie mit LinkedIn: Social Recruiting einsetzen (Suchfilter)
Webinar-Serie mit LinkedIn: Social Recruiting einsetzen (Suchfilter)LinkedIn D-A-CH
 
Wissensorientiertes Projektmanagement
Wissensorientiertes ProjektmanagementWissensorientiertes Projektmanagement
Wissensorientiertes ProjektmanagementJörg Dirbach
 
120715 agile requirements_handout
120715 agile requirements_handout120715 agile requirements_handout
120715 agile requirements_handoutAndreas Birk
 
Markus Schranner: "Das Lean Startup Prinzip - Potentiale für NGOs und soziale...
Markus Schranner: "Das Lean Startup Prinzip - Potentiale für NGOs und soziale...Markus Schranner: "Das Lean Startup Prinzip - Potentiale für NGOs und soziale...
Markus Schranner: "Das Lean Startup Prinzip - Potentiale für NGOs und soziale...Socialbar
 
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...Stefan Seifarth
 
Social Media und Management 2.0 - Kann es im Management beim Alten bleiben?
Social Media und Management 2.0 - Kann es im Management beim Alten bleiben? Social Media und Management 2.0 - Kann es im Management beim Alten bleiben?
Social Media und Management 2.0 - Kann es im Management beim Alten bleiben? University St. Gallen
 
Das Potential von Open Source Software nutzen und die Risiken minimieren
Das Potential von Open Source Software nutzen und die Risiken minimierenDas Potential von Open Source Software nutzen und die Risiken minimieren
Das Potential von Open Source Software nutzen und die Risiken minimierenMatthias Stürmer
 
Vom Hype zur gelebten Normalität Wie entsteht echter Nutzen durch Web 2.0 im...
Vom Hype zur gelebten NormalitätWie entsteht echter Nutzen durch Web 2.0 im...Vom Hype zur gelebten NormalitätWie entsteht echter Nutzen durch Web 2.0 im...
Vom Hype zur gelebten Normalität Wie entsteht echter Nutzen durch Web 2.0 im...Telekom MMS
 

Ähnlich wie Lucene's Welt (20)

Android in 2012
Android in 2012Android in 2012
Android in 2012
 
achtQuark Präsentation zum Seminar "Anwendungsbereich Innovatives Wissensmana...
achtQuark Präsentation zum Seminar "Anwendungsbereich Innovatives Wissensmana...achtQuark Präsentation zum Seminar "Anwendungsbereich Innovatives Wissensmana...
achtQuark Präsentation zum Seminar "Anwendungsbereich Innovatives Wissensmana...
 
Martin Kaltenböck - Anforderungsanalyse für Open Government Data in Österreich
Martin Kaltenböck - Anforderungsanalyse für Open Government Data in ÖsterreichMartin Kaltenböck - Anforderungsanalyse für Open Government Data in Österreich
Martin Kaltenböck - Anforderungsanalyse für Open Government Data in Österreich
 
DNUG 36 2012_Konferenzbroschuere
DNUG 36 2012_KonferenzbroschuereDNUG 36 2012_Konferenzbroschuere
DNUG 36 2012_Konferenzbroschuere
 
Web2.0 im Unternehmen
Web2.0 im UnternehmenWeb2.0 im Unternehmen
Web2.0 im Unternehmen
 
2010 09-knowtech-back-koch-e20cases.ppt
2010 09-knowtech-back-koch-e20cases.ppt2010 09-knowtech-back-koch-e20cases.ppt
2010 09-knowtech-back-koch-e20cases.ppt
 
Dev Day Stephan Pirnbaum.pdf
Dev Day Stephan Pirnbaum.pdfDev Day Stephan Pirnbaum.pdf
Dev Day Stephan Pirnbaum.pdf
 
Continuous Delivery - Nett oder nötig? Erfahrungsbericht der FriendScout24 - ...
Continuous Delivery - Nett oder nötig? Erfahrungsbericht der FriendScout24 - ...Continuous Delivery - Nett oder nötig? Erfahrungsbericht der FriendScout24 - ...
Continuous Delivery - Nett oder nötig? Erfahrungsbericht der FriendScout24 - ...
 
Das LASSO für Linked Data – Drei Anwendungsfälle
Das LASSO für Linked Data – Drei AnwendungsfälleDas LASSO für Linked Data – Drei Anwendungsfälle
Das LASSO für Linked Data – Drei Anwendungsfälle
 
knowtech2011-Verwaltung2.0
knowtech2011-Verwaltung2.0knowtech2011-Verwaltung2.0
knowtech2011-Verwaltung2.0
 
Webinar-Serie mit LinkedIn: Social Recruiting einsetzen (Suchfilter)
Webinar-Serie mit LinkedIn: Social Recruiting einsetzen (Suchfilter)Webinar-Serie mit LinkedIn: Social Recruiting einsetzen (Suchfilter)
Webinar-Serie mit LinkedIn: Social Recruiting einsetzen (Suchfilter)
 
Wissensorientiertes Projektmanagement
Wissensorientiertes ProjektmanagementWissensorientiertes Projektmanagement
Wissensorientiertes Projektmanagement
 
120715 agile requirements_handout
120715 agile requirements_handout120715 agile requirements_handout
120715 agile requirements_handout
 
Markus Schranner: "Das Lean Startup Prinzip - Potentiale für NGOs und soziale...
Markus Schranner: "Das Lean Startup Prinzip - Potentiale für NGOs und soziale...Markus Schranner: "Das Lean Startup Prinzip - Potentiale für NGOs und soziale...
Markus Schranner: "Das Lean Startup Prinzip - Potentiale für NGOs und soziale...
 
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...
Morning Session: Qualitätskriterien für erfolgreiche Websites - für "Nicht-Te...
 
Social Media und Management 2.0 - Kann es im Management beim Alten bleiben?
Social Media und Management 2.0 - Kann es im Management beim Alten bleiben? Social Media und Management 2.0 - Kann es im Management beim Alten bleiben?
Social Media und Management 2.0 - Kann es im Management beim Alten bleiben?
 
Learntec 2013 Denner
Learntec 2013 DennerLearntec 2013 Denner
Learntec 2013 Denner
 
Das Potential von Open Source Software nutzen und die Risiken minimieren
Das Potential von Open Source Software nutzen und die Risiken minimierenDas Potential von Open Source Software nutzen und die Risiken minimieren
Das Potential von Open Source Software nutzen und die Risiken minimieren
 
Vom Hype zur gelebten Normalität Wie entsteht echter Nutzen durch Web 2.0 im...
Vom Hype zur gelebten NormalitätWie entsteht echter Nutzen durch Web 2.0 im...Vom Hype zur gelebten NormalitätWie entsteht echter Nutzen durch Web 2.0 im...
Vom Hype zur gelebten Normalität Wie entsteht echter Nutzen durch Web 2.0 im...
 
SQLTXPLAIN - Oder: Warum performt mein SQL nicht?
SQLTXPLAIN - Oder: Warum performt mein SQL nicht?SQLTXPLAIN - Oder: Warum performt mein SQL nicht?
SQLTXPLAIN - Oder: Warum performt mein SQL nicht?
 

Lucene's Welt

  • 1. Lucene's Welt: Ordnen, Finden, Klassifizieren JAX, 2012 Andrew Kenworthy Christian Meder inovex GmbH 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 1
  • 2. Speaker Andrew Kenworthy Schwerpunkte  Business Intelligence  Java  Solr  Hadoop andrew.kenworthy@inovex.de 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 2
  • 3. Speaker Christian Meder Schwerpunkte  open source (free software)  Linux  Web  Java  Android  CTO@inovex Christian Meder 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 3
  • 4. Agenda  Motivation  Beispiele  Projektübersicht  Projekte  Möglichkeiten  Bewertung 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 4
  • 5. Motivation 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 5
  • 6. Motivation Google klassisch (2010) 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 6
  • 7. Motivation Google klassisch (2010) Relevanz 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 7
  • 8. Motivation Google klassisch (2010) Snippets Autovervollstaendigung 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 8
  • 9. Motivation Google klassisch (2010) Antwortzeiten Spellchecker Aehnliche Seiten (More like this) 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 9
  • 10. Motivation Google Evolution (2011) 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 10
  • 11. Motivation Google Evolution (2011) Facetten Instant Search Vorschau 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 11
  • 12. Motivation Google Evolution (2011) 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 12
  • 13. Motivation Google Evolution (2011) Facetten 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 13
  • 14. Motivation Google Evolution (2012) SPYW 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 14
  • 15. Motivation Google Evolution (2012) SPYW 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 15
  • 16. Motivation Amazon 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 16
  • 17. Motivation usability.de „Die Aussage eines Probanden bei einem Usability-Test einer Faceted Search Lösung im Rahmen dieser Studie ist damit richtungsweisend: „Mit dem Filter hier habe ich das Gefühl, dass selbst eine schnöde Suche richtig Spaß machen kann.”” Quelle: Faceted Search: Die neue Suche im Usability-Test (zum kostenlosen Download unter http://usability.de) 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 17
  • 18. Motivation osscensus.org Rank Package Installs 1 firefox 3761 82% 2 zlib 3118 67% 3 wget 3000 65% 4 xerces 2494 54% 5 prototype 2450 53% 6 eclipse 2428 52% 7 c.-logging 2423 52% 8 docbook-xml 1692 52% 9 lucene 2394 52% 10 xalan 2363 51% 11 commons-lang 2349 51% 12 wsdl4j 2242 48% 13 tk 1557 48% 14 samba 1554 48% 15 activation 2175 47% 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 18
  • 19. Beispiele 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 19
  • 20. Beispiele Ebay Kleinanzeigen 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 20
  • 21. Beispiele Ebay Kleinanzeigen (aus Olaf Zschiedrich solr@ebay Kleinanzeigen) Site metrics: • ~ 3.2 M active ads • 16 – 24 M PVs per day • Peak hours = 1.8 M PVs (~ 500 PVs per second) Solr request metrics: • ~ 60 M requests per day • Peak hours = ~ 1500 request per second Avg. response time • 20 ms (search) and 3 ms for auto-suggest 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 21
  • 22. Beispiele Ebay Kleinanzeigen (aus Olaf Zschiedrich solr@ebay Kleinanzeigen) • 2 datacenters • 1 Master + 6 Slaves per datacenter Slaves show very low resource consumption. Could go down to 4 slaves per datacenter while still having 50% overcapacity • Master only used for indexing • Load balancer in front of slaves • Varnish in front of slaves (for dedicated use cases) • Working closely with SITE-OPS Team • DEV-OPS are part of development process 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 22
  • 23. Beispiele ElasticSearch  IGN's search  10 nodes / 2 clusters  56 M documents  Scala over TCP  PHP/JS over HTTP  ~5k rpm 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 23
  • 24. Beispiele ElasticSearch  Sonian Inc.  Cloud electronic document search  20+ cluster  5 billion documents  Index into 100s TB 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 24
  • 25. Projektuebersicht 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 25
  • 26. Projektübersicht Lucene  Lucene: Suchbibliothek  Solr: Suchserver  Nutch: Crawler  Tika: Inhaltsanalyse  ElasticSearch (Compass): Suchserver  Mahout: Machine Learning  ManifoldCF: Repository Connectors (incubation) 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 26
  • 27. Projekte 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 27
  • 28. Architektur Indizierung Inhalte Solr Bereitstellung Aufbereitung Lucene Analyse Indizierung Index 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 28
  • 29. Projekte Lucene  Information Retrieval Bibliothek  Kern einer Sucharchitektur  effizient  skalierbar  Viele Ports: .Net, C, Python  Vielfach integriert in Produkte 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 29
  • 30. Historie Lucene  0.01 (2000) Doug Cutting  1.2 (2002) Apache Jakarta Projekt  - 2.9 (2009) Sortieren, Datums- und Zahlenfelder, Bereichsfelder, near realtime search, neue Analyzer, ...  3.0 (2009) cleanup release, deprecations  3.1 - 3.6 (2011/2012) performance, grouping, autocomplete Verbesserungen, facet, join, ... 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 30
  • 31. Projekte Solr  Enterprise Suchserver  XML über HTTP  skalierbar  Adminoberfläche  schema-basiert  viele Analyse-Klassen  Handler, Filter, Facetten 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 31
  • 32. Projekte Solr: Schema  enthält Felder / Feldtypen  Feldtypen mit unterschiedlichen Analysern  dynamische Felder  CopyField  Konfigurierbare Textanalyse  Listen von Synonymen, Stopp- Wörtern, etc. 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 32
  • 33. Projekte Solr: Schema, Beispiele Felder <field name="subject" type="string" indexed="true" stored="true" /> <field name="contactPhotoURL" type="string" indexed="false" stored="true" /> <field name="priceperhour" type="sfloat" indexed="true" stored="true" /> <field name="created" type="date" indexed="true" stored="true" /> <field name="subject" type="string" indexed="true" stored="true" multiValued="true" /> <field name="all_text" type="text" indexed="true" stored="false" /> <dynamicField name="skills_*" type="text" indexed="true" stored="true" multiValued="true" /> <copyField source="subject" dest="all_text" /> 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 33
  • 34. Projekte Solr: Features  Markierte Treffer  Spellchecker  MoreLikeThis  Dismax Query  DataImportHandler: DB, XML, ...  Indexanalyse 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 34
  • 35. Historie Solr  2006 code donation von CNET  1.1: 17.1.2007 aus incubator zu lucene Subprojekt  1.2: 2.6.2007 spellcheck, sounds-like, ...  1.3: 15.9.2008 verteiltes Suchen, ...  1.4: 10.11.2009 db dataimporthandler, ...  3.1 – 3.6 (2011/2012) geospatial support, grouping/collapsing, ... 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 35
  • 36. Projekte Solr: Queries  HTTP Interface mit verschiedenen Formaten (XML, JSON...)  Mehrfachsortierung  Auto Suggest  Dismax query  Snippets  Spelling suggestions  More Like This  einfache Datumsberechnungen  Function Query  einfache Statistik (min, max, ...)  Facetten Suche (Filtern nach mehreren Facetten) 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 36
  • 37. Projekte Solr: Einfache Beispiele für q  +goethe +schiller  +goethe -schiller  title:faust  title:faust AND -all_text:goethe  “romeo and juliet”  water*  water~  created:[1995-12-31T23:59:59.999Z TO 2007-03-06T00:00:00Z]  price:[20 TO 50]  price:[100 TO *] 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 37
  • 38. Projekte Solr: Beispiele für Parameter  sort=score asc  sort=created asc  sort=created asc, title asc  start=10  rows=20  fl=*  fl=id, title  fl=*, score  created:[NOW/DAY-1MONTH TO NOW/DAY]  fq=created:[NOW/DAY-2YEARS TO NOW/DAY]&fq=all_text:poetry 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 38
  • 39. Projekte Nutch  Web Crawler  verteilt, parallel  Erstellt gerichteten Graphen  Multi-Format (HTML, PDF, Office, Tika, ...)  MapReduce, Hadoop  Lucene oder Solr 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 39
  • 40. Projekte Tika  Inhaltsanalyse  Extrahiert Metadaten und strukturierte Inhalte  nutzt existierende Parser  große und wachsende Anzahl an Formaten  weitere Parser einfach ergänzbar 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 40
  • 41. Projekte ElasticSearch  nutzt Lucene  Facetten, Typen, ...  elastic: sharding/replicas automatisch  schemalos  Vorgänger: Compass Framework 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 41
  • 42. Projekte Mahout  Machine Learning  Empfehlungen  Clustering  Classification  Hadoop  Zahlreiche Algorithmen 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 42
  • 43. Moeglichkeiten 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 43
  • 44. Möglichkeiten Beispiel 2009 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 44
  • 45. API 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 45
  • 46. Commit Options 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 46
  • 47. Concurrency 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 47
  • 48. Config org.apache.solr.common.SolrException: Error opening new searcher. exceeded limit of maxWarmingSearchers=2, try again later. request: http://localhost:8983/solr/update? commit=true&waitFlush=true&waitSearcher=true&... at ... In standard solr configuration: <maxWarmingSearchers>2</maxWarmingSearchers> 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 48
  • 49. Solr Wiki: "...every time a new index searcher is opened, some autowarming of the cache occurs before Solr hands queries over to that version of the collection. It is crucial to individual query latency that queries have warmed caches." → Near-Real-Time (Lucene since 2.9, Solr/trunk, ElasticSearch) 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 49
  • 50. INDEX Belkin → belkin QUERY Belkin → belkin But... belk* → belk 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 50
  • 51. MultiCore <solr persistent="false"> <cores adminPath="/admin/cores" defaultCoreName="core0"> <core name="originalcore" instanceDir="core0"> <property name="dataDir" value="/data/core0" /> </core> <core name="newcore" instanceDir="core1" > <property name="dataDir" value="/data/core1" /> </core> </cores> </solr> 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 51
  • 52. Schema-less 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 52
  • 53. Distributed, Autosharding 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 53
  • 54. Multitenancy (cf Multicore) 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 54
  • 55. Lucene & Hadoop - Hadoop: parallel processing power - Lucene: dynamic, rapid search But... - HDFS: no random read/writes - Solr: distributed indexes So... - Index built in HDFS, export to local - HBase 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 55
  • 56. Bewertung The road ahead  Solr: einfach, konfigurierbar, skalierbar, endnutzerfreundlich  Lucene: lowlevel, komplexer, volle Flexibilität  ElasticSearch: relativ neu, aber automatische Skalierung  Mahout: komplex, mächtig, skalierbar 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 56
  • 57. Vielen Dank ! 19.04.2012 Wir nutzen Technologien, um unsere Kunden glücklich zu machen. Und uns selbst. 57