Angebot und Nachfrage für Open Source Business Intelligence
Open Source Business Intelligence - TDWI 2007
1. Open Source Business Intelligence
– Grundlagen, Marktüberblick, Produktevaluationen,
Chancen & Risiken –
Christian Schieder TDWI Jahrestagung 2007
München
13. 06. 2007
1
2. Conference Review TDWI 2007: Focus Open Source
Open Source Business Intelligence
Stephen Brobst („The Future of DW“): Within 5 years Open
Source components will be commodity in BI-Infrastructure.
Mike Ferguson („Pervasive BI“): Open Source BI is putting
major pressure on Cost of BI.
Frank Buytendijk („The Future of PM“): Open Standards
utilization is crucial for DW-architecture success.
Larissa Moss („Extreme Scoping“): We need more agility in
DW-projects.
Christian Schieder
Open Source Business Intelligence 2
TDWI Jahrestagung, München 2007
3. Open Source Paradebeispiel Apache Webserver (I)
Open Source Business Intelligence
80%
Apache
40%
IIS
0%
1995 1997 1999 2001 2003 2005 2007
Relative Marktanteile im Webservermarkt (Anteil gehosteter Websiten global)
Quelle: http://news.netcraft.com/archives/web_server_survey.html
Christian Schieder
Open Source Business Intelligence 3
TDWI Jahrestagung, München 2007
4. Open Source Paradebeispiel Apache Webserver (II)
Open Source Business Intelligence
31 Mio.
Apache
15 Mio.
IIS
0
2000 2001 2002 2003 2004 2005 2006 2007
Absolute Marktanteile im Webservermarkt (Anzahl gehosteter Websiten global)
Quelle: http://news.netcraft.com/archives/web_server_survey.html
Christian Schieder
Open Source Business Intelligence 4
TDWI Jahrestagung, München 2007
5. Bekannte OS-Beispiele
Open Source Business Intelligence
Christian Schieder
Open Source Business Intelligence 5
TDWI Jahrestagung, München 2007
6. Open Source in aller Munde
Open Source Business Intelligence
*
* Kleijn, A. : Business Intelligence mit Open Source,
Heise open / Markt, Juni 2006,
http://www.heise.de/open/artikel/73725
Christian Schieder
Open Source Business Intelligence 6
TDWI Jahrestagung, München 2007
7. Open Source BI im Gartner Hype Cycle
Open Source Business Intelligence
visibility
Virtual Data
Federation/EII Dashboards/Scorecards
Corporate Performance Management
BAM/Real-Time BI
SOA-Enabled BI
EBISs
Convergence ETL
EBIS/BI Platforms Web Tools
Analytics
Advanced Production/
Analytics OLAP Formatted/
Collaborative BI Data Warehouse BI Platforms Web
Appliance Metadata Tools Reporting
Embedded
Analytics Data Mining Workbenches
Open Source BI ETL Embedded
Visual BI Text Mining in DBMS
Development Open Source DBMS ODBO/MDX and XML for Analysis Standard
Tools Data Quality
Cross-Enterprise Business
64-bit Analytics B2B BI Application
Hardware Extranets Data
Warehouses
Analytical Process Controlling
As of July 2005
Peak of
Technology Trough of Plateau of
Inflated Slope of Enlightenment
Trigger Disillusionment Productivity
Expectations
maturity
Plateau will be reached in:
obsolete
less than 2 years 2 to 5 years 5 to 10 years more than 10 years before plateau
Quelle: Gartner 2005
Christian Schieder
Open Source Business Intelligence 7
TDWI Jahrestagung, München 2007
8. Gliederung
Open Source Business Intelligence
1. Einleitung & Grundlagen
2. Marktüberblick
3. Szenarien & Bedingungen für den Einsatz von
Open Source Business Intelligence
4. Zusammenfassung & Ausblick
Christian Schieder
Open Source Business Intelligence 8
TDWI Jahrestagung, München 2007
9. Gliederung
Open Source Business Intelligence
1. Einleitung & Grundlagen
2. Marktüberblick
3. Szenarien & Bedingungen für den Einsatz von
Open Source Business Intelligence
4. Zusammenfassung & Ausblick
Christian Schieder
Open Source Business Intelligence 9
TDWI Jahrestagung, München 2007
10. Entwicklung des Open Source Phänomens (I)
1. Einleitung & Grundlagen
Entstehung des GNU-Projektes (1983)
Gründung der gemeinnützigen „Free Software
Foundation“ (1985 – R. Stallman)
1980
Hersteller beenden Praxis des SW-Bundlings,
Software wird zur Ware
Anfänge der Software-Industrie und
(wissenschaftlich geprägter) Hacker-Communities
1970
1960 Am Anfang war (fast) alle Software frei
Hardwarehersteller geben Software zum Betrieb ihrer
Hardware gratis und offen dazu (SW-Bundling)
Christian Schieder
Open Source Business Intelligence 10
TDWI Jahrestagung, München 2007
11. Entwicklung des Open Source Phänomens (II)
1. Einleitung & Grundlagen
Pragmatismus vs. Idealismus
Adoleszenz und Kommerzialisierung des
Open Source Phänomens
?
Beginn der OSS 2.0-Ära (Fitzgerald)
Übertragung der OS-Prinzipien 2000
auf andere Bereiche
(z.B. Open Content,
Marketing)
Entstehung von GNU/Linux (1991 – Torvalds)
1990
Etablierung einer weltweiten Community von
Programmieren (Verbreitung des Internet)
Gründung der „Open Source Initiative“ (1998 – Begriff
„Open Source“)
Christian Schieder
Open Source Business Intelligence 11
TDWI Jahrestagung, München 2007
12. Open Source: Definition
1. Einleitung & Grundlagen
Die Open Source Initiative wendet den Begriff Open Source auf all
die Software an, deren Lizenzverträge den folgenden drei
charakteristischen Merkmalen entsprechen:
Die Software (d. h. der Quelltext) liegt in einer für den
Menschen lesbaren und verständlichen Form vor.
Die Software darf beliebig kopiert, verbreitet und genutzt
werden.
Die Software darf verändert und in der veränderten Form
weitergegeben werden.
Quelle: http://de.wikipedia.org/wiki/Open_source
Christian Schieder
Open Source Business Intelligence 12
TDWI Jahrestagung, München 2007
13. Open Source: Spezifika
1. Einleitung & Grundlagen
Entwicklungsmodell
Hybrides Modell: formale und agile Elemente
(Cathedral vs. Bazaar)1
Paradigmen: Kollaboration, Iteration, Modularisierung
“Community“-Phänomen
Lizenzierungsmodell
Copy-Right vs. Copy-Left
Im Business Intelligence Bereich häufig Dual Licensing
1 Raymond, E. (1997): The Cathedral and the Bazaar,
http://www.catb.org/~esr/writings/cathedral-bazaar/cathedral-bazaar/
Christian Schieder
Open Source Business Intelligence 13
TDWI Jahrestagung, München 2007
14. Open Source: Copy Left
1. Einleitung & Grundlagen
Art des
Starkes Copyleft Schwaches Copyleft Kein Copyleft
Copyleft
statisches und
dynamisches Linken
Kombinations- von Code mit Keine Vorgaben.
möglichkeit keine Einbindung in proprietärer Software Der gesamte Code darf
mit proprietären Code möglich. auch als proprietäre
proprietärer möglich Eigen-Entwicklungen Software
Software dürfen als proprietäre weitergegeben werden
Software
weitergegeben werden
Beispiel-Lizenz GPL LGPL, MPL BSD, Apache
Quelle: http://www.heise.de/open/artikel/75786
Christian Schieder
Open Source Business Intelligence 14
TDWI Jahrestagung, München 2007
15. Open Source Lizenzen
1. Einleitung & Grundlagen
Ungefähre
Verteilung der
Lizenzen im Open 12,5% 1,8% 8,0%
Source Repository 7,7%
Sourceforge:
70,0%
GPL LGPL MPL BSD Andere
Quelle: http://www.heise.de/open/artikel/75786/1
Christian Schieder
Open Source Business Intelligence 15
TDWI Jahrestagung, München 2007
16. Warum Open Source funktioniert…
1. Einleitung & Grundlagen
Das Wesen von Software als öffentliches Gut
Kein Trittbrettfahrerproblem
Übernutzung nicht möglich
Positive Netzwerkeffekte (z.B. odf-Format von
OpenOffice)
Motivatoren
Reputation
Lernen
Ideologie
Christian Schieder
Open Source Business Intelligence 16
TDWI Jahrestagung, München 2007
17. Warum Open Source funktioniert: Geschäftsmodelle
1. Einleitung & Grundlagen
Value-Added/Service-Enabling Model
Integration und Konfiguration von OS-Komponenten und
Service/Support-Angebot
OSS-Beispiele: Suse, Red Hat
OSBI-Beispiele: Pentaho, SpagoBI, JasperIntelligence
Loss-Leader/Market-Creation Model
Vertrieb von OSS mit Ziel Up-/ Cross-Selling von closed source Software
OSS-Beispiele: IBM (Eclipse), MySQL (MySQL Enterprise Ed.)
OSBI-Beispiele: Actuate (Birt), Jedox (Palo)
Vgl. Fitzgerald, B. 2006. The Transformation of Open Source Software. MIS Quarterly, 30 (3), S. 587–598.
Christian Schieder
Open Source Business Intelligence 17
TDWI Jahrestagung, München 2007
18. Gliederung
Open Source Business Intelligence
1. Einleitung & Grundlagen
2. Marktüberblick
3. Szenarien & Bedingungen für den Einsatz von
Open Source Business Intelligence
4. Zusammenfassung & Ausblick
Christian Schieder
Open Source Business Intelligence 18
TDWI Jahrestagung, München 2007
19. De facto Standard für BI-Architekturen
2. Marktüberblick
Data
Data Warehouse System Analytical Presentation
Acquisition Layer Layer
Layer DWH Layer
Staging Layer
ETL
ETL ETL
SQL based
SQL based
Bulk Load Insert/select
Insert/select
View build
Performance
Star-Schema Objects
File System
Quelle: IBM
Christian Schieder
Open Source Business Intelligence 19
TDWI Jahrestagung, München 2007
20. Gliederung
Open Source Business Intelligence
1. Einleitung & Grundlagen
2. Marktüberblick
2.1 Datenbanken
2.2 Datenintegration
2.3 Analyse
2.4 Präsentation
2.5 Plattformen
3. Szenarien & Bedingungen für den Einsatz von
Open Source Business Intelligence
4. Zusammenfassung & Ausblick
Christian Schieder
Open Source Business Intelligence 20
TDWI Jahrestagung, München 2007
21. De facto Standard für BI-Architekturen
2.1 Marktüberblick.Datenbanken
Data
Data Warehouse System Analytical Presentation
Acquisition Layer Layer
Layer DWH Layer
Staging Layer
ETL
ETL ETL
SQL based
SQL based
Bulk Load Insert/select
Insert/select
View build
Performance
Star-Schema Objects
File System
Quelle: IBM
Christian Schieder
Open Source Business Intelligence 21
TDWI Jahrestagung, München 2007
22. Datenbanken
2.1 Marktüberblick.Datenbanken
MySQL “most popular“
PostgreSQL “most advanced“
Ingres “most ranked“
MaxDB “most supported“
Firebird fgh “most challenging“
Christian Schieder
Open Source Business Intelligence 22
TDWI Jahrestagung, München 2007
23. Open Source Datenbanken im Einsatz
2.1 Marktüberblick.Datenbanken
Christian Schieder
Open Source Business Intelligence 23
TDWI Jahrestagung, München 2007
24. Open Source Datenbanken im Feature-Vergleich (I)
2.1 Marktüberblick.Datenbanken
Firebird Ingres MaxDB MySQL PostgreSQL
Version v.2.0.1 v.9.0.4 v.7.6 v.5.1 v.8.2
Datenintegrität
ACID-Transaktionen Ja Ja Ja Ja Ja
2-phasiges Commit Ja Ja Nein Ja Ja
Fremdschlüssel Ja Ja Ja Ja Ja
CHECK-Bedingung Ja Nein Ja Nein Ja
Savepoints Ja Ja Ja Ja Ja
MVCC und MVCC und MVCC und
Locking MVCC zeilenweise
zeilenweise zeilenweise zeilenweise
Datenbankobjekte
Schema Nein Ja Ja Ja Ja
Temporäre Tabellen Nein Ja Ja Ja Ja
Stored Procedures Ja Ja Ja Ja Ja
Trigger Before/After After After Before/After Before/After
View Ja Ja Ja Ja Ja
Materialized View Coded Ja Coded Coded Coded
Updatable View Ja Nein Ja Ja Ja
Expression Index Ja Ja Nein Nein Ja
Partial Index Nein Nein Nein Nein Ja
Bitmap Index Nein Ja Nein Nein Ja
Volltext Index Nein Nein Nein Ja Ja
Christian Schieder
Quelle: Horstmann, J. (2006), Freie Datenbanken im unternehmenseinsatz: Analyse und Vergleich der
Open Source Business Intelligence wichtigsten Open-Source-Datenbanken, in: Open-Source-Jahrbuch 2006, S. 193.
24
TDWI Jahrestagung, München 2007
25. Open Source Datenbanken im Feature-Vergleich (I)
2.1 Marktüberblick.Datenbanken
Firebird Ingres MaxDB MySQL PostgreSQL
Version v.2.0.1 v.9.0.4 v.7.6 v.5.1 v.8.2
Datenintegrität
ACID-Transaktionen Ja Ja Ja Ja Ja
2-phasiges Commit Ja Ja Nein Ja Ja
Fremdschlüssel Ja Ja Ja Ja Ja
CHECK-Bedingung Ja Nein Ja Nein Ja
Savepoints Ja Ja Ja Ja Ja
MVCC und MVCC und MVCC und
Locking MVCC zeilenweise
zeilenweise zeilenweise zeilenweise
Datenbankobjekte
Schema Nein Ja Ja Ja Ja
Temporäre Tabellen Nein Ja Ja Ja Ja
Stored Procedures Ja Ja Ja Ja Ja
Trigger Before/After After After Before/After Before/After
View Ja Ja Ja Ja Ja
Materialized View Coded Ja Coded Coded Coded
Updatable View Ja Nein Ja Ja Ja
Expression Index Ja Ja Nein Nein Ja
Partial Index Nein Nein Nein Nein Ja
Bitmap Index Nein Ja Nein Nein Ja
Volltext Index Nein Nein Nein Ja Ja
Christian Schieder
Quelle: Horstmann, J. (2006), Freie Datenbanken im unternehmenseinsatz: Analyse und Vergleich der
Open Source Business Intelligence wichtigsten Open-Source-Datenbanken, in: Open-Source-Jahrbuch 2006, S. 193.
25
TDWI Jahrestagung, München 2007
26. Open Source Datenbanken im Feature-Vergleich (II)
2.1 Marktüberblick.Datenbanken
Firebird Ingres MaxDB MySQL PostgreSQL
Version v.2.0.1 v.9.0.4 v.7.6 v.5.1 v.8.2
SQL, Datentypen
SQL-Standard 92, 99 92, 99 92 92, 99 92, 99, 03
Nutzerdef. Typen Nein Ja Nein Nein Ja
Nutzerdef. Funktionen Ja Ja Ja Ja Ja
GIS Nein Ja Nein Ja Ja
Boolean Nein Nein Ja Nein Ja
Sub-Select Ja Ja Ja Ja Ja
Full Outer Join Ja Ja Ja Nein Ja
Betrieb
Multi-Threading Ja Ja Ja Ja Nein
Multi-Processing Ja Ja Ja Ja Ja
Abfrage-Parallelisierung Nein Ja Ja Ja Nein
Replikation Ja Ja Ja Ja Ja
Multimaster Repl. Ja Ja Nein Nein Nein
Clustering Nein Ja Ja Ja Nein
Load Balancing Nein Ja Nein Ja Nein
Tablespaces Nein Nein Nein Ja Ja
Partitionierung Nein Ja Nein Ja Ja
Point-In-Time Recovery Nein Ja Ja Ja Ja
Christian Schieder
Quelle: Horstmann, J. (2006), Freie Datenbanken im unternehmenseinsatz: Analyse und Vergleich der
Open Source Business Intelligence wichtigsten Open-Source-Datenbanken, in: Open-Source-Jahrbuch 2006, S. 193.
26
TDWI Jahrestagung, München 2007
27. Open Source Datenbanken im Feature-Vergleich (II)
2.1 Marktüberblick.Datenbanken
Firebird Ingres MaxDB MySQL PostgreSQL
Version v.2.0.1 v.9.0.4 v.7.6 v.5.1 v.8.2
SQL, Datentypen
SQL-Standard 92, 99 92, 99 92 92, 99 92, 99, 03
Nutzerdef. Typen Nein Ja Nein Nein Ja
Nutzerdef. Funktionen Ja Ja Ja Ja Ja
GIS Nein Ja Nein Ja Ja
Boolean Nein Nein Ja Nein Ja
Sub-Select Ja Ja Ja Ja Ja
Full Outer Join Ja Ja Ja Nein Ja
Betrieb
Multi-Threading Ja Ja Ja Ja Nein
Multi-Processing Ja Ja Ja Ja Ja
Abfrage-Parallelisierung Nein Ja Ja Ja Nein
Replikation Ja Ja Ja Ja Ja
Multimaster Repl. Ja Ja Nein Nein Nein
Clustering Nein Ja Ja Ja Nein
Load Balancing Nein Ja Nein Ja Nein
Tablespaces Nein Nein Nein Ja Ja
Partitionierung Nein Ja Nein Ja Ja
Point-In-Time Recovery Nein Ja Ja Ja Ja
Christian Schieder
Quelle: Horstmann, J. (2006), Freie Datenbanken im unternehmenseinsatz: Analyse und Vergleich der
Open Source Business Intelligence wichtigsten Open-Source-Datenbanken, in: Open-Source-Jahrbuch 2006, S. 193.
27
TDWI Jahrestagung, München 2007
28. Open Source Datenbanken: Forrester-Studie 2006
2.1 Marktüberblick.Datenbanken
MySQL
Ausgeglichen in allen DBMS-Features
Datenbankapplikationen und Hauptspeicherdatenbanken
Einfachheit der Benutzung
Ingres
Transaktions- und Data Warehouse Support
Programmierbarkeit
Verfügbarkeit & Sicherheit
PostgreSQL
Data Warehousing
Datentypen & Schnittstellen
Programmierbarkeit
Vielfalt der unterstützten Plattformen
Quelle: Datenbankspektrum, 6.
Jahrgang, Heft 19, November 2006
Christian Schieder
Open Source Business Intelligence 28
TDWI Jahrestagung, München 2007
29. Weitere Informationen zu (Open Source) Datenbanken
2.1 Marktüberblick.Datenbanken
http://en.wikipedia.org/wiki/Comparison_of_relational_database
_management_systems
http://www.heise.de/open/artikel/70100/0
(Open Source Jahrbuch 2006)
http://www.datenbank-
spektrum.de/v2/archiv/produkte.html?nummer=19&id=2
(Datenbank Spektrum 19/2006 & 22/2007 [August!])
Christian Schieder
Open Source Business Intelligence 29
TDWI Jahrestagung, München 2007
30. De facto Standard für BI-Architekturen
2.2 Marktüberblick.Datenintegration
Data
Data Warehouse System Analytical Presentation
Acquisition Layer Layer
Layer DWH Layer
Staging Layer
ETL
ETL ETL
SQL based
Bulk Load SQL based
Insert/select
Insert/select
View build
Performance
Star-Schema Objects
File System
Quelle: IBM
Christian Schieder
Open Source Business Intelligence 30
TDWI Jahrestagung, München 2007
31. ETL/EII
2.2 Marktüberblick.Datenintegration
Kettle
Talend Open Studio
CloverETL
KETL
Mule
Christian Schieder
Open Source Business Intelligence 31
TDWI Jahrestagung, München 2007
32. Projektsteckbrief Pentaho Data Integration
2.2 Marktüberblick.Datenintegration
Pentaho Data Integration (Kettle)
Aktuelles Release: v.2.5.0
Lizenz: MPL
Kurzbeschreibung: Pentaho Data Integration delivers powerful Extraction, Transformation
and Loading (ETL) capabilities using an innovative, metadata-driven approach. The ease of use
in our graphical, drag-and-drop design increases productivity and our extensible, standards
based architecture ensures that you will never be forced to adopt proprietary methodologies into
your ETL solution.
Entwickler: Pentaho Inc., Orlando, Florida, USA
Projektbeginn: 2005 (2002)
Projektseite: http://kettle.pentaho.org/
Bemerkungen:
Reifstes OS ETL Tool
Bestandteil der Pentaho Suite
4 Komponenten: Spoon, Pan, Chef, Kitchen
Christian Schieder
Open Source Business Intelligence 32
TDWI Jahrestagung, München 2007
33. Bestandteile Pentaho Data Integration
2.2 Marktüberblick.Datenintegration
Christian Schieder
Open Source Business Intelligence 33
TDWI Jahrestagung, München 2007
34. Projektsteckbrief Talend Open Studio
2.2 Marktüberblick.Datenintegration
Talend Open Studio
Aktuelles Release: v.2.0.0
Lizenz: GPL
Kurzbeschreibung: Talend Open Studio provides advanced capabilities to improve the
productivity of data integration job design and proven scalability to ensure optimal execution. It is
the most open, innovative and powerful data integration solution on the market today. It contains
a Business Modeler, a Job Designer, a Metadata Repository and a scheduler. In selecting
Java as the development language of Talend Open Studio, by relying on Java, Perl and SQL
code generation, and by completely opening the solution, Talend is committed to the support of
open standards that ensure the robustness of its products and services.
Entwickler: Talend SA, Frankreich
Projektbeginn: 2006 (2003)
Projektseite: http://www.talend.com
Bemerkungen:
Entwickler sind ehemalige Data Stage/Informatica ETL Consultants
Online Tutorials
Look&Feel am ehesten mit kommerziellen Produkten vegleichbar
Bestandteil von Spago BI & Jasper Intelligence Suite (Jasper ETL)
Christian Schieder
Open Source Business Intelligence 34
TDWI Jahrestagung, München 2007
35. Bestandteile von Talend Open Studio
2.2 Marktüberblick.Datenintegration
Christian Schieder
Open Source Business Intelligence 35
TDWI Jahrestagung, München 2007
36. Talend Open Studio vs. Data Integration Services
2.2 Marktüberblick.Datenintegration
…extrem parallel
ETL„ing…
Christian Schieder
Open Source Business Intelligence 36
TDWI Jahrestagung, München 2007
37. Open Source Service Bus “Mule”
2.2 Marktüberblick.Datenintegration
Mule
Aktuelles Release: v.1.4.1
Lizenz: MPL-style
Kurzbeschreibung: Mule is the leading open source ESB (Enterprise Service Bus) and
integration platform. It is a scalable, highly distributable object broker that can seamlessly
handle interactions with services and applications using disparate transport and messaging
technologies. Mule is a light-weight messaging framework. The Mule framework provides a highly
scalable environment in which you can deploy your business components.
Entwickler: MuleSource & Community
Projektbeginn: 2006 (2005)
Projektseite: http://mule.codehaus.org/
Bemerkungen:
Viel beachtetes und prämiertes Projekt
Mittlerweile eigene Konferenz
Ziel: Unterstützung für Event-driven Systems (Next Generation SOA)
Christian Schieder
Open Source Business Intelligence 37
TDWI Jahrestagung, München 2007
39. De facto Standard für BI-Architekturen
2.3 Marktüberblick.Analyse
Data
Data Warehouse System Analytical Presentation
Acquisition Layer Layer
Layer DWH Layer
Staging Layer
ETL
ETL ETL
SQL based
Bulk Load SQL based
Insert/select
Insert/select
View build
Performance
Star-Schema Objects
File System
Quelle: IBM
Christian Schieder
Open Source Business Intelligence 39
TDWI Jahrestagung, München 2007
40. OLAP
2.3 Marktüberblick.Analyse
Mondrian
PALO
JPivot
Cubulus OLAP
Christian Schieder
Open Source Business Intelligence 40
TDWI Jahrestagung, München 2007
41. Projektsteckbrief Mondrian
2.3 Marktüberblick.Analyse
Mondrian
Aktuelles Release: v.2.3.2
Lizenz: MPL
Kurzbeschreibung: Mondrian is an OLAP (online analytical processing) database written in
Java. It reads from JDBC data sources, aggregates data in a memory cache, and implements the
MDX language and XML/A API.
Entwickler: Pentaho Inc., Orlanda, Florida, USA
Projektbeginn: 2001
Projektseite: http://mondrian.pentaho.org/
Bemerkungen:
Open Source ROLAP Server
Schwesterprojekt jPivot als Front-End (http://jpivot.sourceforge.net/ )
Bestandteil der Pentaho Plattform
Christian Schieder
Open Source Business Intelligence 41
TDWI Jahrestagung, München 2007
43. Projektsteckbrief Palo
2.3 Marktüberblick.Analyse
Palo
Aktuelle Release: v.1.5.0
Lizenz: GPL + Kommerziell
Kurzbeschreibung: Palo-Server is a cell-oriented, multi-dimensional data server, specifically
developed for spreadsheet data storage and analysis. Palo-Server provides a central database
for Enterprise Spreadsheets in Microsoft Excel and offers interfaces to many third-party
databases provided by SAP, IBM, Microsoft and Oracle.
Entwickler: Jedox GmbH, Freiburg
Projektbeginn: 2004
Projektseite: http://www.palo.net
Bemerkungen:
Einziger Open Source MOLAP Server
Excel Plug-In (Front-End) als Freeware verfügbar (Portierung auf Open Office
findet derzeit statt => erster vollständiger Open Source MOLAP Stack in
Reichweite: http://sourceforge.net/projects/palooca/)
Kommerzielles ETL Werkzeug Cubeware Importer unterstützt PALO (auch als
Freeware verfügbar: http://www.imppalo.com/)
Christian Schieder
Open Source Business Intelligence 43
TDWI Jahrestagung, München 2007
44. Architekturschema eines Palo-basierten MOLAP-Systems
2.3 Marktüberblick.Analyse
Palo Excel Integration
MS Excel®
Betriebssystem
Windows Palo Data Server
Betriebssystem
Windows / Linux
Cubeware Importer
ImpPalo
Daten
Christian Schieder
Open Source Business Intelligence 44
TDWI Jahrestagung, München 2007
45. OLAP - LiveDemo: Palo
2.3 Marktüberblick.Analyse
Christian Schieder
Open Source Business Intelligence 45
TDWI Jahrestagung, München 2007
46. Data Mining
2.3 Marktüberblick.Analyse
WEKA
RapidMiner
KNIME
Christian Schieder
Open Source Business Intelligence 46
TDWI Jahrestagung, München 2007
47. Projektsteckbrief RapidMiner (I)
2. Marktüberblick
RapidMiner (Yale)
Aktuelles Release: v.4.0.0 [Yale v.3.5.0]
Lizenz: GPL + Kommerziell
Kurzbeschreibung: Yale is an environment for machine learning and data mining
experiments. It allows experiments to be made up of a large number of arbitrarily nestable
operators and they are described in XML files which can easily be created with YALE's GUI.
Applications of YALE cover both research and real-world data mining tasks.
Entwickler:
Universität Dortmund (Lehrstuhl für Künstliche Intelligenz)
Rapid-i GbR (Spin-Off)
Projektbeginn: 2001
Projektseite:
http://rapid-i.com/
http://sourceforge.net/projects/yale/
Bemerkungen:
WEKA-Plug-In
Interaktives Online Demo
Christian Schieder
Open Source Business Intelligence 47
TDWI Jahrestagung, München 2007
48. Projektsteckbrief RapidMiner (II): Screens
2.3 Marktüberblick.Analyse
Christian Schieder
Open Source Business Intelligence 48
TDWI Jahrestagung, München 2007
49. Projektsteckbrief RapidMiner (III): Download Impact
2.3 Marktüberblick.Analyse
Download History RapidMiner
Christian Schieder
Open Source Business Intelligence 49
TDWI Jahrestagung, München 2007
50. Projektsteckbrief KNIME (I)
2.3 Marktüberblick.Analyse
KNIME: KoNstanz Information MinEr [naIm]
Aktuelles Release: v.1.2.1
Lizenz: LGPL ähnlich (Aladdin Free Public License) + Kommerziell
Kurzbeschreibung: KNIME, is a modular data exploration platform that enables the user
to visually create data flow. Incorporates over 100 processing nodes for data I/O,
preprocessing and cleansing, modelling, analysis and data mining. It includes all analysis
modules of Weka data mining environment and additional plugins allow R-scripts to be run,
offering access to a vast library of statistical routines. KNIME is based on the Eclipse platform
and, through it's modular API, easily extensible.
Entwickler:
Universität Konstanz (Chair for Bioinformatics and Information Mining)
KNIME GmbH (Spin-Off)
Projektbeginn: 2005
Projektseite: http://www.knime.org
Bemerkung:
Eclipse Plug-In/RCP
Integration in OS-Reporting-Tools (BIRT, jFreeCharts)
Christian Schieder
Open Source Business Intelligence 50
TDWI Jahrestagung, München 2007
51. Projektsteckbrief KNIME (II): Screens
2.3 Marktüberblick.Analyse
Christian Schieder
Open Source Business Intelligence 51
TDWI Jahrestagung, München 2007
52. CRISP-DM: CRoss-Industry Standard Process for Data Mining
2.3 Marktüberblick.Analyse
Business Data
Understanding Understanding
Schwerpunkte der
Toolunterstützung
Data
Preparation
Deployment Data
Modeling
Evaluation
Quelle: http://www.crisp-dm.org/Process/index.htm
Christian Schieder
Open Source Business Intelligence 52
TDWI Jahrestagung, München 2007
55. Unterstützungsgrad in den Phasen des CRISP-Zyklus
2.3 Marktüberblick.Analyse
Business Data
Understanding Understanding
Data
Preparation
Deployment Data
Modeling
Kaum unterstützt
Evaluation
Teilweise unterstützt
Größtenteils unterstützt
Voll unterstützt
Christian Schieder
Open Source Business Intelligence 55
TDWI Jahrestagung, München 2007
56. De facto Standard für BI-Architekturen
2.4 Marktüberblick.Presentation
Data
Data Warehouse System Analytical Presentation
Acquisition Layer Layer
Layer DWH Layer
Staging Layer
ETL
ETL ETL
SQL based
Bulk Load SQL based
Insert/select
Insert/select
View build
Performance
Star-Schema Objects
File System
Quelle: IBM
Christian Schieder
Open Source Business Intelligence 56
TDWI Jahrestagung, München 2007
57. Reporting & Dashboards
2.4 Marktüberblick.Presentation
Quelle: Microstrategy Webinar: Using Dashboards to Improve Corporate Performance: Top 10
Best Practices, http://www.microstrategy8.com/dynamicdashboards.asp
Christian Schieder
Open Source Business Intelligence 57
TDWI Jahrestagung, München 2007
58. Reporting & Dashboards
2.4 Marktüberblick.Presentation
Eclipse BIRT
JasperReports
Pentaho Reporting (jFreeReports)
jPivot
MARVELit Dash Portal
Christian Schieder
Open Source Business Intelligence 58
TDWI Jahrestagung, München 2007
59. Projektsteckbrief Eclipse BIRT (I)
2.4 Marktüberblick.Presentation
Eclipse BIRT
Aktuelle Release: v.2.1.3 (2.2)
Lizenz: EPL (Eclipse Public License) [weitestgehend frei von Restriktionen]
Kurzbeschreibung: BIRT is an Eclipse-based open source reporting system for web
applications, especially those based on Java and J2EE. BIRT has two main components: a
report designer based on Eclipse, and a runtime component that you can add to your app server.
BIRT also offers a charting engine that lets you add charts to your own application.
Entwickler: BIRT Project Management Committee (PMC) & Community &
Eclipse Foundation
Projektbeginn: 2005 (2004)
Projektseite: http://www.eclipse.org/birt/
Bemerkungen:
Kommerziell potenteste Community
Eingebettet in das weit verbreitete Eclipse-Framework
Projekt mit sehr hohem Impact
Christian Schieder
Open Source Business Intelligence 59
TDWI Jahrestagung, München 2007
60. Projektsteckbrief Eclipse BIRT (II)
2.4 Marktüberblick.Presentation
Christian Schieder
Open Source Business Intelligence 60
TDWI Jahrestagung, München 2007
61. Höchster Impact bei Open Source Reporting Tools
2.4 Marktüberblick.Presentation
1000 Downloads BIRT Downloads
350
300
250
200
150
100
50
0
H1 05 H2 05 H1 06 H2 06
Quelle: www.actuate.de/BIRT-OnlineSeminar-2
Christian Schieder
Open Source Business Intelligence 61
TDWI Jahrestagung, München 2007
62. Projektsteckbrief MarvelIT Dash Portal
2.4 Marktüberblick.Presentation
MarvelIT Dash Portal
Aktuelles Release: v.1.0.1
Lizenz: GPL + Kommerziell
Kurzbeschreibung: MARVELit DASH is an open source Business Intelligence solution
based on Apache Jetspeed. DASH attempts to simplify the process of creating and maintaining
a web-based business intelligence dashboard and centralized reporting for companies of any
size.
Entwickler: MarvelIT, USA
Projektbeginn: 2006 (2004)
Projektseite:
http://http://sourceforge.net/projects/marvelit/ (Open Source)
http://www.marvelit.com/ (Kommerziell)
Bemerkungen:
Open Source Ableger eines kommerziell erfolgreichen Produktes
Interaktives Online Demo (http://www.marvelit.com/demo.html)
Christian Schieder
Open Source Business Intelligence 62
TDWI Jahrestagung, München 2007
63. Building Dashboards. Open Source Style…
2.4 Marktüberblick.Presentation
Christian Schieder
Open Source Business Intelligence 63
TDWI Jahrestagung, München 2007
64. De facto Standard für BI-Architekturen
2.5 Marktüberblick.Plattformen
Data
Data Warehouse System Analytical Presentation
Acquisition Layer Layer
Layer DWH Layer
Staging Layer
ETL
ETL ETL
SQL based
SQL based
Bulk Load Insert/select
Insert/select
View build
Performance
Star-Schema Objects
File System
Quelle: IBM
Christian Schieder
Open Source Business Intelligence 64
TDWI Jahrestagung, München 2007
65. BI-Plattformen
2.5 Marktüberblick.Plattformen
Pentaho BI Project
JasperSoft BI Suite
SpagoBI
OpenI
Christian Schieder
Open Source Business Intelligence 65
TDWI Jahrestagung, München 2007
66. Projektsteckbrief Pentaho
2.5 Marktüberblick.Plattformen
Pentaho
Aktuelle Release: v.1.2.1
Lizenz: MPL + Kommerziell
Kurzbeschreibung: The Pentaho BI Project provides enterprise-class reporting, analysis,
dashboard, data mining and workflow capabilities that help organizations operate more
efficiently and effectively. The software offers flexible deployment options that enable use as
embeddable components, customized BI application solutions, and as a complete out-of-the-box,
integrated BI platform. Ranked #1 in Open Source Business Intelligence.
Entwickler: Pentaho Inc., Orlando, Florida, USA
Projektbeginn: 2002
Projektseite:
http://www.pentaho.com/
http://sourceforge.net/projects/pentaho/
Bemerkungen:
Bekanntestes OSBI Projekt
Integration verschiedener etablierter OSBI Projekte: jFreeReport, Kettle,
Mondrian, Weka
Vorkonfiguriertes Demo zum download
Christian Schieder
Open Source Business Intelligence 66
TDWI Jahrestagung, München 2007
68. Projektsteckbrief SpagoBI
2.5 Marktüberblick.Plattformen
SpagoBI
Aktuelle Release: v.1.9.2
Lizenz: LGPL
Kurzbeschreibung: a complete Free/Open Source solution for the development of Business
Intelligence projects. Entirely realized by means of the Free Open Source Software philosophy, it
is an integrated Business Intelligence suite able to cover all its functional aspects, like: the (static
and dynamic) data organization, inquiring, hidden information discovering by means of the data
mining technique, the building of a structured and dynamic publishing and control suite. SpagoBI
is structured with components in order to achieve each of the BI functionalities by a specific
module.
Entwickler: Engineering Ingegneria Informatica, Italien & Community
Projektbeginn: 2005
Projektseite: http://www.spagobi.org/
Bemerkungen:
Europäische Alternative zu Pentaho und Jasper
Starker Community Fokus
Dynamische Entwicklung in den letzten Monaten
Christian Schieder
Open Source Business Intelligence 68
TDWI Jahrestagung, München 2007
70. Zusammenfassung Marktüberblick
2. Marktüberblick
Fazit: Open Source Business Intelligence Tools
erreichen heute (noch) nicht (in allen Bereichen)
die Leistungsfähigkeit kommerzieller Produkte
Aber: OS-Tools entwickeln sich sehr dynamisch
Folgen:
wachsender Reifegrad von Open Source Tools
steigende Relevanz von OS Tools
zunehmender Preisdruck für Anbieter
Stärkung der Kundenposition
Tipp: Anforderungen genau definieren und OS-Tools im
Einzelfall untersuchen
Christian Schieder
Open Source Business Intelligence 70
TDWI Jahrestagung, München 2007
71. Gliederung
Open Source Business Intelligence
1. Einleitung & Grundlagen
2. Marktüberblick
3. Szenarien & Bedingungen für den Einsatz von
Open Source Business Intelligence
4. Zusammenfassung & Ausblick
Christian Schieder
Open Source Business Intelligence 71
TDWI Jahrestagung, München 2007
72. OSBI Nutzen: What’s new?
3. Szenarien & Bedingungen für den Einsatz von OSBI
Alternativen zum Aufbau einer BI-Lösung:
Adapt
Build
Individualentwicklung
Manufacturing
Buy Source
Open
MarketSourcing
Open sourcing
Christian Schieder
Open Source Business Intelligence 72
TDWI Jahrestagung, München 2007
73. OSBI Nutzen: Kostenvorteile
3. Szenarien & Bedingungen für den Einsatz von OSBI
Kommerzielle
Lösungen
Open Source
basierte
TCO
Lösungen
Go Live Zeit
Quelle: BI Journal Dez. 2006
Christian Schieder
Open Source Business Intelligence 73
TDWI Jahrestagung, München 2007
74. OSBI Nutzen: Hinweise zum Einstieg in OSBI
3. Szenarien & Bedingungen für den Einsatz von OSBI
»Think big – start small«:
Klein beginnen, schnellen Nutzen erzielen
Lösungen wachsen mit Anforderungen
Kosten und Nutzen:
Open Source bedeutet nicht zwingend günstiger
Keine Lizenzkosten
Investition in Anforderungsdefinition
Deutlich höherer (Initial-) Nutzen
Flexibilität:
Erweiterbarkeit durch Offenheit
Offene Standards gewährleisten Interoperabilität im IT-Ökosystem
Christian Schieder
Open Source Business Intelligence 74
TDWI Jahrestagung, München 2007
75. Hinweise zum Einstieg in OSBI: Support
3. Szenarien & Bedingungen für den Einsatz von OSBI
Grundsätzlich 2 Möglichkeiten:
Community
Klassisches OS Support-Modell
Größe und Vitalität der Community entscheidend
Sponsoren
Kommerzieller Support
wie gewohnt
wachsende Anzahl von Firmen (Mittelstand)
Christian Schieder
Open Source Business Intelligence 75
TDWI Jahrestagung, München 2007
76. Gliederung
Open Source Business Intelligence
1. Einleitung & Grundlagen
2. Marktüberblick
3. Szenarien & Bedingungen für den Einsatz von
Open Source Business Intelligence
4. Zusammenfassung & Ausblick
Christian Schieder
Open Source Business Intelligence 76
TDWI Jahrestagung, München 2007
77. Durchbruch von OSS und OSBI ist voll im Gange
4. Zusammenfassung & Ausblick
MIS Quarterly, Sept. 2006: “OSS 2.0-Ära hat bereits
begonnen.”
Sourceforge.net: mehr als 200 OSS-Projekte mit BI-Bezug
Venture Capital: 2-stellige Millionen-$ Beträge werden in
OSBI-Firmen/Projekte investiert
Christian Schieder
Open Source Business Intelligence 77
TDWI Jahrestagung, München 2007
78. Verbreitungsgrad (US-Studie 2006)
4. Zusammenfassung & Ausblick
Verbreitungsgrad von OSBI:
83% der Firmen die BI einsetzen, evaluieren oder setzen auch OSBI
ein
Zufriedenheit mit OSBI:
65% planen den verstärkten Einsatz von OSBI
4% steigen wieder aus
Reifegrad von OSBI:
54% sagen, OSBI hat den gleichen Reifegrad wie proprietäre BI
TCO von OSBI:
59% sind überzeugt, dass OSBI einen niedrigeren TCO hat
Interoperabilität und Flexibilität
58% sehen Vorteile bei OSBI
Quelle: Ventana Research 2006
Christian Schieder
Open Source Business Intelligence 78
TDWI Jahrestagung, München 2007
79. Ausblick: Warum OSBI für Sie wichtig sein könnte
4. Zusammenfassung & Ausblick
Wenn Sie Anwender sind:
Niedrige Eintrittsbarrieren (einfach mal ausprobieren)
BI-KnowHow erwerben
Verhandlungsposition gegenüber Anbietern stärken
Wenn Sie Hersteller sind:
Innovationen antizipieren
Marktanteile durch hybride Strategien sichern/gewinnen
Christian Schieder
Open Source Business Intelligence 79
TDWI Jahrestagung, München 2007
80. Ausblick: Thesen
4. Zusammenfassung & Ausblick
Die Frage lautet nicht mehr, ob OSBI eine Rolle spielen wird oder
nicht, sondern nur noch welche
Hybride Geschäftsmodelle werden sich weiter verbreiten
(Kommerzielle Anbieter werden OSBI-Komponenten anbieten und
integrieren)
Der Reifegrad von OSBI wird sich proprietären Lösungen weiter
nähern
OSBI ist (größtenteils) Business Ready
OSBI verringert die BI-Eintrittsbarrieren für den Mittelstand
signifikant
OSBI-Komponenten sind prädestiniert für den Einsatz in
leichtgewichtigen webbasierten BI-Lösungen
OSBI ist eine ideale Spielwiese für IT-Abteilungen zum Aufbau von
BI-KnowHow
Christian Schieder
Open Source Business Intelligence 80
TDWI Jahrestagung, München 2007
81. Weitere Informationen
4. Zusammenfassung & Ausblick
http://press.teleinteractive.net/oss
http://www.squidoo.com/osbi
http://www.heise.de/open/
http://biteam.wordpress.com/
Christian Schieder
Open Source Business Intelligence 81
TDWI Jahrestagung, München 2007
82. Gliederung
Open Source Business Intelligence
1. Einleitung & Grundlagen
2. Marktüberblick
3. Szenarien & Bedingungen für den Einsatz von
Open Source Business Intelligence
4. Zusammenfassung & Ausblick
Anhang
Christian Schieder
Open Source Business Intelligence 82
TDWI Jahrestagung, München 2007
83. OSBI-Beispiel (I): Palo Excel Plug-In “Lizenzarchitektur”
2.3 Marktüberblick.Analyse
Palo Excel Integration
MS Excel®
Betriebssystem
Windows Palo Data Server
Betriebssystem
Linux
Cubeware Importer
ImpPalo
Daten
Christian Schieder
Open Source Business Intelligence 83
TDWI Jahrestagung, München 2007
84. OSBI-Beispiel (I): Palo Excel Plug-In
Anhang.Weitere Beispiele
Christian Schieder
Open Source Business Intelligence 84
TDWI Jahrestagung, München 2007
85. OSBI-Beispiel (I): PalOOCa Open Office Calc Plug-In
Anhang.Weitere Beispiele
Christian Schieder
Open Source Business Intelligence 85
TDWI Jahrestagung, München 2007
86. Architekturschema eines Palo-basierten MOLAP-Systems
2.3 Marktüberblick.Analyse
PalOOCa Plug-In
Open Office Calc
Betriebssystem
Linux Palo Data Server
Betriebssystem
Linux
Cubeware Importer
ImpPalo
Daten
Christian Schieder
Open Source Business Intelligence 86
TDWI Jahrestagung, München 2007
87. OSBI-Beispiel (I)
Anhang.Weitere Beispiele
Open Source MOLAP: PalOOCa – Palo Plug-in for OpenOffice Calc
Kooperationsprojekt zwischen dem Lehrstuhl Wirtschaftsinformatik II
an der TU Chemnitz und der Jedox GmbH (Freiburg) sowie einer Reihe
internationaler Sponsoren
Ziel: Entwicklung eines vollständig Open Source-basierten
MOLAP Stacks
Projektstart: 03 / 2007 (11 / 2006)
Technologie: Open Source OLAP Server PALO, Open Office Calc,
Java
Status: Beta-Stadium erreicht
Projektseite: http://sourceforge.net/projects/palooca/
Weitere Infos unter: http://www.jedox.com/en/news/216/Palo_for_OpenOffice.org_Calc.html
Christian Schieder
Open Source Business Intelligence 87
TDWI Jahrestagung, München 2007
88. OSBI-Beispiel (II): UweX++
Anhang.Weitere Beispiele
Operational BI – UweX++: Analytische Erweiterung in einer Software zum
Gebrauchtwagenhandel im VW-Vertriebsnetz
Kooperationsprojekt zwischen dem Lehrstuhl Wirtschaftsinformatik II
an der TU Chemnitz und der myMotion KG (Chemnitz)
Ziel: Entwicklung analytischer Funktionen für
Gebrauchtwagenhandelssoftware UWE-X
Projektstart: 05 / 2007
Technologie: MySQL, Mondrian, jPivot, UWE-X
Durchführung: Im Rahmen eines studentischen BI-Praktikums
Weitere Info: http://www.my-motion.de/
Christian Schieder
Open Source Business Intelligence 88
TDWI Jahrestagung, München 2007
89. OSBI-Beispiel (II): UweX++
Anhang.Weitere Beispiele
Operational BI – UweX++: Analytische Erweiterung in einer Software zum
Gebrauchtwagenhandel im VW-Vertriebsnetz
Kooperationsprojekt zwischen dem Lehrstuhl Wirtschaftsinformatik II
an der TU Chemnitz und der myMotion KG (Chemnitz)
Ziel: Entwicklung analytischer Funktionen für
Gebrauchtwagenhandelssoftware UWE-X
Projektstart: 05 / 2007
Technologie: MySQL, Mondrian, jPivot, UWE-X
Durchführung: Im Rahmen eines studentischen BI-Praktikums
Weitere Info: http://www.my-motion.de/
Christian Schieder
Open Source Business Intelligence 89
TDWI Jahrestagung, München 2007