BI und ECM - Verbindung von strukturierten und unstrukturierten DatenBARC GmbH
Endlich einmal umfassend informiert sein – dazu müssen die strukturierten Daten (Fachsysteme, BI-Anwendungen) mit den unstrukturierten Daten (Dokumente) verbunden werden. Um einen echten Nutzen zu erreichen, müssen die Zusammenhänge erkannt und die Inhalte bedarfsgerecht in den Geschäftsprozessen bereitgestellt werden. Dabei ist zu beachten, dass sich die Informationswelt bspw. durch Social Media ändert. Eine umfassende Strategie und entsprechende Werkzeuge zu deren Umsetzung sind erforderlich.
Erfahren Sie mehr über die Zusammenhänge und die aktuellen Entwicklungen mithilfe des Vortrags unseres ECM-Analysten Martin Böhn (Head of Enterprise Content Management ), der im Rahmen des BI-Forums auf der diesjährigen CeBIT gehalten wurde.
Mobile BI - Mobilisieren von UnternehmensprozessenBARC GmbH
Mobile BI – Business Intelligence für unterwegs! Ob während der Zugfahrt, der Wartezeit vor dem Abflug oder während der Mittagspause – mit Mobile BI können Nutzer endlich auch über ein mobiles Endgerät auf BI-Anwendungen zugreifen und schnell relevante Daten zur Hand haben.
Gewinnen Sie einen Einblick in dieses Thema mithilfe des Vortrags unseres BI-Analysten Steffen Vierkorn (Head of Business Intelligence and Data Warehousing), der im Rahmen des BI-Forums auf der diesjährigen CeBIT gehalten wurde.
Aktuelle Trends in der Visualisierung von InformationenBARC GmbH
Im Zuge wachsender Datenbestände sowie dem interaktiven Zugang zu großen Mengen an Daten spielt die Visualisierung von Informationen eine immer bedeutendere Rolle. Trend-Themen wie Dashboards, erweiterte Grafiktypen, Self Service BI sowie die Standardisierung der Informationsvisualisierung bspw. nach Hichert bringen immer neue Visualisierungsmöglichkeiten hervor und erweitern die Möglichkeiten der angebotenen BI-Systeme. Hinsichtlich der Umsetzung von Visual BI können drei Gruppen von Werkzeugen unterschieden werden: BI-Werkzeuge mit grafischen Standard-Möglichkeiten, Spezialisten und klassische BI-Werkzeuge mit erweiterten grafischen Möglichkeiten sowie statistische Visualisierungswerkzeuge in klassischen oder visuellen Data-Mining-Werkzeugen.
Der Markt für Planungs- und Controlling-SystemeBARC GmbH
Insbesondere aus der Finanzkrise haben Unternehmen erkannt, wie wichtig Transparenz über das Geschehen im Unternehmen und seinem Umfeld sowie flexible Planungs- und Prognose-Möglichkeiten für die Zukunft zur eigenen Steuerung sind. Insbesondere die Planung hat aus diesem Grund durch die Finanzkrise nochmals immens an Bedeutung gewonnen. Am Markt für Planungs- und Controlling-Systeme werden im deutschsprachigen Raum ca. 40-50 Systeme angeboten, die im Gegensatz zu Excel eine umfassende Unterstützung des gesamten Planungs- und Controlling-Prozesses durch vordefinierte, integrierte Funktionen und Logiken bieten. Nichtsdestotrotz bleibt Excel weiterhin als alleiniges oder ergänzendes Software-Werkzeug für Planung die meistgenutzte Lösung.
2012 04-17 Die automatische Post- und RechnungseingangsbearbeitungBARC GmbH
Systeme für das Input Management (IM) können viele Prozesse rund um die Posteingangs- und Rechnungsbearbeitung automatisieren und beschleunigen. Sie übernehmen die Klassifikation, Datenextraktion, Verteilung und Bearbeitung von entsprechenden Dokumenten im Unternehmen.
Gewinnen Sie einen Einblick in dieses Thema mithilfe des Vortrags unseres Enterprise-Content-Management-Analysten Michael Schiklang.
BI und ECM - Verbindung von strukturierten und unstrukturierten DatenBARC GmbH
Endlich einmal umfassend informiert sein – dazu müssen die strukturierten Daten (Fachsysteme, BI-Anwendungen) mit den unstrukturierten Daten (Dokumente) verbunden werden. Um einen echten Nutzen zu erreichen, müssen die Zusammenhänge erkannt und die Inhalte bedarfsgerecht in den Geschäftsprozessen bereitgestellt werden. Dabei ist zu beachten, dass sich die Informationswelt bspw. durch Social Media ändert. Eine umfassende Strategie und entsprechende Werkzeuge zu deren Umsetzung sind erforderlich.
Erfahren Sie mehr über die Zusammenhänge und die aktuellen Entwicklungen mithilfe des Vortrags unseres ECM-Analysten Martin Böhn (Head of Enterprise Content Management ), der im Rahmen des BI-Forums auf der diesjährigen CeBIT gehalten wurde.
Mobile BI - Mobilisieren von UnternehmensprozessenBARC GmbH
Mobile BI – Business Intelligence für unterwegs! Ob während der Zugfahrt, der Wartezeit vor dem Abflug oder während der Mittagspause – mit Mobile BI können Nutzer endlich auch über ein mobiles Endgerät auf BI-Anwendungen zugreifen und schnell relevante Daten zur Hand haben.
Gewinnen Sie einen Einblick in dieses Thema mithilfe des Vortrags unseres BI-Analysten Steffen Vierkorn (Head of Business Intelligence and Data Warehousing), der im Rahmen des BI-Forums auf der diesjährigen CeBIT gehalten wurde.
Aktuelle Trends in der Visualisierung von InformationenBARC GmbH
Im Zuge wachsender Datenbestände sowie dem interaktiven Zugang zu großen Mengen an Daten spielt die Visualisierung von Informationen eine immer bedeutendere Rolle. Trend-Themen wie Dashboards, erweiterte Grafiktypen, Self Service BI sowie die Standardisierung der Informationsvisualisierung bspw. nach Hichert bringen immer neue Visualisierungsmöglichkeiten hervor und erweitern die Möglichkeiten der angebotenen BI-Systeme. Hinsichtlich der Umsetzung von Visual BI können drei Gruppen von Werkzeugen unterschieden werden: BI-Werkzeuge mit grafischen Standard-Möglichkeiten, Spezialisten und klassische BI-Werkzeuge mit erweiterten grafischen Möglichkeiten sowie statistische Visualisierungswerkzeuge in klassischen oder visuellen Data-Mining-Werkzeugen.
Der Markt für Planungs- und Controlling-SystemeBARC GmbH
Insbesondere aus der Finanzkrise haben Unternehmen erkannt, wie wichtig Transparenz über das Geschehen im Unternehmen und seinem Umfeld sowie flexible Planungs- und Prognose-Möglichkeiten für die Zukunft zur eigenen Steuerung sind. Insbesondere die Planung hat aus diesem Grund durch die Finanzkrise nochmals immens an Bedeutung gewonnen. Am Markt für Planungs- und Controlling-Systeme werden im deutschsprachigen Raum ca. 40-50 Systeme angeboten, die im Gegensatz zu Excel eine umfassende Unterstützung des gesamten Planungs- und Controlling-Prozesses durch vordefinierte, integrierte Funktionen und Logiken bieten. Nichtsdestotrotz bleibt Excel weiterhin als alleiniges oder ergänzendes Software-Werkzeug für Planung die meistgenutzte Lösung.
2012 04-17 Die automatische Post- und RechnungseingangsbearbeitungBARC GmbH
Systeme für das Input Management (IM) können viele Prozesse rund um die Posteingangs- und Rechnungsbearbeitung automatisieren und beschleunigen. Sie übernehmen die Klassifikation, Datenextraktion, Verteilung und Bearbeitung von entsprechenden Dokumenten im Unternehmen.
Gewinnen Sie einen Einblick in dieses Thema mithilfe des Vortrags unseres Enterprise-Content-Management-Analysten Michael Schiklang.
www.opitz-consulting.com/go/3-6-11
Im Sommer 2010 brachte Oracle das Release OBI EE 11g heraus. Die Oracle Experten der IT-Beratung OPITZ CONSULTING, Andreas Ballenthin und Timo Bergenthal, berichteten in ihrem Vortrag auf der DOAG Konferenz im Herbst 2010 in Nürnberg über erste Erfahrungen aus dem praktischen Einsatz des neuen Releases.
Sie stellten neue Einsatzgebiete, Migrationswege und Integrationsszenarien vor – unterzogen die Architektur und die neuen Features aber auch einer kritischen Würdigung.
Die Referenten wiesen zudem auf notwendige Maßnahmen, Fallstricke und mögliche Hürden bei der Migration von einem bisherigen Release der Oracle BI Suite EE hin und zeigten Wege auf für die Umsetzung von integrativen Lösungen mittels Webservice, Java etc.
--
Möchten Sie mehr über unsere Unterstützungsangebote im Bereich IT-Infrastruktur-Management erfahren? Hier finden Sie weitere Informationen: www.opitz-consulting.com/go/3-6-876
Wie Sie Ihren SharePoint zur Plattform für applikationsübergreifende ECM Prozesse erweitern zeigt dieser Vortrag anhand des Beispiels Eingangsrechnungsverwaltung.
Session im Rahmen der Smartpoint Infoveranstaltung "Das Beste für Ihren SharePoint" in Wien.
Welche Vorteile ECM im Kontext SharePoint und ecspand gegenüber herkömmlichen ECM Systemen bietet, wie einfach Scanning, mobile Workflows, Office- und ERP-Integration, (Metadaten-)Suche und Standardprozesse wie Vertragsmangement umgesetzt sind und wie uns das in unser alltäglichen und zukünftigen Arbeit unterstützen kann zeigt diese Präsenation anhand eines typischen Geschäftsprozesses.
Session im Rahmen des d.forum 2012 in Bochum.
========================================================
Mehr Infos zu ecspand und den verwendeten Lösungen finden Sie auf http://www.ecspand.de
ecspand erweitert den SharePoint zur vollwertigen ECM Plattform!
Ob Archivierung, Compliance, Dokumentenintegration, ERP Anbindung oder eine der fertigen Prozesslösungen (Vertragsmanagement, Eingangsrechnungsverwaltung, Qualitätsmanagement): ecspand macht Ihren SharePoint zur zentralen Plattform für dokumentengetriebene Prozesse und das ohne zusätzlichen Archivserver!
Enterprise Content Management im Zeichen von Enterprise 2.0Thorsten Zoerner
Ähnlich dem Wandel des Internets in den letzten Jahren verändern sich auch Unternehmen; weg von statischen Strukturen und hin zu einer dynamischen Organisationsform. Es ist die Rede von Mitmach-Unternehmen, die Kunden und Mitarbeiter als veränderliche Komponenten in Prozessen und Arbeitsabläufen definieren - Inhalte werden über Systemgrenzen hinweg ausgetauscht und verändert. Die Kontrolle über sämtliche Informationen zu behalten, ohne an Flexibilität zu verlieren, ist Aufgabe einer zeitgemäßen Enterprise Content Management Plattform.
Präsentation von Michael Frohn, CEO salesfactory42 auf der sapience Konferenz zum Thema "Kundenorientierte Prozesse mit Salesforce, SAP und Google Enterprise" - wie Sie Ihre Abhängigkeit von SAP verringern können.
www.opitz-consulting.com/go/3-6-11
Im Sommer 2010 brachte Oracle das Release OBI EE 11g heraus. Die Oracle Experten der IT-Beratung OPITZ CONSULTING, Andreas Ballenthin und Timo Bergenthal, berichteten in ihrem Vortrag auf der DOAG Konferenz im Herbst 2010 in Nürnberg über erste Erfahrungen aus dem praktischen Einsatz des neuen Releases.
Sie stellten neue Einsatzgebiete, Migrationswege und Integrationsszenarien vor – unterzogen die Architektur und die neuen Features aber auch einer kritischen Würdigung.
Die Referenten wiesen zudem auf notwendige Maßnahmen, Fallstricke und mögliche Hürden bei der Migration von einem bisherigen Release der Oracle BI Suite EE hin und zeigten Wege auf für die Umsetzung von integrativen Lösungen mittels Webservice, Java etc.
--
Möchten Sie mehr über unsere Unterstützungsangebote im Bereich IT-Infrastruktur-Management erfahren? Hier finden Sie weitere Informationen: www.opitz-consulting.com/go/3-6-876
Wie Sie Ihren SharePoint zur Plattform für applikationsübergreifende ECM Prozesse erweitern zeigt dieser Vortrag anhand des Beispiels Eingangsrechnungsverwaltung.
Session im Rahmen der Smartpoint Infoveranstaltung "Das Beste für Ihren SharePoint" in Wien.
Welche Vorteile ECM im Kontext SharePoint und ecspand gegenüber herkömmlichen ECM Systemen bietet, wie einfach Scanning, mobile Workflows, Office- und ERP-Integration, (Metadaten-)Suche und Standardprozesse wie Vertragsmangement umgesetzt sind und wie uns das in unser alltäglichen und zukünftigen Arbeit unterstützen kann zeigt diese Präsenation anhand eines typischen Geschäftsprozesses.
Session im Rahmen des d.forum 2012 in Bochum.
========================================================
Mehr Infos zu ecspand und den verwendeten Lösungen finden Sie auf http://www.ecspand.de
ecspand erweitert den SharePoint zur vollwertigen ECM Plattform!
Ob Archivierung, Compliance, Dokumentenintegration, ERP Anbindung oder eine der fertigen Prozesslösungen (Vertragsmanagement, Eingangsrechnungsverwaltung, Qualitätsmanagement): ecspand macht Ihren SharePoint zur zentralen Plattform für dokumentengetriebene Prozesse und das ohne zusätzlichen Archivserver!
Enterprise Content Management im Zeichen von Enterprise 2.0Thorsten Zoerner
Ähnlich dem Wandel des Internets in den letzten Jahren verändern sich auch Unternehmen; weg von statischen Strukturen und hin zu einer dynamischen Organisationsform. Es ist die Rede von Mitmach-Unternehmen, die Kunden und Mitarbeiter als veränderliche Komponenten in Prozessen und Arbeitsabläufen definieren - Inhalte werden über Systemgrenzen hinweg ausgetauscht und verändert. Die Kontrolle über sämtliche Informationen zu behalten, ohne an Flexibilität zu verlieren, ist Aufgabe einer zeitgemäßen Enterprise Content Management Plattform.
Präsentation von Michael Frohn, CEO salesfactory42 auf der sapience Konferenz zum Thema "Kundenorientierte Prozesse mit Salesforce, SAP und Google Enterprise" - wie Sie Ihre Abhängigkeit von SAP verringern können.
This document discusses analyzing Twitter data from the user @a_bicky using R. It extracts over 3,200 tweets from the user's timeline using the twitteR package. The tweets are transformed into a data frame with variables like text, date, and source. The data is then summarized using the reshape2 and ggplot2 packages to calculate metrics like average text length by day of week, month, and source. Frequency tables and heat maps are generated to explore patterns in the Twitter data over time.
Liferay Portal - ein Webportal für viele UnternehmensanforderungenGFU Cyrus AG
Liferay Portal ist eines der führenden Open Source Portalsysteme und wird verwendet, um eine Vielzahl innovativer Unternehmenslösungen zu betreiben, z.B. Mitarbeiter-, Vertriebs- Kunden- und Partnerportale, soziale Netzwerke, Workspaces zur Teamarbeit, Unternehmensintranets und öffentliche Websites - zu einem Bruchteil der Kosten properitärer Systeme. Darüber hinaus ermöglicht Liferay die innovative und einfache Integration von Backend-Systemen wie Finanzlösungen, CRM und ERP- Software in Kombination mit den bereits eingebauten Social, Collaboration und Web 2.0 Funktionen. Zahlreiche nationale und internationale Unternehmen setzen Liferay bereits ein (u.a. Lufthansa, Deutsche Post, Deutsche Telekom, BMW, Sparkasse KölnBonn, RWE, Vodafone, HanseMerkur Versicherungen) und es werden täglich mehr. Liferay - ein System auch für ihre Unternehmensanforderungen?
Webportale - Konzept, Vision und Realität. Eine Geschichte von Erfolg und Scheitern.
Liferay - ein Portal für alles? Der Herausforderer aus dem Open Source Lager.
Einsatzszenarien - Was geht? Was nicht? Und was auf gar keinen Fall?
Lifepräsentation - Ein Klick sagt mehr als 1000 Folien. Ein Walk-through durch die Keyfeatures von Liferay
Big Data – Hype mit Potential! Big Data beinhaltet neue Methoden und Technologien, die die wachsende Komplexität im Datenmanagement und Business-Intelligence vernünftig beherrschbar machen soll.
Im Rahmen des vom BARC-Institut ausgerichteten Business Intelligence und Datenmanagement Forums auf der diesjährigen CeBIT, wurde unter anderem dieser Vortrag von Timm Grosser (Senior Analyst) gehalten.
Mit den skalierbaren Standardlösungen von Innovabee für ein modernes und unternehmensweites Berichtswesen steuern Sie Ihr Unternehmen in Richtung "mehr Erfolg".
2012-06-25 SharePoint Konferenz Wien - Bessere Kundenbindung durch Social Med...Thorsten Firzlaff
Bessere Kundenbindung durch Social Media und Mobile Apps in der Praxis
Wie SharePoint als Kommunikationsplattform mit Kunden dienen kann, erfahren Sie hier. Von Social Media und mobilen Applikationen ist in den letzten Jahren viel gesprochen worden, aber wie können Sie die neuen Möglichkeiten nutzen, um mehr aus Ihrem Business herauszuholen? Lernen Sie anhand eines Praxisbeispiels aus der Bauträgerbranche, wie SharePoint Sie dabei unterstützen kann, Ihre Kunden in Ihre internen Prozesse zu integrieren und wie Sie die Kommunikation zu Ihren Kunden verbessern können. SharePoint mit seinen webbasierten Schnittstellen bietet hierfür eine ideale Plattform. Lassen Sie sich überraschen.
Sprecher: Thorsten Firzlaff, Unique-Conceptions
Konzertiertes und Integriertes Business Alignment & Value Management im Umfeld globaler & lokaler SAP BI Landschaften und Systemarchitekturen sowie Game Changer in einem sich rapide wandelnden technologischen Umfeld
Datum: 26. & 27. November 2012
Ort: Hotel Palace Berlin| Budapester Str. 45 | 10787 Berlin, Germany
Website: http://sap-bi.we-conect.com/de
"Overall, a very good experience. Round tables were excellent!!
Thank you for a great event! P.S. Networking was great as well!"
David Ahrens, SAP
we.CONECT bietet mit der Konferenz "Next Generation SAP BI 2012" ein optimales Forum um an 2 Tagen in mehr als 15 Case Studies, 6 World Cafés, 4 Challenge your Peers Sessions, 3 Icebreaker Round Tables und den Networking-Pausen ganzheitliche Strategien, Best Practice-Prozesse, verschiedene Tools und Systeme und die neuesten Entwicklungen rund um das SAP BI vorzustellen und zu diskutieren.
Mehr als 18 namhafte Experten aus der Industrie geben Einblicke in Ihre Ansätze und Lösungen, sowohl auf der technischen, als auch auf der Managementebene. Die Teilnehmer der Next Generation SAP BI 2012 repräsentieren Top-Unternehmen des deutschsprachigen Raums und garantieren eine fokussierte und lösungsorientierte Atmosphäre für Business Partner und Aussteller.
Die Konferenz richtet sich an Mitglieder des Vorstands und der Geschäftsführung, Direktoren, Leiter und verantwortliche Mitarbeiter aus den Bereichen Business Intelligence mit SAP, Unternehmensstrategie, Controlling oder IT.
Zu den Highlights gehören unteranderem die folgenden Keynote-Sessions & World Cafés:
Dr. Lothar Burow, Head of Corporate Business Intelligence, Bayer AG, stellt das effektive und effiziente SAP BI Management bei der Bayer AG vor.
Karl Schindler, Leiter IT, Papierfabrik August Koehler AG, wird erste Einblicke und Erfahrungen von seiner Arbeit mit SAP HANA schildern und ein Tutorium zur Anwendung in der Praxis geben.
Michael Nieendick, Head of Enterprise Services, Lekkerland AG & Co. KG, diskutiert über Chancen und Herausforderungen von BigData.
Christoph Dahl, Abteilungsleiter Reporting und Planung, MAN Truck & Bus AG, wird im we.CONECT World Café Wege und Lösungen für ein effektives SAP BI im Spannungsfeld lokaler Systeme und globaler Prozesse aufzeigen.
Andreas Henzl, Head of IT & Organisation, Coface Central Europe Holding AG, wird über die Einrichtung eines Business Intelligence Competence Centers in einer multinationalen Plattform sprechen.
Mamun Natour, Leiter BI, Vaillant Group, referiert über die zeitgleiche, weltweite Implementierung von SAP HANA in bestehende SAP BI Landschaften.
Hören, diskutieren und erörtern Sie aktuelle Herausforderungen im Bereich SAP BI bei mehr als 15 Case Studies, in denen individuelle Ansätze und innovative Lösungen aus Industrie & Praxis vorgestellt werden.
Gewinnen Sie einen Einblick über unser Konferenzformat:
http://www.youtube.com
BATbern52 SBB zu Data Products und KnacknüsseBATbern
Mit den Data Products und dem Data Mesh weht ein neuer Wind durch die Data Analytics-Stuben. Konzepte, die im Bereich des Software Engineerings bereits etabliert sind, werden für neue Analytics-Vorhaben entsprechend adaptiert. Dies Nähe zur Software Entwicklung ist nicht erstaunlich, stammen doch die Prinzipien des Data Mesh aus dem Umfeld von Martin Fowler. Die Grundgedanken sind bestechend einfach: das Data Product als eine klar abgegrenzte Einheit mit klaren Regeln und Daten, die einen Mehrwert für den Datennutzer bieten. Diese Data Products können in einer Mesh-Architektur miteinander verknüpft und zu einem funktionierenden Ganzen zusammengefügt werden. Damit soll der «Ad-Hoc»-Charakter, der vielen Analytics-Lösungen innewohnt, überwunden werden. Bei der Adaption von Data Products in eine bestehende Analytics-Landschaft müssen technische und organisatorische Hürden genommen und viel Überzeugungsarbeit in der Analytics-Gemeinde geleistet werden. Wir nehmen Euch mit auf diese Reise, die noch nicht zu Ende ist.
Es existieren eine Reihe von Features in der aktuellen SOA/BPM Suite, die selten genutzt und wenig beworben werden. Darüber hinaus gibt es in verschiedensten Kundenprojekten häufig auch Anforderungen, die zunächst Implementierungs- oder Anpassungsaufwand bedeuten, sich dann aber doch mit Bord-Mitteln realisieren lassen. In ihrem Vortrag auf der DOAG Konferenz 2011 in Nürnberg gingen OPITZ CONSULTING Senior Berater, Danilo Schmiedel und Jens Hündling von Oracle Deutschland auf ausgewählte Features ein und präsentierten diese im Kontext von Kundenprojekten und Erfahrungen. Neben einem durchgängigen Beispiel zur Verwendung des Metadata Stores, dem Fault Management Framework, der OWSM-Policies, dem Dynamic Binding und der Datenvalidierung via Schematron sollen auch die sogenannten Domain Value Maps näher betrachtet werden. Die Betrachtung neuer technischer Features, die sich erst seit 11g adäquat umsetzen lassen sowie die Verbindung zwischen BPMN/BPEL und Java runden den Beitrag ab.
Ähnlich wie Open Source Data Mining - Data Mining Cup 2007 (20)
This document outlines an agenda and presentation on operational intelligence given by Dr. Olivera Marjanovic and ChrisFan Schieder. It discusses the history and evolution of operational intelligence from ancient military strategy to modern business monitoring and automation. Key concepts of operational intelligence are explained, including real-time monitoring of business processes, optimizing processes by identifying bottlenecks, and turning data into actionable intelligence. Technologies that enable operational intelligence through responsiveness, agility and flexibility are also presented. The presentation includes two case studies, one on how Sony Online Entertainment uses change data capture for gaming analytics, and another on real-time reporting in a camshaft manufacturing plant.
The PalOOCa Project is developing an Open Office Calc add-in for the Palo OLAP server. It began as an idea in October 2006 and reached an alpha release in January 2007. The project aims to create an open source MOLAP front-end that allows users to connect to Palo from within OpenOffice Calc, similar to existing Excel plug-ins. A roadmap outlines planned features through a final 1.0 release in January 2008, including connection management, data import/export, and multilanguage support. The presentation demonstrated PalOOCa on Windows and Linux and provided download and contact information.
Angebot und Nachfrage für Open Source Business Intelligence
Open Source Data Mining - Data Mining Cup 2007
1. Open Source Data Mining Tools
– Marktüberblick und Produktevaluation –
Christian Schieder Data-Mining-Cup Anwendertage 2007
Leipzig
20. 06. 2007
1
2. Open Source in aller Munde
Open Source Data Mining Tools
*
* Kleijn, A. : Business Intelligence mit Open Source,
Heise open / Markt, Juni 2006,
http://www.heise.de/open/artikel/73725
Christian Schieder
Open Source Data Mining Tools 2
DMC-Anwendertage, Leipzig 2007
3. Open Source Data Mining im Gartner Hype Cycle
Open Source Data Mining Tools
visibility
Virtual Data
Federation/EII Dashboards/Scorecards
Corporate Performance Management
BAM/Real-Time BI
SOA-Enabled BI
EBISs
Convergence ETL
EBIS/BI Platforms Web Tools
Analytics
Advanced Production/
Analytics OLAP Formatted/
Collaborative BI Data Warehouse BI Platforms Web
Appliance Metadata Tools Reporting
Embedded
Analytics Data Mining Workbenches
Open Source BI ETL Embedded
Visual BI Text Mining in DBMS
Development Open Source DBMS ODBO/MDX and XML for Analysis Standard
Tools Data Quality
Cross-Enterprise Business
64-bit Analytics B2B BI Application
Hardware Extranets Data
Warehouses
Analytical Process Controlling
As of July 2005
Peak of
Technology Trough of Plateau of
Inflated Slope of Enlightenment
Trigger Disillusionment Productivity
Expectations
maturity
Plateau will be reached in:
obsolete
less than 2 years 2 to 5 years 5 to 10 years more than 10 years before plateau
Quelle: Gartner 2005
Christian Schieder
Open Source Data Mining Tools 3
DMC-Anwendertage, Leipzig 2007
4. Gliederung
Open Source Data Mining Tools
1. Grundlagen
2. Marktüberblick
3. Evaluation
4. Fazit
Christian Schieder
Open Source Data Mining Tools 4
DMC-Anwendertage, Leipzig 2007
5. Gliederung
Open Source Data Mining Tools
1. Grundlagen
2. Marktüberblick
3. Evaluation
4. Fazit
Christian Schieder
Open Source Data Mining Tools 5
DMC-Anwendertage, Leipzig 2007
6. Open Source: Spezifika
1. Grundlagen
Lizenzierungsmodell
Copy-Right vs. Copy-Left
Im Data Mining Bereich häufig Dual Licensing
Entwicklungsmodell
Hybrides Modell: formale und agile Elemente
(Cathedral vs. Bazaar)1
Paradigmen: Kollaboration, Iteration, Modularisierung
“Community“-Phänomen
1 Raymond, E. (1997): The Cathedral and the Bazaar,
http://www.catb.org/~esr/writings/cathedral-bazaar/cathedral-bazaar/
Christian Schieder
Open Source Data Mining Tools 6
DMC-Anwendertage, Leipzig 2007
7. Gliederung
Open Source Data Mining Tools
1. Grundlagen
2. Marktüberblick
3. Evaluation
4. Fazit
Christian Schieder
Open Source Data Mining Tools 7
DMC-Anwendertage, Leipzig 2007
8. Relevante Projekte am Markt
2. Marktüberblick
WEKA [v.3.5.5] Rattle [v.2.2.58]
RapidMiner [v.4.0.0] Orange [v.0.9.7]
KNIME [v.1.2.1]
Daneben: ca. 100+ weitere (teilw. nur rudimentäre) Projekte
R-Project: R is a statistical and data mining package consisting
of a programming language and a graphics system.
Christian Schieder
Open Source Data Mining Tools 8
DMC-Anwendertage, Leipzig 2007
9. Projektsteckbrief WEKA (I)
2. Marktüberblick
WEKA: Waikato Environment for Knowledge Analysis
Aktuelles Release: v.3.5.6
Lizenz: GPL
Entwickler: Universität Waikato, Hamilton, Neuseeland
Projektbeginn: 1996 (1993)
Projektseite:
http://www.cs.waikato.ac.nz/~ml/weka/
http://sourceforge.net/projects/weka/
Besonderheiten:
3-teilige GUI: Explorer, Knowledge Flow, Experimenter
Basis für (fast alle anderen) Open Source Data Mining Tools
Christian Schieder
Open Source Data Mining Tools 9
DMC-Anwendertage, Leipzig 2007
10. Projektsteckbrief WEKA (II): Screens
2. Marktüberblick
Christian Schieder
Open Source Data Mining Tools 10
DMC-Anwendertage, Leipzig 2007
11. Projektsteckbrief WEKA (III): Download Impact
2. Marktüberblick
Download History Weka
Christian Schieder
Open Source Data Mining Tools 11
DMC-Anwendertage, Leipzig 2007
12. Projektsteckbrief RapidMiner (I)
2. Marktüberblick
RapidMiner (Yale)
Aktuelles Release: v.4.0.0 [Yale v.3.5.0]
Lizenz: GPL + Kommerziell
Entwickler:
Universität Dortmund (Lehrstuhl für Künstliche Intelligenz)
Rapid-i GbR (Spin-Off)
Projektbeginn: 2001
Projektseite:
http://rapid-i.com/
http://sourceforge.net/projects/yale/
Besonderheiten:
WEKA-Plug-In
Interaktives Online Demo
Christian Schieder
Open Source Data Mining Tools 12
DMC-Anwendertage, Leipzig 2007
13. Projektsteckbrief RapidMiner (II): Screens
2. Marktüberblick
Christian Schieder
Open Source Data Mining Tools 13
DMC-Anwendertage, Leipzig 2007
14. Projektsteckbrief RapidMiner (III): Download Impact
2. Marktüberblick
Download History RapidMiner
Christian Schieder
Open Source Data Mining Tools 14
DMC-Anwendertage, Leipzig 2007
15. Projektsteckbrief KNIME (I)
2. Marktüberblick
KNIME: KoNstanz Information MinEr [naIm]
Aktuelles Release: v.1.2.1
Lizenz: LGPL ähnlich (Aladdin Free Public License) + Kommerziell
Entwickler:
Universität Konstanz (Chair for Bioinformatics and Information Mining)
KNIME GmbH (Spin-Off)
Projektbeginn: 2005
Projektseite: http://www.knime.org
Besonderheiten:
Eclipse Plug-In/RCP
Integration in OS-Reporting-Tools (BIRT, jFreeCharts)
Christian Schieder
Open Source Data Mining Tools 15
DMC-Anwendertage, Leipzig 2007
16. Projektsteckbrief KNIME (II): Screens
2. Marktüberblick
Christian Schieder
Open Source Data Mining Tools 16
DMC-Anwendertage, Leipzig 2007
17. Gliederung
Open Source Data Mining Tools
1. Grundlagen
2. Marktüberblick
3. Evaluation
4. Fazit
Christian Schieder
Open Source Data Mining Tools 17
DMC-Anwendertage, Leipzig 2007
18. CRISP-DM: CRoss-Industry Standard Process for Data Mining
3. Evaluation
Business Data
Understanding Understanding
Schwerpunkte der Untersuchung
Data
Preparation
Deployment Data
Modeling
Evaluation
Quelle: http://www.crisp-dm.org/Process/index.htm
Christian Schieder
Open Source Data Mining Tools 18
DMC-Anwendertage, Leipzig 2007
19. Grundzüge des Untersuchungsdesigns
3. Evaluation
Vorauswahl der Open Source Tools
(Internet-Recherchen)…
SPSS Clementine als kommerzielles
Referenzprodukt…
Clementine als
challengers leaders Referenzprodukt
für die
Untersuchung
SAS
SPSS
[Microsoft] (IBM)
ability to execute
(Oracle)
FairIsaac
(Prudsys)
KXEN (Bissantz)
Unica
Chordiant
Portrait
Teradata
ThinkAnalytics
niche players visionaries
completeness of vision Quellen: Gartner 2006
(Barc 2001)
Christian Schieder
Open Source Data Mining Tools 19
DMC-Anwendertage, Leipzig 2007
20. Grundzüge des Untersuchungsdesigns
3. Evaluation
Vorauswahl der Open Source Tools
(Internet-Recherchen)…
SPSS Clementine als kommerzielles
Referenzprodukt…
Anwendung der OS-Tools auf die Beispiele
und Daten von Clementine…
Evaluierung von insgesamt 25 Einzelkriterien
in 8 Kategorien verglichen mit Clementine
Auswertung, Zusammenfassung und
Vergleich der Testprotokolle…
Christian Schieder
Open Source Data Mining Tools 20
DMC-Anwendertage, Leipzig 2007
21. Untersuchungskategorien
3. Evaluation
Dokumentation
10
8
Auswertungen Ergonomie
6
4
2
0
Methoden Projektmanagement
Data Preparation Data Understanding
WEKA
Christian Schieder
Open Source Data Mining Tools 21
DMC-Anwendertage, Leipzig 2007
22. Ergebnisse der Untersuchung: WEKA
3. Evaluation
Dokumentation
10
8
Auswertungen Ergonomie
6
4
2
0
Methoden Projektmanagement
Data Preparation Data Understanding
WEKA [WEKA Version 3.5.5]
Christian Schieder
Open Source Data Mining Tools 22
DMC-Anwendertage, Leipzig 2007
23. Ergebnisse der Untersuchung: RapidMiner
3. Evaluation
Dokumentation
10
8
Auswertungen Ergonomie
6
4
2
0
Methoden Projektmanagement
Anm.:
Die Bewertung bezieht sich auf
YALE Version 3.4.0. Das im Mai Data Preparation Data Understanding
2007 erschienene Major-Relase
mit der Umbennenung in
RapidMiner bietet insbesondere in
den schwachen Bereichen (Data
Preparation, Ergonomie) RapidMiner [YALE Version 3.4.0]
erhebliche Verbesserungen.
Christian Schieder
Open Source Data Mining Tools 23
DMC-Anwendertage, Leipzig 2007
24. Ergebnisse der Untersuchung: KNIME
3. Evaluation
Dokumentation
10
8
Auswertungen Ergonomie
6
4
2
0
Methoden Projektmanagement
Data Preparation Data Understanding
KNIME [KNIME Version 1.2.0]
Christian Schieder
Open Source Data Mining Tools 24
DMC-Anwendertage, Leipzig 2007
25. Zusammenschau der Ergebnisse (I)
3. Evaluation
Dokumentation
10
8
Auswertungen Ergonomie
6
4
2
0
Methoden Projektmanagement
Data Preparation Data Understanding
WEKA RapidMiner KNIME
Christian Schieder
Open Source Data Mining Tools 25
DMC-Anwendertage, Leipzig 2007
26. Gliederung
Open Source Data Mining Tools
1. Grundlagen
2. Marktüberblick
3. Evaluation
4. Fazit
Christian Schieder
Open Source Data Mining Tools 26
DMC-Anwendertage, Leipzig 2007
27. Zusammenschau der Ergebnisse
4. Fazit
Relativ hoher Reifegrad aller 3 untersuchten Produkte
Im Gesamturteil liegt RapidMiner (mit dem Release vom Mai
2007) leicht vorn
Aber: spezifische Stärken und Schwächen in jeden Tool
Keines der Tools erreicht das Referenzprodukt in allen
Kategorien
Aber:
In einzelnen Eigenschaften durchaus gleichwertig
Insbesondere bei Offenheit, Anpassbarkeit und
Interoperabilität deutliche Vorteile (Plug-Ins, XML)
Christian Schieder
Open Source Data Mining Tools 27
DMC-Anwendertage, Leipzig 2007
29. Zusammenfassung
4. Fazit
Fazit: OS-Data-Mining-Tools erreichen heute (noch)
nicht (in allen Belangen) die Leistungsfähigkeit
kommerzieller Produkte
Aber: OS-Tools entwickeln sich sehr dynamisch
Frage: Reichen mir 90% der Funktionalität von Clementine?
Tipp: Anforderungen genau definieren und OS-Tools im
Einzelfall untersuchen
Folgen:
wachsender Reifegrad von Open Source Tools
steigende Relevanz von OS Tools
zunehmender Preisdruck für Anbieter
Stärkung der Kundenposition
Christian Schieder
Open Source Data Mining Tools 29
DMC-Anwendertage, Leipzig 2007