SlideShare ist ein Scribd-Unternehmen logo
1 von 75
Downloaden Sie, um offline zu lesen
Einführung in Data Science
Joerg Blumtritt
@jbenno
@datarella

1
Ziel
• ... einen Überblick über das Berufsfeld "Data Science" zu
geben,
• ... in die Lage versetzen, sich selbst weiter zu
informieren,
• ... weitere Fortbildungen gezielt auszuwählen,
• ... zu erkennen, wo sich Potenziale bei Kunden ergeben,
die dann mit interner bzw. externer Unterstützung in
Angebote übersetzt werden können.

2
Agenda
1) Einführung in das Thema
• Neue Paradigmen / Abgrenzung zu Statistik,
Marktforschung und Business Intellgence
• Data Science 101:
1. Daten erzeugen Sammeln
2. Daten ablegen / abrufen (=wiederfinden)
3. Daten bereinigen
4. Daten analysieren
5. Daten visualisieren

3
Big Data
Volume
Velocity
Variety
Quanti
fication

Data
Science
Michele Banko und Eric Brill 2001: http://acl.ldc.upenn.edu/P/P01/P01-1005.pdf
Data Science

6
http://www.lehmanns.de/shop/mathematik-informatik/27078173-9781449361327-data-science-for-business

7
Data Science

http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram
Data Scientists?

http://www.forbes.com/sites/danwoods/2012/03/08/hilary-mason-what-is-a-data-scientist/
Data Science 101
1. Daten erzeugen Sammeln
2. Daten ablegen / abrufen (=wiederfinden)
3. Daten bereinigen
4. Daten analysieren
5. Daten visualisieren

10
1. Daten erzeugen / Sammeln
Marktforschung

Data Science

Daten
erzeugen/sammeln

Feld, Methode

Parsing, Crawling,
Scraping

Datenquelle

Tabellen, Feldberichte

API, Corpus, "Heap",
"Stream"

Datenbeschreibung

Codebuch

Specs, N.N.

Dienstleister

Feldinstitut

Data Broker

11
1. Daten erzeugen / Sammeln
• Parsing: APIs
• Autentifizierung (Token)
• JSON
• Crawling
• HTTrack Website Copier
• Simple Web Crawler in Python
• Scraping

12
API, Authentifizierung, Token
https://api.foursquare.com/v2/users/jbenno/checkins?bef
oreTimestamp=1338875927&oauth_token=F2THPP1YHU
Y4YVZLJ0ORKX3TCEAM0OCKS3WEFWYBIJBCGRHB&v=201
30719

13
API, Authentifizierung, Token
https://api.foursquare.com/v2/users/jbenno/checkins?bef
oreTimestamp=1338875927&oauth_token=F2THPP1YHU
Y4YVZLJ0ORKX3TCEAM0OCKS3WEFWYBIJBCGRHB&v=201
30719

14
15

Quelle: https://dev.twitter.com/apps
{"meta":{"code":200},"notifications":[{"type":"notificationTray","item":{"unreadCount":9}}],"res
ponse":{"checkins":{"count":914,"items":[{"id":"51e51fb0498e5dc08f90263f","createdAt":1373
970352,"type":"checkin","timeZoneOffset":120,"venue":{"id":"4b977703f964a520da0435e3","n
ame":"Bonn Hauptbahnhof","contact":{"twitter":"db_bahn"},"location":{"address":"Am
Hauptbahnhof
1","lat":50.73212621273225,"lng":7.096948027610779,"postalCode":"53111","city":"Bonn","co
untry":"Germany","cc":"DE"},"canonicalUrl":"https://foursquare.com/v/bonnhauptbahnhof/4b977703f964a520da0435e3","categories":[{"id":"4bf58dd8d48988d129951735
","name":"Bahnhof","pluralName":"Bahnhöfe","shortName":"Bahnhof","icon":{"prefix":"https:
//foursquare.com/img/categories_v2/travel/trainstation_","suffix":".png"},"primary":true}],
"verified":true,"stats":{"checkinsCount":15804,"usersCount":3101,"tipCount":33},"likes":{"count
":16,"groups":[{"type":"others","count":16,"items":[]}],"summary":"16 Gefällt
mir"},"like":false,"beenHere":{"count":4,"marked":false}},"likes":{"count":0,"groups":[]},"like":fal
se,"photos":{"count":0,"items":[]},"posts":{"count":0,"textCount":0},"comments":{"count":0},"so
urce":{"name":"foursquare for
Android","url":"https://foursquare.com/download/#/android"}},{"id":"51e4edcc498eaecbe
717cb35","createdAt":1373957580,"type":"checkin","timeZoneOffset":120,"venue":{"id":"4b99
688cf964a520507935e3","name":"mD-Hotel
Aigner","contact":{"phone":"0228604060","formattedPhone":"0228
604060"},"location":{"address":"Dorotheenstr. 12","lat":50.739016,"lng":7.095067,"city":"53111
Bonn","state":"NordrheinWestfalen","country":"Germany","cc":"DE"},"canonicalUrl":"https://foursquare.com/v/mdho
telaigner/4b99688cf964a520507935e3","categories":[{"id":"4bf58dd8d48988d1fa931735","name
16
":"Hotel","pluralName":"Hotels","shortName":"Hotel","icon":{"prefix":"https://foursquare.co
1 {
2
"items": [
3
{
4
"id": "51e51fb0498e5dc08f90263f",
5
"createdAt": 1373970352,
6
"type": "checkin",
7
"timeZoneOffset": 120,
8
"venue": {
9
"id": "4b977703f964a520da0435e3",
10
"name": "Bonn Hauptbahnhof",
11
"contact": {
12
"twitter": "db_bahn"
13
},
14
"location": {
15
"address": "Am Hauptbahnhof 1",
16
"lat": 50.73212621273225,
17
"lng": 7.096948027610779,
18
"postalCode": "53111",
19
"city": "Bonn",
20
"country": "Germany",
21
"cc": "DE"
22
},
23
"canonicalUrl": "https://foursquare.com/v/bonnhauptbahnhof/4b977703f964a520da0435e3",
17
24
"categories": [
Crawling
• HTTrack Website Copier etc.
• Simple Web Crawler in Python

18
Scraping
• Daten sammeln, die bereits optisch aufbereitet wurden
und keine "Datenstruktur" mehr besitzen:
• Tabellen, Charts
• pdf
• Websites

19
Corpus
• unbearbeitete Datengrundlage, häufig in Textformat:
• eine Webpage
• Wikipedia
• Sammlung von Tweets zu einem bestimmten Thema,
• Wahlprogramme der Parteien
• Google ngram Corpus

20
Stream
• kontinuierlicher Datenfluss:
• Tweets
• Stromverbrauchsmessung durch Smart Meters
• Sensordaten aus dem Bordcomputer eines KfZ
• Verarbeitung muss in der Regel online erfolgen, d.h.
eintreffende Daten werden sofort verarbeitet

21
Spezifikationen
• Daten sind oft nur sehr grob beschrieben, häufig gibt es
überhaupt keine Dokumentation
• Mit Versionswechsel der API ändert sich in der Regel
auch das Datenformat der neuen Datensätze, ohne dass
die Bestandsdaten transformiert werden
• Datenformat, Toleranzen, Umgang mit fehlenden Werten
etc. wird "durch Augenschein" erarbeitet

22
Datenlieferanten

23
2. Daten ablegen / abrufen
Marktforschung /
Statistik

Data Science

Format

Tabellen, RDBMS

Dokumente, Dateien

Konsistenz

durch das Format

Funktional

Struktur

Fälle, Datensätze

Netzwerke, Graphen

Datenhaltung

lokal

Cloud

24
2. Daten ablegen / abrufen
• Unstrukturierte Datenablage
• Konsistenzfunktion
• Immutability
• Document/Graph/Key-Value Store
• Hash-Table, Bitmap-Index
• Lambda-Architektur

25
Unstrukturierte Datenablage
• Datensätze werden als Text-Dateien direkt gespeichert

26
2. Daten ablegen / abrufen
• Exkurs:
• Virtuelle Maschine
• Hadoop
• Amazon S3/E2, Google BigQuery

27
Virtuelle Maschinen

28

https://www.virtualbox.org/
29
30
31
32
Cloudservices
• Amazon
• S3, EC2

33

• Google
• Storage, BigQuery
Konsistenzfunktion
• Statt die Konsistenz der Daten schon in der Struktur
festzulegen, wird eine Funktion definiert, die jeden
Record nach den vorgegebenen Kriterien überprüft:
function IsConsistent(Record, Schema) as
Boolean

34
Immutability

Operation SQL
Create
Read (Retrieve)
Update (Modify)
Delete (Destroy)

"mutable"
35

INSERT
SELECT
UPDATE
DELETE

"Each event happens at a
particular time and is always
true"
• Just C+R; nothing gets ever
"updated"
• Records are stored as files.
Each record is a new file.

"immutable"
Document/Graph/Key-Value Store
• Dokumente werden geeignet indiziert
• Meta-Daten werden in speziellen Formaten mitgeliefert
(zB. MPEG7)
• Wenn eine Key-Value-Struktur besteht, wird die Sturktur
der JSON- oder XML-Dokumente in eine Art
Tabellenform gebracht (Keys ~ Spalten, Values ~
Zellwerte)

36
Hash-Table, Bitmap-Index
• Hash-Table: aus den Werten wird über eine HashFunktion ein Index berechnet, der auf den Datensatz
verweist
• Bitmap-Index: Tabellenartige Struktur, bei der die
Variablen (via Dummy-Variablen) in eine 0/1-Struktur
gebracht werden

37
Lambda-Architektur
Data

Stream

Precomputed
realtime view
Query

All Data

38

Precomputed View
(Batch Mode)
3. Daten bereinigen
• "Data munging"
• "Pervasive Data Gremlins":
• technisches Format: Endianness, Unicode-Table, OSVersion, Sonderzeichen und Steuerbefehle, etc.
• inhaltlich: Fehlende Werte, Zeitzonen, Sommerzeit,
Feiertage, Lables, Firmen/Konzernbezeichnung,
Vorwahlen, "Höhe über N.N.", etc.
• historisch: Formatwechsel ("Jahr 2000"),
unterschiedliche Granularität, etc.

39
4. Daten analysieren
Marktforschung /
Statistik

Data Science

Tools

SPSS und vergleichbare

R, Python, div.
Frameworks

Vorgehen

Stichprobenziehung

Totalerhebung oder
nicht-repräsentativ

Mathematik

Stochastik

Algorithmen

Ergebnis

abgeschlossen

iterativ

40
4. Daten analysieren
• Agile Statistics
• Statistische Verfahren
• Machine Learning
• Textanalyse
• Geodaten
• Netzwerkanalyse

41
Agile Statistics
• a/b-Test
• Pivoting:
• Evolutionäre Algorithmen, Jittering, Simulated
Annealing
• "Mechanical Turk"

42
Statistische Verfahren
• (kaum Testverfahren, hauptsächlich Vorhersagen)
• Robuste Schätzer
• Fouriertransformation, Wavelets
• ARIMA

43
Machine Learning
• Supervised Learning (Entscheidungsalgorithmen)
• Regression
• Diskriminanzanalyse, Cluster mit vorgegebenen Zentroiden
• Backpropagation (MLP)
• Unsupervised (Dimensionsreduktion)
• Clusteranalyse, k-Nächste Nachbarn, k-Means, DBSCAN
• Hauptkomponentenanaylse, MDS
• Autoencoder
• Self Organizing Maps

44
Mahout
• Mahout currently has

• Singular value decomposition

• Collaborative Filtering

• Parallel Frequent Pattern
mining

• User and Item based
recommenders
• K-Means, Fuzzy K-Means
clustering
• Mean Shift clustering
• Dirichlet process clustering
• Latent Dirichlet Allocation

45

• Complementary Naive Bayes
classifier
• Random forest decision tree
based classifier
• High performance java
collections (previously colt
collections)
Textanalyse
• Vorbereitung des Corpus
• N-Gramme
• Wortabstände
• Textvergleiche: Cosinus-Vektor-Ähnlichkeit

Textmining in R: z.B. das Paket "TM"

46
Textanalyse
Wort
Aar

Limburg
1

Aartalbahn
Aartalhalle
Abbild
Abbildung
aber
Abgaben

1
2
7
1

abgegrenzten
Abgeordnete

1
1

Abgeordneter
abgerissen
Abgerufen
abgeschlossen
abgetrennt
Abitur

1

Abschluss
Abschnitt
47
Abschnitten

1
2
1

Stockdorf

Taunusstein
2
1
1

1

1

Cos(Taunusstein,
Stockdorf) 0,75
Cos(Stockdorf,
Limburg) 0,81
Cos(Taunusstein,
Limburg) 0,76

3
3
1
1
2
1
Netzwerkanalyse

48
49
50
51
5. Daten visualisieren

D3

52
53
54
STREETFIGHTING DATA SCIENCE

55
Street Fighting Data Science
• Umnutzen vorhandener
Daten (Tweets -> Bewegungsgeschwindigkeit)
• Umwidmen von
Methoden (BioTech ->
Sozialwissenschaften)
• Agile Ad-hoc-Analysen
• Improvisation

http://en.wikipedia.org/wiki/File:Fightingmanstones.jpg
Tools finden

http://github.com

57
N-Gramme

Google Ngram Viewer http://books.google.com/ngrams + DB http://books.google.com/ngrams/datasets
WordNet
• WordNet:
semantische
und lexikalische
Bedeutung von
Wörtern
• Daraus z.B.
Wörter mit
Stimmungen
identifizierbar
(WN Affect)
WordNet http://wordnet.princeton.edu/ WordNet Affect http://wndomains.fbk.eu/wnaffect.html
N-Gramme + WordNet
• Emotionen im Zeitverlauf

Acerbi et al 2013 http://www.plosone.org/article/info:doi/10.1371/journal.pone.0059030
Food Pairings

Ahn et al 2011 http://www.nature.com/srep/2011/111215/srep00196/full/srep00196.html
Food Pairings

Ahn et al 2011 http://www.nature.com/srep/2011/111215/srep00196/full/srep00196.html
Food Pairings

Ahn et al 2011 http://www.nature.com/srep/2011/111215/srep00196/full/srep00196.html
Google Correlate

Google Correlate www.google.com/trends/correlate
Funnel Plots

http://www.cochrane-net.org/openlearning/html/mod15-3.htm
Twitter Tags
http://mashe.hawksey.info/2013/02/twitter-archive-tagsv5/
Item
id_str
from_user
text

Value
356092702800105000
winedanddined
Picking up an orange wine (Arboreus) (@ Italian Wine Merchants) [pic]:
http://t.co/u0xcPXTTSP
Sat Jul 13 16:48:10 +0000 2013
13/07/2013 17:48:10
loc: 40.73580099,-73.98906051
en

created_at
time
geo_coordinates
user_lang
in_reply_to_user_id_str
in_reply_to_screen_nam
from_user_id_str
18657048
in_reply_to_status_id_st
source
<a href="http://foursquare.com" rel="nofollow">foursquare</a>
profile_image_url
http://a0.twimg.com/profile_images/716129754/jump_normal.jpg
user_followers_count 6925
user_friends_count
2754
user_utc_offset
-18000
status_url
http://twitter.com/winedanddined/statuses/356092702800105472
66
entities_str
{"symbols":[],"urls":[{"expanded_url":"http://4sq.com/15qYMPc","indices
NodeXL – Netzwerk-Analyse

NodeXL http://nodexl.codeplex.com/
Flickr für Touristen

Eric Fischer „See something or say something“http://www.flickr.com/photos/walkingsf/5935471000/in/set72157627140310742 and „Locals and Tourists“http://www.flickr.com/photos/walkingsf/4671578001/in/set72157624209158632
OpenPaths

69

http://openpaths.cc
Weather Signal

70
funf.org

71
Verhalten analysieren:
• Targeting-Daten > Verhaltensbeobachtung im Web
• Moblie Tracking > Verhaltensbeobachtung im
"Meatspace"
• Situatives Einfragen
• Interaktion

72
QUANTIFY & ASK = EXPLORE APP

Start Screen
73

Diary

Heat Map
Noch ein paar Links:
http://twitter.com/jbenno/bigdata
http://strataconf.com/
http://www.r-bloggers.com/
http://oreilly.com/
http://iognos.com/blog-3/

74
Joerg Blumtritt
@jbenno
Datarella GmbH
Oskar-von-Miller-Ring 36
80333 München
089/44 23 69 99
info@datarella.com

Weitere ähnliche Inhalte

Was ist angesagt?

OpenDMA - Daten Management Solution
OpenDMA  - Daten Management SolutionOpenDMA  - Daten Management Solution
OpenDMA - Daten Management SolutionTorsten Glunde
 
IBM - Big Value from Big Data
IBM - Big Value from Big DataIBM - Big Value from Big Data
IBM - Big Value from Big DataWilfried Hoge
 
Daten ohne Grenzen – Big Data
Daten ohne Grenzen – Big DataDaten ohne Grenzen – Big Data
Daten ohne Grenzen – Big DataAWS Germany
 
Der Markt für Planungs- und Controlling-Systeme
Der Markt für Planungs- und Controlling-SystemeDer Markt für Planungs- und Controlling-Systeme
Der Markt für Planungs- und Controlling-SystemeBARC GmbH
 
BI und ECM - Verbindung von strukturierten und unstrukturierten Daten
BI und ECM - Verbindung von strukturierten und unstrukturierten DatenBI und ECM - Verbindung von strukturierten und unstrukturierten Daten
BI und ECM - Verbindung von strukturierten und unstrukturierten DatenBARC GmbH
 

Was ist angesagt? (6)

OpenDMA - Daten Management Solution
OpenDMA  - Daten Management SolutionOpenDMA  - Daten Management Solution
OpenDMA - Daten Management Solution
 
IT Trends 2011 - und welchen Einfluss Business Analytics darauf hat
IT Trends 2011 - und welchen Einfluss Business Analytics darauf hatIT Trends 2011 - und welchen Einfluss Business Analytics darauf hat
IT Trends 2011 - und welchen Einfluss Business Analytics darauf hat
 
IBM - Big Value from Big Data
IBM - Big Value from Big DataIBM - Big Value from Big Data
IBM - Big Value from Big Data
 
Daten ohne Grenzen – Big Data
Daten ohne Grenzen – Big DataDaten ohne Grenzen – Big Data
Daten ohne Grenzen – Big Data
 
Der Markt für Planungs- und Controlling-Systeme
Der Markt für Planungs- und Controlling-SystemeDer Markt für Planungs- und Controlling-Systeme
Der Markt für Planungs- und Controlling-Systeme
 
BI und ECM - Verbindung von strukturierten und unstrukturierten Daten
BI und ECM - Verbindung von strukturierten und unstrukturierten DatenBI und ECM - Verbindung von strukturierten und unstrukturierten Daten
BI und ECM - Verbindung von strukturierten und unstrukturierten Daten
 

Ähnlich wie Einfuhrung datascience

BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang Both
BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang BothBODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang Both
BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang BothBerlinOpenDataDay
 
Data Mining und OLAP
Data Mining und OLAPData Mining und OLAP
Data Mining und OLAPmurat9393
 
Big Data - Die große Innovation?
Big Data - Die große Innovation?Big Data - Die große Innovation?
Big Data - Die große Innovation?BARC GmbH
 
worldiety GmbH - Datenanalyse
worldiety GmbH - Datenanalyse worldiety GmbH - Datenanalyse
worldiety GmbH - Datenanalyse worldiety GmbH
 
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTiggesDas modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTiggesOPITZ CONSULTING Deutschland
 
DOAG News 2012 - Analytische Mehrwerte mit Big Data
DOAG News 2012 - Analytische Mehrwerte mit Big DataDOAG News 2012 - Analytische Mehrwerte mit Big Data
DOAG News 2012 - Analytische Mehrwerte mit Big DataHarald Erb
 
Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwic...
Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwic...Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwic...
Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwic...Markus Harrer
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenLydiaU
 
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenBjörn Muschall
 
BATbern52 SBB zu Data Products und Knacknüsse
BATbern52 SBB zu Data Products und KnacknüsseBATbern52 SBB zu Data Products und Knacknüsse
BATbern52 SBB zu Data Products und KnacknüsseBATbern
 
Herausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von MetadatenHerausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von MetadatenETH-Bibliothek
 
Dr. Thomas Petrik (Sphinx IT Consulting)
Dr. Thomas Petrik (Sphinx IT Consulting)Dr. Thomas Petrik (Sphinx IT Consulting)
Dr. Thomas Petrik (Sphinx IT Consulting)Agenda Europe 2035
 
Big Data - Eine Tour d'Horizon
Big Data - Eine Tour d'HorizonBig Data - Eine Tour d'Horizon
Big Data - Eine Tour d'HorizonBenedikt Köhler
 
Datenanalyse in der Praxis
Datenanalyse in der PraxisDatenanalyse in der Praxis
Datenanalyse in der PraxisYvette Teiken
 
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?KurtStockinger
 
Suche ein effizientes Mittel zur Datenintegration
Suche ein effizientes Mittel zur DatenintegrationSuche ein effizientes Mittel zur Datenintegration
Suche ein effizientes Mittel zur DatenintegrationThomas Kurz
 
Jetzt DataLion noch besser nutzen
Jetzt DataLion noch besser nutzenJetzt DataLion noch besser nutzen
Jetzt DataLion noch besser nutzenDataLion
 

Ähnlich wie Einfuhrung datascience (20)

Webinar big data für unternehmen
Webinar big data für unternehmenWebinar big data für unternehmen
Webinar big data für unternehmen
 
BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang Both
BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang BothBODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang Both
BODDy 2014: Ergebnisse Projektgruppe Open Data - Wolfgang Both
 
Data Mining und OLAP
Data Mining und OLAPData Mining und OLAP
Data Mining und OLAP
 
Big Data - Die große Innovation?
Big Data - Die große Innovation?Big Data - Die große Innovation?
Big Data - Die große Innovation?
 
worldiety GmbH - Datenanalyse
worldiety GmbH - Datenanalyse worldiety GmbH - Datenanalyse
worldiety GmbH - Datenanalyse
 
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTiggesDas modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
Das modulare DWH-Modell - DOAG SIG BI/DWH 2010 - OPITZ CONSULTING - ArnoTigges
 
DOAG News 2012 - Analytische Mehrwerte mit Big Data
DOAG News 2012 - Analytische Mehrwerte mit Big DataDOAG News 2012 - Analytische Mehrwerte mit Big Data
DOAG News 2012 - Analytische Mehrwerte mit Big Data
 
Big Data und Business Intelligence
Big Data und Business IntelligenceBig Data und Business Intelligence
Big Data und Business Intelligence
 
Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwic...
Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwic...Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwic...
Nachvollziehbare, datengetriebene, automatisierte Analysen der Softwareentwic...
 
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
 
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
 
BATbern52 SBB zu Data Products und Knacknüsse
BATbern52 SBB zu Data Products und KnacknüsseBATbern52 SBB zu Data Products und Knacknüsse
BATbern52 SBB zu Data Products und Knacknüsse
 
Herausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von MetadatenHerausforderungen im Datenmanagement von Metadaten
Herausforderungen im Datenmanagement von Metadaten
 
Dr. Thomas Petrik (Sphinx IT Consulting)
Dr. Thomas Petrik (Sphinx IT Consulting)Dr. Thomas Petrik (Sphinx IT Consulting)
Dr. Thomas Petrik (Sphinx IT Consulting)
 
Big Data - Eine Tour d'Horizon
Big Data - Eine Tour d'HorizonBig Data - Eine Tour d'Horizon
Big Data - Eine Tour d'Horizon
 
Datenanalyse in der Praxis
Datenanalyse in der PraxisDatenanalyse in der Praxis
Datenanalyse in der Praxis
 
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
Analyse von Applikationslogs und Querylogs: Datenbanken, Hadoop oder Splunk?
 
2 blockchain use cases
2 blockchain use cases2 blockchain use cases
2 blockchain use cases
 
Suche ein effizientes Mittel zur Datenintegration
Suche ein effizientes Mittel zur DatenintegrationSuche ein effizientes Mittel zur Datenintegration
Suche ein effizientes Mittel zur Datenintegration
 
Jetzt DataLion noch besser nutzen
Jetzt DataLion noch besser nutzenJetzt DataLion noch besser nutzen
Jetzt DataLion noch besser nutzen
 

Mehr von Joerg Blumtritt

Future mobility blumtritt_43pr
Future mobility blumtritt_43prFuture mobility blumtritt_43pr
Future mobility blumtritt_43prJoerg Blumtritt
 
Behavioral Analytics with Smartphone Data. Talk at Strata + Hadoop World 2014...
Behavioral Analytics with Smartphone Data. Talk at Strata + Hadoop World 2014...Behavioral Analytics with Smartphone Data. Talk at Strata + Hadoop World 2014...
Behavioral Analytics with Smartphone Data. Talk at Strata + Hadoop World 2014...Joerg Blumtritt
 
BYOD - Bring your own data. Wearable Tech und Shared Data für die Medizin
BYOD - Bring your own data. Wearable Tech und Shared Data für die MedizinBYOD - Bring your own data. Wearable Tech und Shared Data für die Medizin
BYOD - Bring your own data. Wearable Tech und Shared Data für die MedizinJoerg Blumtritt
 
Big Data, Augmented Ubiquity, Quantified Self
Big Data, Augmented Ubiquity, Quantified SelfBig Data, Augmented Ubiquity, Quantified Self
Big Data, Augmented Ubiquity, Quantified SelfJoerg Blumtritt
 
Quantified Self and Philosophy
Quantified Self and PhilosophyQuantified Self and Philosophy
Quantified Self and PhilosophyJoerg Blumtritt
 
Streetfighting datascience
Streetfighting datascienceStreetfighting datascience
Streetfighting datascienceJoerg Blumtritt
 
Hacking the meme_code_ext
Hacking the meme_code_extHacking the meme_code_ext
Hacking the meme_code_extJoerg Blumtritt
 
Grüne Trends: Der Markt der Bio-Lebensmittel.
Grüne Trends: Der Markt der Bio-Lebensmittel.Grüne Trends: Der Markt der Bio-Lebensmittel.
Grüne Trends: Der Markt der Bio-Lebensmittel.Joerg Blumtritt
 

Mehr von Joerg Blumtritt (17)

Algorithm Ethics
Algorithm EthicsAlgorithm Ethics
Algorithm Ethics
 
Future mobility blumtritt_43pr
Future mobility blumtritt_43prFuture mobility blumtritt_43pr
Future mobility blumtritt_43pr
 
Behavioral Analytics with Smartphone Data. Talk at Strata + Hadoop World 2014...
Behavioral Analytics with Smartphone Data. Talk at Strata + Hadoop World 2014...Behavioral Analytics with Smartphone Data. Talk at Strata + Hadoop World 2014...
Behavioral Analytics with Smartphone Data. Talk at Strata + Hadoop World 2014...
 
BYOD - Bring your own data. Wearable Tech und Shared Data für die Medizin
BYOD - Bring your own data. Wearable Tech und Shared Data für die MedizinBYOD - Bring your own data. Wearable Tech und Shared Data für die Medizin
BYOD - Bring your own data. Wearable Tech und Shared Data für die Medizin
 
Mobile Data Analytics
Mobile Data AnalyticsMobile Data Analytics
Mobile Data Analytics
 
Big Data, Augmented Ubiquity, Quantified Self
Big Data, Augmented Ubiquity, Quantified SelfBig Data, Augmented Ubiquity, Quantified Self
Big Data, Augmented Ubiquity, Quantified Self
 
Quantified Self and Philosophy
Quantified Self and PhilosophyQuantified Self and Philosophy
Quantified Self and Philosophy
 
Open Foresight
Open ForesightOpen Foresight
Open Foresight
 
Streetfighting datascience
Streetfighting datascienceStreetfighting datascience
Streetfighting datascience
 
Hacking the meme_code_ext
Hacking the meme_code_extHacking the meme_code_ext
Hacking the meme_code_ext
 
Einfurung in media
Einfurung in mediaEinfurung in media
Einfurung in media
 
Algorithm ethics
Algorithm ethicsAlgorithm ethics
Algorithm ethics
 
Posthuman advertising
Posthuman advertisingPosthuman advertising
Posthuman advertising
 
Quantified self
Quantified selfQuantified self
Quantified self
 
Zwei jahrebigdata
Zwei jahrebigdataZwei jahrebigdata
Zwei jahrebigdata
 
Vom kriege
Vom kriegeVom kriege
Vom kriege
 
Grüne Trends: Der Markt der Bio-Lebensmittel.
Grüne Trends: Der Markt der Bio-Lebensmittel.Grüne Trends: Der Markt der Bio-Lebensmittel.
Grüne Trends: Der Markt der Bio-Lebensmittel.
 

Einfuhrung datascience