Algorithmus
Torben Brodt
plista GmbH
23. Januar 2013
Camp Digital, Good School
Inhalt Algorithmus
1. Vorstellung
2. Das Spiel
3. Definition Algorithmus
4. Welche Aufgaben?
5. Welche Daten?
6. Welche Ko...
Vorstellung
● plista GmbH
○ Empfehlungs- & Werbenetzwerk
○ 2008 Gründung, Sitz in Berlin
○ ~3k Recommendations/Sekunde
● T...
Algorithmus das Spiel
● Es gibt 18 Streichhölzer
● Der erste Spieler nimmt 1, 2 oder 3, der auf
dem Tisch liegenden Streic...
Algorithmus das Spiel
● Wie lautet die Gewinnformel?
● Intuition?
Algorithmus das Spiel
● Wie lautet die Gewinnformel?
● Intuition? Logik?
Quelle: http://www-i1.informatik.rwth-aachen.de/~...
Definition Algorithmus
● Wortherkunft: arabisches Lehrbuch,
lateinisch übersetzt: „dixit Algorismi“
● Schritt für Schritt ...
Big Data: Welche Aufgaben?
● Bekannte Nutzer von Big Data Algorithmen
○ Google
○ Facebook
○ Amazon
○ ... uvm
● Konfrontier...
Big Data: Welche Daten?
● Was wissen "die" eigentlich über euch?
● Context der Anfrage / Parameter der Anfrage
● CRM: Demo...
Big Data: Welche Konzepte?
● Modelle und Herangehensweisen um Daten
nutzbar zu machen
a) Logik
b) Clustering
c) Neighborho...
Konzept a) Logik & Mathematik
● Wir verlassen uns auf Zahlen, wir nutzen
unser Wissen
○ Welche Relevanz hat eine Website b...
Konzept a) Logik & Mathematik
● Wissensdatenbank
○ Matching zwischen Person und Gegenstand
○ "Frauen besuchen Brigitte.de"...
Konzept b) Clustering
● Alle Möglichkeiten abzuwägen wäre
kompliziert
● also fassen wir "Dinge" zu "Clustern"
zusammen
● V...
Konzept b) Clustering
A B
C D
Konzept c) Neighborhood
Konzept c) Neighborhood
Konzept c) Neighborhood
● Gemeinsamkeiten suchen (ähnlich Clustering)
● Bekanntes auf Unbekanntes übertragen
● Allgemeiner...
Konzept d) Ausprobieren
● "Trial and Error"
○ ausprobieren, scheitern, verbessern
● Man sollte fortlaufend beobachten
○ „L...
Konzept e) Mittelwert
Konzept e) Mittelwert
● Wir haben Statistiken für alle Eingabe-
Parameter
○ Wir orientieren uns am Durchschnittswert
○ Wir...
Wo sind die Grenzen?
● Es gibt keine Grenzen
● Datenmengen bis in Petabyte Dimensionen
○ Das sind viele Otto-Normal-Festpl...
Fazit
● „Das Spiel“ hat gezeigt, dass Algorithmen
auch mit Intuition gestützt werden können
● Es gibt verschiedene Konzept...
Fragen?
www.plista.com
torben.brodt@plista.com
@torbenbrodt
xing.com/profile/Torben_Brodt
http://goo.gl/pvXm5
Nächste SlideShare
Wird geladen in …5
×

Algorithmus, Good School, Camp Digital

926 Aufrufe

Veröffentlicht am

Veröffentlicht in: Bildung
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
926
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
8
Aktionen
Geteilt
0
Downloads
2
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Algorithmus, Good School, Camp Digital

  1. 1. Algorithmus Torben Brodt plista GmbH 23. Januar 2013 Camp Digital, Good School
  2. 2. Inhalt Algorithmus 1. Vorstellung 2. Das Spiel 3. Definition Algorithmus 4. Welche Aufgaben? 5. Welche Daten? 6. Welche Konzepte? 7. Grenzen? 8. Fragen
  3. 3. Vorstellung ● plista GmbH ○ Empfehlungs- & Werbenetzwerk ○ 2008 Gründung, Sitz in Berlin ○ ~3k Recommendations/Sekunde ● Torben Brodt, Head of Data Engineering ○ 2003 Black Hat SEO ○ 2004 Programmier Forum ○ 2005 Studium Informatik ○ 2008 plista ○ 2010 Buch „Collaborative Filtering“ ○ TV + Radio „Macht der Algorithmen“
  4. 4. Algorithmus das Spiel ● Es gibt 18 Streichhölzer ● Der erste Spieler nimmt 1, 2 oder 3, der auf dem Tisch liegenden Streichhölzer ● Danach nimmt der zweite Spieler entweder 1, 2 oder 3 der verbleibenden Hölzer... usw. ● Verloren hat der Spieler, der das letzte Streichholz vom Tisch nimmt ● Bitte jetzt Paare bilden für Runde 1, danach treten die Gewinner gegeneinander an
  5. 5. Algorithmus das Spiel ● Wie lautet die Gewinnformel? ● Intuition?
  6. 6. Algorithmus das Spiel ● Wie lautet die Gewinnformel? ● Intuition? Logik? Quelle: http://www-i1.informatik.rwth-aachen.de/~algorithmus/algo14.php Algorithmus der Woche, Jochen Könemann, University of Waterloo i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 G N J J J N J J J N J J J N J J J N J i Streichhölzer G Gewinn möglich Sequenz wiederholt sich
  7. 7. Definition Algorithmus ● Wortherkunft: arabisches Lehrbuch, lateinisch übersetzt: „dixit Algorismi“ ● Schritt für Schritt Abfolge zur Lösung eines Problems ● Algorithmus = Gewinnformel ● Simples Beispiel: „Kochrezept“ ● „Big Data“: komplexe Probleme mit großen Datenmengen Algorithmus
  8. 8. Big Data: Welche Aufgaben? ● Bekannte Nutzer von Big Data Algorithmen ○ Google ○ Facebook ○ Amazon ○ ... uvm ● Konfrontiert mit gigantischer Datenmenge ● Berechnung nach individuellen Bedürfnissen
  9. 9. Big Data: Welche Daten? ● Was wissen "die" eigentlich über euch? ● Context der Anfrage / Parameter der Anfrage ● CRM: Demographie, Kaufkraft, uvm. ● Anonyme Daten: URL, Geolocation, Uhrzeit, Wochentag, Suchanfrage, Gerät, Betriebssystem, uvm ● Social Daten: Alter, Geschlecht, Hobbies, etc ○ z.B. „Nach Facebook Login“ ● Alle diese Daten werden gesammelt
  10. 10. Big Data: Welche Konzepte? ● Modelle und Herangehensweisen um Daten nutzbar zu machen a) Logik b) Clustering c) Neighborhood d) Ausprobieren e) Mittelwerte ● Das sind Grundlagen, aber es gibt noch konkretere Algorithmen
  11. 11. Konzept a) Logik & Mathematik ● Wir verlassen uns auf Zahlen, wir nutzen unser Wissen ○ Welche Relevanz hat eine Website bei Google? ○ 75% 3 von 4 Wörter Suchanfrage zu Text ○ 50% Pagerank 5 von 10
  12. 12. Konzept a) Logik & Mathematik ● Wissensdatenbank ○ Matching zwischen Person und Gegenstand ○ "Frauen besuchen Brigitte.de" ● Parameter berechnen ○ Kreditvergabe: ■ Höhe des Kredits ■ Höhe des Einkommens ■ ... ○ Suchmaschinen Ergebnis ○ Herzinfarkt-Risiko ○ ...
  13. 13. Konzept b) Clustering ● Alle Möglichkeiten abzuwägen wäre kompliziert ● also fassen wir "Dinge" zu "Clustern" zusammen ● Vorteil 1: Weniger Komplexität bei Entscheidungen! ● Vorteil 2: Mehr Datendichte
  14. 14. Konzept b) Clustering A B C D
  15. 15. Konzept c) Neighborhood
  16. 16. Konzept c) Neighborhood
  17. 17. Konzept c) Neighborhood ● Gemeinsamkeiten suchen (ähnlich Clustering) ● Bekanntes auf Unbekanntes übertragen ● Allgemeiner Ansatz für Finanz- Entscheidung, Werbe-Empfehlung, Herzinfarkt-Risiko ● "Kollektive Intelligenz" - Mit neuen Daten werden die Empfehlungen automatisch besser
  18. 18. Konzept d) Ausprobieren ● "Trial and Error" ○ ausprobieren, scheitern, verbessern ● Man sollte fortlaufend beobachten ○ „Live Training“, denn alles ändert sich ○ Dazu technisches System um Erfolge zu kontrollieren ● A/B Testing ○ Beispiel Telefonmarketing ○ Variable: Ruft eine Frau oder ein Mann an? ● Multivariante A/B Tests ○ Mehr als eine Variable
  19. 19. Konzept e) Mittelwert
  20. 20. Konzept e) Mittelwert ● Wir haben Statistiken für alle Eingabe- Parameter ○ Wir orientieren uns am Durchschnittswert ○ Wir empfehlen das, was der Mainstream mag ● Kombination verschiedener Mittelwerte je nach Eingabeparameter ● Welcher Wert für Gender=Frau ● Welche Empfehlung für Publisher=fussball. de
  21. 21. Wo sind die Grenzen? ● Es gibt keine Grenzen ● Datenmengen bis in Petabyte Dimensionen ○ Das sind viele Otto-Normal-Festplatten ;) ● Auswertungen in Echtzeit ○ Keine Lochkarten Maschinen mehr ● Integration überall dort wo man es braucht ○ Keine Blackboxen mehr, der Mensch will verstehen ● Mehr im "Data Unser"
  22. 22. Fazit ● „Das Spiel“ hat gezeigt, dass Algorithmen auch mit Intuition gestützt werden können ● Es gibt verschiedene Konzepte, diese sind auch intuitiv ● Konzepte lassen sich miteinander kombinieren ● Es gibt viele Daten und alle Daten bieten Mehrwert, ● Eure Daten sind wertvoll Mehr Informationen: http://cra.org/ccc/docs/init/bigdatawhitepaper.pdf Challenges and Opportunities with Big Data, From leading researchers across the United States
  23. 23. Fragen? www.plista.com torben.brodt@plista.com @torbenbrodt xing.com/profile/Torben_Brodt http://goo.gl/pvXm5

×