Open Day Berlin - 02.12.09 - Track 3 - Neofonie

1.023 Aufrufe

Veröffentlicht am

Open Day Berlin - Track 3 - Neue Geschäftsmodelle - nachrichten.de - neofonie GmbH

Veröffentlicht in: Technologie
0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
1.023
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
2
Aktionen
Geteilt
0
Downloads
5
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

Open Day Berlin - 02.12.09 - Track 3 - Neofonie

  1. 1. Making news aggregation fair Geschäftsmodell & Technologie hinter nachrichten.de präsentiert von Daniel Prawdzik 1
  2. 2. Das Ziel „Topic Detection and Tracking“ → Nachrichten-Erkennung und -Verfolgung neofonie Technologieentwicklung und Informationsmanagement GmbH 2
  3. 3. Das Ziel „Topic Detection and Tracking“ → Nachrichten-Erkennung und -Verfolgung Ziel: Gruppierung aller Meldungen zu einem Ereignis neofonie Technologieentwicklung und Informationsmanagement GmbH 3
  4. 4. Das Ziel „Topic Detection and Tracking“ → Nachrichten-Erkennung und -Verfolgung Ziel: Gruppierung aller Meldungen zu einem Ereignis Online-Clustering des eingehenden Meldungsstroms neofonie Technologieentwicklung und Informationsmanagement GmbH 4
  5. 5. Vom Ereignis zur Nachricht Ereignis Nachricht Meldung Meldung Meldung neofonie Technologieentwicklung und Informationsmanagement GmbH 5
  6. 6. Vom Ereignis zur Nachricht Ereignis Wird in Meldungen beschrieben Nachricht Meldung Meldung Meldung neofonie Technologieentwicklung und Informationsmanagement GmbH 6
  7. 7. Vom Ereignis zur Nachricht Ereignis Entsteht aus Meldungen Nachricht Meldung Meldung Meldung neofonie Technologieentwicklung und Informationsmanagement GmbH 7
  8. 8. Vom Ereignis zur Nachricht Ereignis Beschreibt Ereignis Nachricht Meldung Meldung Meldung neofonie Technologieentwicklung und Informationsmanagement GmbH 8
  9. 9. Wie wird der Inhalt einer Meldung ermittelt? 9
  10. 10. Wie wird der Inhalt einer Meldung ermittelt? Was ist wo geschehen? neofonie Technologieentwicklung und Informationsmanagement GmbH 10
  11. 11. Wie wird der Inhalt einer Meldung ermittelt? Was ist wo geschehen? Welche Personen sind beteiligt? neofonie Technologieentwicklung und Informationsmanagement GmbH 11
  12. 12. Wie wird der Inhalt einer Meldung ermittelt? Was ist wo geschehen? Welche Personen sind beteiligt? Themen: Personen/Unternehmen/Organisationen (Wer) Orte (Wo) Datumsangaben (Wann) Schlagworte (Was) neofonie Technologieentwicklung und Informationsmanagement GmbH 12
  13. 13. Wie wird der Inhalt einer Meldung ermittelt? neofonie Technologieentwicklung und Informationsmanagement GmbH 13
  14. 14. Wie wird der Inhalt einer Meldung ermittelt? Meldung Themen werden automatisch auf dem Text extrahiert. Themenerkennung Themenprofil … … … neofonie Technologieentwicklung und Informationsmanagement GmbH 14
  15. 15. Wie wird der Inhalt einer Meldung ermittelt? Meldung Themenerkennung Themenprofil charakterisiert den Inhalt Themenprofil der aktuellen Meldung. … … … neofonie Technologieentwicklung und Informationsmanagement GmbH 15
  16. 16. Wie entsteht eine Nachricht? 16
  17. 17. Wie entsteht eine Nachricht? dpa-Meldung „TV-Debatte“ thematisiert Ereignis als erste neofonie Technologieentwicklung und Informationsmanagement GmbH 17
  18. 18. Wie entsteht eine Nachricht? dpa-Meldung „TV-Debatte“ thematisiert Ereignis als erste Nachricht zur „TV-Debatte“ wird erzeugt neofonie Technologieentwicklung und Informationsmanagement GmbH 18
  19. 19. Wie entsteht eine Nachricht? dpa-Meldung „TV-Debatte“ thematisiert Ereignis als erste Nachricht zur „TV-Debatte“ wird erzeugt Themenprofil der neuen Nachricht wird durch Themenprofil der ersten Meldung charakterisiert neofonie Technologieentwicklung und Informationsmanagement GmbH 19
  20. 20. Wie wird eine Meldung einer Nachricht zugeordnet? 20
  21. 21. Wie wird eine Meldung einer Nachricht zugeordnet? Meldung und Nachricht teilen viele Themen → hohe Ähnlichkeit neofonie Technologieentwicklung und Informationsmanagement GmbH 21
  22. 22. Wie wird eine Meldung einer Nachricht zugeordnet? Meldung und Nachricht teilen viele Themen → hohe Ähnlichkeit Meldung und Nachricht teilen wenig Themen → geringe Ähnlichkeit neofonie Technologieentwicklung und Informationsmanagement GmbH 22
  23. 23. Wie wird eine Meldung einer Nachricht zugeordnet? Meldung und Nachricht teilen viele Themen → hohe Ähnlichkeit Meldung und Nachricht teilen wenig Themen → geringe Ähnlichkeit Verwendung eines Vektorraummodells (VSM) neofonie Technologieentwicklung und Informationsmanagement GmbH 23
  24. 24. Wie wird eine Meldung einer Nachricht zugeordnet? Meldung und Nachricht teilen viele Themen → hohe Ähnlichkeit Meldung und Nachricht teile wenig Themen → geringe Ähnlichkeit Verwendung eines Vektorraummodells (VSM) Jedes Thema entspricht einer Dimension Themenprofile werden im Vektorraum abgebildet neofonie Technologieentwicklung und Informationsmanagement GmbH 24
  25. 25. Wie wird eine Meldung einer Nachricht zugeordnet? Thema "Angela Merkel" Cluster zur „TV-Debatte“ Thema "Frank-Walter Steinmeier " Thema "Gesundheits- reform" neofonie Technologieentwicklung und Informationsmanagement GmbH 25
  26. 26. Wie wird eine Meldung einer Nachricht zugeordnet? Thema "Angela Merkel" X Thema "Frank-Walter Steinmeier " Thema "Gesundheits- reform" neofonie Technologieentwicklung und Informationsmanagement GmbH 26
  27. 27. Wie wird eine Meldung einer Nachricht zugeordnet? Y Thema "Angela Merkel" Thema "Frank-Walter Steinmeier " Thema "Gesundheits- reform" neofonie Technologieentwicklung und Informationsmanagement GmbH 27
  28. 28. Wie wird eine Meldung einer Nachricht zugeordnet? Thema "Angela Merkel" Z Thema "Frank-Walter Steinmeier " Thema "Gesundheits- reform" neofonie Technologieentwicklung und Informationsmanagement GmbH 28
  29. 29. Wie wird eine Meldung einer Nachricht zugeordnet? Thema "Angela Merkel" FOCUS Online Meldung „TV-Debatte“ Thema "Frank-Walter Steinmeier " Thema "Gesundheits- reform" neofonie Technologieentwicklung und Informationsmanagement GmbH 29
  30. 30. Wie wird eine Meldung einer Nachricht zugeordnet? Neue Meldung wird existierender Nachricht hinzugefügt neofonie Technologieentwicklung und Informationsmanagement GmbH 30
  31. 31. Wie wird eine Meldung einer Nachricht zugeordnet? Neue Meldung wird existierender Nachricht hinzugefügt Themenprofile von Nachricht und Meldung werden verschmolzen neofonie Technologieentwicklung und Informationsmanagement GmbH 31
  32. 32. Wie wird eine Meldung einer Nachricht zugeordnet? Neue Meldung wird existierender Nachricht hinzugefügt Themenprofile von Nachricht und Meldung werden verschmolzen Wissenschaftlicher Ausdruck: Zentroid Zentroid: arithmetischer Mittelwert aller Themenprofile neofonie Technologieentwicklung und Informationsmanagement GmbH 32
  33. 33. Wie wird eine Meldung einer Nachricht zugeordnet? neofonie Technologieentwicklung und Informationsmanagement GmbH 33
  34. 34. Wann entsteht eine neue Nachricht? 34
  35. 35. Wann entsteht eine neue Nachricht? Thema "Angela Merkel" Thema "Frank-Walter Steinmeier " Thema "Gesundheits- reform" neofonie Technologieentwicklung und Informationsmanagement GmbH 35
  36. 36. Wann entsteht eine neue Nachricht? Thema Spiegel Online: "Angela Merkel" Barack Obamas Rede zur Gesundheitsreform Thema "Frank-Walter Steinmeier " Thema "Gesundheits- reform" neofonie Technologieentwicklung und Informationsmanagement GmbH 36
  37. 37. Wann entsteht eine neue Nachricht? Thema Abstand groß → Ähnlichkeit klein "Angela Merkel" Thema "Frank-Walter Steinmeier " Thema "Gesundheits- reform" neofonie Technologieentwicklung und Informationsmanagement GmbH 37
  38. 38. Wann entsteht eine neue Nachricht? • Schwellenwert Thema "Angela entscheidet Merkel" • Cosinus Similarity Thema "Frank-Walter Steinmeier " Thema "Gesundheits- reform" neofonie Technologieentwicklung und Informationsmanagement GmbH 38
  39. 39. Wann entsteht eine neue Nachricht? Cosinus Similarity: errechnet den Winkel zwischen den Themenprofilen neofonie Technologieentwicklung und Informationsmanagement GmbH 39
  40. 40. Wann entsteht eine neue Nachricht? Cosinus Similarity: errechnet den Winkel zwischen den Themenprofilen Kondensationspunkt für weitere Meldungen zu dem Ereignis neofonie Technologieentwicklung und Informationsmanagement GmbH 40
  41. 41. Wann entsteht eine neue Nachricht? Cosinus Similarity: errechnet den Winkel zwischen den Themenprofilen Kondensationspunkt für weitere Meldungen zu dem Ereignis Driften der Nachrichten/Zentroiden in Grenzen erlaubt neofonie Technologieentwicklung und Informationsmanagement GmbH 41
  42. 42. Von der Meldung zur Nachricht Meldung • Errechnet die Ähnlichkeit Themenerkennung einer Meldung zu allen Nachrichten. Themenprofil • Vektorraum mit ca. 1 Millionen Dimensionen. Topic Detection & Nachrichten Tracking Nachricht neofonie Technologieentwicklung und Informationsmanagement GmbH 42
  43. 43. Von der Meldung zur Nachricht Meldung Themenerkennung Speicherung aller Nachrichten, die verarbeitet Themenprofil wurden (4.000 – 20.000 Nachrichten). Topic Detection & Nachrichten Tracking Nachricht neofonie Technologieentwicklung und Informationsmanagement GmbH 43
  44. 44. Von der Meldung zur Nachricht Meldung Themenerkennung • Neue Nachricht? Themenprofil • oder: Zuordnung zu vorhandener Nachricht? Topic Detection & Nachrichten Tracking Nachricht neofonie Technologieentwicklung und Informationsmanagement GmbH 44
  45. 45. Von der Meldung zur Nachricht Meldung Themenerkennung Ausgabe der Themenprofil Nachricht! Topic Detection & Nachrichten Tracking Nachricht neofonie Technologieentwicklung und Informationsmanagement GmbH 45
  46. 46. Herausforderungen bei der Nachrichtenerkennung? Erkennen der einzelnen Ereignisse komplex neofonie Technologieentwicklung und Informationsmanagement GmbH 46
  47. 47. Herausforderungen bei der Nachrichtenerkennung? Erkennen der einzelnen Ereignisse komplex Verschiedene Ereignisse verfügen teilweise über ähnliches Themenprofil z.B. Bundestagswahl 2009 neofonie Technologieentwicklung und Informationsmanagement GmbH 47
  48. 48. Herausforderungen bei der Nachrichtenerkennung? Erkennen der einzelnen Ereignisse komplex Verschiedene Ereignisse verfügen teilweise über ähnliches Themenprofil z.B. Bundestagswahl 2009 Nachrichten altern neofonie Technologieentwicklung und Informationsmanagement GmbH 48
  49. 49. Herausforderungen bei der Nachrichtenerkennung? Erkennen der einzelnen Ereignisse komplex Verschiedene Ereignisse verfügen teilweise über ähnliches Themenprofil z.B. Bundestagswahl 2009 Nachrichten altern Nachrichten werden geschlossen verhindert das Nachrichten zu groß werden neofonie Technologieentwicklung und Informationsmanagement GmbH 49
  50. 50. Daniel Prawdzik: Lead Developer Topic Detection & Tracking neofonie: Technologieentwicklung und Informationsmanagement GmbH Robert-Koch-Platz 4 10115 Berlin www.neofonie.de 50
  51. 51. Herzlichen Dank! 51

×