Georg Rehm, Felix Sasaki. Digitale Kuratierungstechnologien: Intelligente Software für den Arbeitsplatz von morgen. Berlin, Germany. October 2014. October 06, 2014.
The Strategic Agenda for the Multilingual Digital Single Market V0.9
Digitale Kuratierungstechnologien: Intelligente Software für den Arbeitsplatz von morgen
1. Digitale Kuratierungstechnologien
Intelligente Software für den
Arbeitsplatz von morgen"
Georg Rehm, Felix Sasaki"
DFKI GmbH"
Forschungsbereich Sprachtechnologie, Berlin"
"
Statusmeeting Semantic Media Web – 6. Oktober 2014, Berlin"
"
2. Überblick"
• Digitale Kuratierung"
• Plattform für digitale Kuratierungstechnologien"
• Semantische Werkzeuge und Anwendungen für den
Arbeitsplatz von Morgen – Beispieltechnologien"
Digitale Kuratierungstechnologien – 6. Oktober 2014" 2"
32. Branche A
Branche B
Branche C
Branche D
Digitale Kuratierungstechnologien – 6. Oktober 2014"
32"
33. Branche A
Branche B
Sind Generalisierungen über
mehrere Branchen hinweg
möglich, um eine bestmögliche
Unterstützung durch intelligente
Software zu gewährleisten?"
Branche C
Branche D
Digitale Kuratierungstechnologien – 6. Oktober 2014"
33"
41. Wo Technologie helfen kann"
• Übersetzen und Aggregieren von Agenturmeldungen."
• Effiziente Einordnung der Relevanz einer Information."
• Storytelling und Timelining – Auswahl und Präsentation
von Informationen zu einem bestimmten Thema."
• Herkunft – Stammen spezifische Online-Meldungen aus
verlässlichen Quellen? Sind die Meldungen wahr?"
• Analyse, Anreicherung und Verlinkung von Informationen. "
• Branchenspezifische Prozesse z.B. zur Kuratierung von
Showrooms, Museen, Fernsehsendungen, Archiven etc."
Digitale Kuratierungstechnologien – 6. Oktober 2014" 41"
42. Zwischenfazit"
• Inhalte sind textzentriert, mehrsprachig, multimedial."
• Kuratierung von Inhalten ist zeit- und wissensintensiv,
interdisziplinär, erfolgt in Teams."
• Inhalte lassen sich aus diversen Perspektiven
kombinieren, z.B. thematisch, chronologisch, räumlich."
• Konkrete Anforderungen aus dem jeweiligen
Branchenkontext (Verlage, Museen, Archive, etc.)."
• Kaum Unterstützung der Kuratierung, da Systeme zur
Content-Erstellung nur rudimentäre Funktionen anbieten."
• Erhebliche Herausforderungen in der Content-Industrie."
Digitale Kuratierungstechnologien – 6. Oktober 2014" 42"
43. PLATTFORM FÜR DIGITALE
KURATIERUNGSTECHNOLOGIEN!
Digitale Kuratierungstechnologien – 6. Oktober 2014" 43"
44. Digitale Kuratierungstechnologien"
• Automatisieren und Ersetzen von Menschen („alte KI“)."
• Stattdessen: Unterstützung kognitiver Prozesse durch
semantische Technologien („neue KI“, Smart Technologies)."
• Sprache spielt auf zwei Ebenen eine zentrale Rolle: "
– Primärdaten – die eigentlichen Inhalte"
– Sekundärdaten – Metadaten, Informationen über Primärdaten"
• DFKI FB LT verfügt über ein umfangreiches Technologie-Portfolio."
• Content-Industrie KMUs haben dringenden Bedarf an smarten
Technologien zur Unterstützung ihrer Wissensarbeiter."
• Ziel: Transfer der im DFKI entwickelten Lösungen in die Industrie
mittels Plattform für digitale Kuratierungstechnologien."
Digitale Kuratierungstechnologien – 6. Oktober 2014" 44"
45. DFKI Forschungsbereich LT"
• FB Sprachtechnologie (LT) ist einer von zehn
verschiedenen Forschungsbereichen."
• Vertreten an den Standorten Berlin und Saarbrücken."
• Ca. 35 Mitarbeiter (Vollzeit) + ca. 25 Hilfskräfte, Gäste."
• Umsatz ca. 4,1M€ (2013)."
• Zahlreiche Projekte (EU/EC, BMBF, BMWi, Senat etc.)."
• Schwerpunkte:"
– Semantische Technologien (Analyse, Generierung)"
– Informations- und Relationsextraktion"
– Mehrsprachige Technologien"
– Lokalisierung und Internationalisierung"
Digitale Kuratierungstechnologien – 6. Oktober 2014" 45"
46. Plattform – Ziele der Industrie"
• (Semi-)automatische Verfahren, um die Kuratierungsschritte –
Recherche, Anreicherung, Timelining, Qualitätsprüfung,
Datenkonvertierung – so zu optimieren, dass sich zeitliche
und finanzielle Aufwände reduzieren lassen. "
• Flexible Services, die alle branchenspezifischen Lösungen
und den gesamten Workflow unterstützen: Suche, Redaktion,
Kollaboration, Kundenbindung, Navigation, Distribution. "
• APIs erlauben einen einheitlichen Zugriff und flexiblen
Datenaustausch für alle benötigten Formate. "
• Die branchenspezifischen Lösungen der KMUs sollen für
diese Branchen substantielle und dringend benötigte
Prozessoptimierungen ermöglichen. "
Digitale Kuratierungstechnologien – 6. Oktober 2014" 46"
47. Digitale Kuratierungstechnologien – 6. Oktober 2014"
Sprach- und
Wissens-technologien
"
Mehr-"
sprachigkeit"
Annotation und
Anreicherung"
Media Fragment"
Generierung"
Analytics
(Text, Bild,
Video, Audio)"
Semantische
Verarbeitung mit
LoD Quellen"
Provenance"
Kuratierungs-technologien
"
Branchen-technologien
"
Plattformtechnologie"
Museen,
Showrooms,
Messen"
Fernseh- und
Rundfunk-sender,
WebTV"
Publishing,
Verlage,
Medienhäuser"
Archive,
Bibliotheken,
Kultureinrich-tungen
"
Workflows,
Persistenz"
User
Interfaces"
Software
as a
Service"
..."
Klassifikation,
Visualisierung,
Interaktion"
Empfehlungen,
Zusammen-fassungen
"
Semantische
Annotation"
Semantic
Storytelling,
Ontologien,
Wissens-strukturen
"
47"
48. Digitale Kuratierungstechnologien – 6. Oktober 2014"
Sprach- und
Wissens-technologien
!
Mehr-"
sprachigkeit"
Annotation und
Anreicherung"
Media Fragment"
Generierung"
Analytics
(Text, Bild,
Video, Audio)"
Semantische
Verarbeitung mit
LoD Quellen"
Provenance"
Kuratierungs-technologien
"
Branchen-technologien
"
Plattformtechnologie"
Museen,
Showrooms,
Messen"
Fernseh- und
Rundfunk-sender,
WebTV"
Publishing,
Verlage,
Medienhäuser"
Archive,
Bibliotheken,
Kultureinrich-tungen
"
Workflows,
Persistenz"
User
Interfaces"
Software
as a
Service"
..."
Klassifikation,
Visualisierung,
Interaktion"
Empfehlungen,
Zusammen-fassungen
"
Semantische
Annotation"
Semantic
Storytelling,
Ontologien,
Wissens-strukturen
"
Basisschicht der Technologieplattform!
• Kernkomponenten der Sprach- und
Wissenstechnologie. "
• Fokus: Mehrsprachigkeit, Robustheit,
Performanz und Skalierbarkeit."
• Interoperabilität durch offene, flexible APIs."
• Wichtige Funktionen: Mehrsprachige
Annotation; Informationsextraktion;
Textgenerierung; Clustering; Klassifikation."
48"
49. Digitale Kuratierungstechnologien – 6. Oktober 2014"
Sprach- und
Wissens-technologien
"
Mehr-"
sprachigkeit"
Annotation und
Anreicherung"
Media Fragment"
Generierung"
Analytics
(Text, Bild,
Video, Audio)"
Semantische
Verarbeitung mit
LoD Quellen"
Provenance"
Kuratierungs-technologien
!
Branchen-technologien
"
Plattformtechnologie"
Museen,
Showrooms,
Messen"
Fernseh- und
Rundfunk-sender,
WebTV"
Publishing,
Verlage,
Medienhäuser"
Archive,
Bibliotheken,
Kultureinrich-tungen
"
Workflows,
Persistenz"
User
Interfaces"
Software
as a
Service"
..."
Klassifikation,
Visualisierung,
Interaktion"
Empfehlungen,
Zusammen-fassungen
"
Semantische
Annotation"
Semantic
Storytelling,
Ontologien,
Wissens-strukturen
"
• Funktionalitäten für die Erstellung, Generierung,
Verwaltung, Analyse, Visualisierung und Verteilung
kuratierter Inhalte."
• Spezifizierung und Entwicklung offener und flexibler
APIs; Plattformintegration."
• Festlegung geeigneter Workflows in Kombination mit
den Komponenten der beiden anderen Schichten."
49"
50. Digitale Kuratierungstechnologien – 6. Oktober 2014"
Sprach- und
Wissens-technologien
"
Mehr-"
sprachigkeit"
Annotation und
Anreicherung"
Media Fragment"
Generierung"
Analytics
(Text, Bild,
Video, Audio)"
Semantische
Verarbeitung mit
LoD Quellen"
Provenance"
Kuratierungs-technologien
"
Branchen-technologien
!
Plattformtechnologie"
Museen,
Showrooms,
Messen"
Fernseh- und
Rundfunk-sender,
WebTV"
Publishing,
Verlage,
Medienhäuser"
Archive,
Bibliotheken,
Kultureinrich-tungen
"
Separate Vorträge gehen auf
diese beiden Schichten ein.!
Workflows,
Persistenz"
User
Interfaces"
Software
as a
Service"
..."
Klassifikation,
Visualisierung,
Interaktion"
Empfehlungen,
Zusammen-fassungen
"
Semantische
Annotation"
Semantic
Storytelling,
Ontologien,
Wissens-strukturen
"
50"
51. Drei Funktionsbereiche"
• Semantische Analyse:!
– Anreicherung von Informationen mit Metadaten (z.B. zu Eigennamen) "
– Semantische Textanalyse, z.B. automatisches Textzusammenfassen "
– Implementierung von W3C-Standards (Mediafragments, RDF) und
Industriestandards wie schema.org "
– Anreicherung von Informationen mit externen Datenquellen inkl.
Provenance-Information, z.B. LOD (z.B. DBpedia, Wikidata) "
• Semantische Generierung:!
– Hypertextualisierung und Aufbereitung von Informationssammlungen
zu Texten und Hypertexten (Semantic Story Telling) "
– Nutzung von Markup-Sprachen für thematische, räumliche, temporale
Annotation und Darstellung "
• Internationalisierung und Mehrsprachigkeit: "
– Anwendung von W3C-Standards (z.B. ITS 2.0), Verknüpfung mit LOD"
– Integration von MT"
Digitale Kuratierungstechnologien – 6. Oktober 2014" 51"
52. SEMANTISCHE WERKZEUGE
UND ANWENDUNGEN: BEISPIELE!
Digitale Kuratierungstechnologien – 6. Oktober 2014" 52"
53. Semantische DFKI-Technologien"
• SProUT: Shallow Processing with Unification
and Typed Feature Structures (BMBF)"
• Excitement: Exploring Customer Interaction
through Textual Entailment (EU/EC)"
• Theseus: TechWatch Technologie- und
Marktbeobachtung (BMWi)"
• Trendminder: Large-scale cross-lingual
Trend Mining Summarization of real-time
media streams (EU/EC)"
Digitale Kuratierungstechnologien – 6. Oktober 2014" 53"
54. SProUT"
• SProUT ist ein Werkzeug für die Erkennung von Namen,
Konzepten und einfachen Relationen."
• Basis: Grammatikregeln und große Wissensressourcen."
• Unterstützt derzeit 11 Sprachen."
• Ausdrucksstarker, effizienter Grammatik-Formalismus."
• Leichte Wiederverwendbarkeit, starke Modularisierung."
• Einfache Anpassbarkeit für das Einsatzziel."
• Wird seit über 10 Jahren eingesetzt und weiterentwickelt."
Digitale Kuratierungstechnologien – 6. Oktober 2014" 54"
55. SProUT"
• Integrierte Entwick-lungsumgebung
"
• Verarbeitung von
Dokumenten"
• Entwicklung und
Anpassung von
Regeln"
• Interaktives
Debugging"
Digitale Kuratierungstechnologien – 6. Oktober 2014" 55"
56. Excitement"
• Partner!
– Bar-Ilan University, Ramat Gan, IL"
– DFKI, Saarbrücken, DE"
– Fondazione Bruno Kessler, Povo, IT"
– University of Heidelberg, DE"
– NICE, Ra'anana, IL (Koordinator)"
– OMQ, Berlin, DE"
– AlmaViva, Roma, IT"
(Premise) !
!The technological triumph
known as GPS was incubated
in the mind of Ivan Getting."
! ! !"
(Conclusion) !
Ivan Getting invented GPS."
• Ziel: Textuelle Inferenz – Bestimmung semantischer
Beziehungen zwischen zwei Textteilen"
Digitale Kuratierungstechnologien – 6. Oktober 2014"
56"
57. Excitement-Open-Platform"
Ziele:!
• Open Source Plattform für
Textual Entailment."
• Multilingual: DE, EN, IT."
• Multikanal: Email, Speech,
Social Media"
• Reale Use-Cases:
Industriepartner integrieren
Services in CRM-Produkte."
Digitale Kuratierungstechnologien – 6. Oktober 2014" 57"
58. TechWatch"
• Technologien:!
– Bibliometrie, Information Wrapping, Text Mining,
Informationsextraktion, semantische Suche."
• Anwendungen:!
– Suche nach Publikationen und Patenten sowie nach
Zusammenhängen zwischen diesen in Bezug auf
Thematik, Autoren, Zeitverläufen und Organisationen."
– Suche nach Innovationstreibern und Trendaussagen."
– Wissensdomäne als Ontologie, die für alle weiteren
Funktionalitäten für die Verbesserung der Suche und
Analyse eingesetzt werden kann (Thyssen-Krupp)"
Digitale Kuratierungstechnologien – 6. Oktober 2014" 58"
62. Schlussfolgerungen"
• Die Plattform für Kuratierungstechnologien adressiert
den Markt für Erweiterungen von CMS. "
• 2014 werden hier ca. 1,7 Mrd. Euro in Deutschland
umgesetzt (Steigerung gegenüber 2013: 6%)."
• Umfangreiches Portfolio aktuell verfügbar werdender
Werkzeuge und Technologien am DFKI."
• KMUs könnten signifikant hiervon profitieren."
• Wir glauben, dass wir gemeinsam einen hochgradig
innovativen und zukunftsfähigen Beitrag leisten können."
Digitale Kuratierungstechnologien – 6. Oktober 2014" 62"
63. Digitale Kuratierungstechnologien – 6. Oktober 2014"
Sprach- und
Wissens-technologien
"
Mehr-"
sprachigkeit"
Annotation und
Anreicherung"
Media Fragment"
Generierung"
Analytics
(Text, Bild,
Video, Audio)"
Semantische
Verarbeitung mit
LoD Quellen"
Provenance"
Kuratierungs-technologien
"
Branchen-technologien
"
Plattformtechnologie"
Museen,
Showrooms,
Messen"
Fernseh- und
Rundfunk-sender,
WebTV"
Publishing,
Verlage,
Medienhäuser"
Archive,
Bibliotheken,
Kultureinrich-tungen
"
Workflows,
Persistenz"
User
Interfaces"
Software
as a
Service"
..."
Klassifikation,
Visualisierung,
Interaktion"
Empfehlungen,
Zusammen-fassungen
"
Semantische
Annotation"
Semantic
Storytelling,
Ontologien,
Wissens-strukturen
"
63"
64. Digitale Kuratierungstechnologien – 6. Oktober 2014"
Sprach- und
Wissens-technologien
"
Mehr-!
sprachigkeit!
Annotation und
Anreicherung"
Media Fragment"
Generierung"
Analytics
(Text, Bild,
Video, Audio)"
Semantische
Verarbeitung mit
LoD Quellen"
Provenance"
Kuratierungs-technologien
"
Branchen-technologien
"
Plattformtechnologie"
Museen,
Showrooms,
Messen!
Fernseh- und
Rundfunk-sender,
WebTV!
Publishing,
Verlage,
Medienhäuser!
Archive,
Bibliotheken,
Kultureinrich-tungen
!
Workflows,
Persistenz"
User
Interfaces"
Software
as a
Service"
..."
Klassifikation,
Visualisierung,
Interaktion"
Empfehlungen,
Zusammen-fassungen
"
Semantische
Annotation"
Semantic
Storytelling,
Ontologien,
Wissens-strukturen
"
64"
65. Digitale Kuratierungstechnologien – 6. Oktober 2014"
Sprach- und
Wissens-technologien
"
Mehr-!
sprachigkeit!
Annotation und
Anreicherung"
Media Fragment"
Generierung"
Analytics
(Text, Bild,
Video, Audio)"
Semantische
Verarbeitung mit
LoD Quellen"
Provenance"
Kuratierungs-technologien
"
Branchen-technologien
"
Plattformtechnologie"
Museen,
Showrooms,
Messen!
Fernseh- und
Rundfunk-sender,
WebTV!
Publishing,
Verlage,
Medienhäuser!
Archive,
Bibliotheken,
Kultureinrich-tungen
!
Workflows,
Persistenz"
User
Interfaces"
Software
as a
Service"
..."
Klassifikation,
Visualisierung,
Interaktion"
Empfehlungen,
Zusammen-fassungen
"
Semantische
Annotation"
Semantic
Storytelling,
Ontologien,
Wissens-strukturen
"
Vielen Dank!"
65"