Digitale Kuratierungstechnologien: Intelligente Software für den Arbeitsplatz...Georg Rehm
Georg Rehm, Felix Sasaki. Digitale Kuratierungstechnologien: Intelligente Software für den Arbeitsplatz von morgen. Berlin, Germany. October 2014. October 06, 2014.
Human Language Technologies in a Multilingual EuropeGeorg Rehm
The document summarizes a presentation on human language technologies in a multilingual Europe. Some key points:
- There are 24 official EU languages and many regional/minority languages that have equal status but most are under-supported by language technologies and face digital extinction.
- The META-NET alliance coordinates language technology research across Europe but the field remains fragmented. There is a need for high-quality, deployable language technologies to support applications like translation, conversational interfaces, and a multilingual digital single market.
- A proposed "Multilingual Value Programme" would help enable the multilingual digital single market through technologies for translating, analyzing, processing and curating natural language content.
- A long-term
Language Technologies for Big Data – A Strategic Agenda for the Multilingual ...Georg Rehm
Georg Rehm. Language Technologies for Big Data – A Strategic Agenda for the Multilingual Digital Single Market. BDVA Summit (Big Data Value Association), Valencia, Spain, December 2016. December 1, 2016.
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...Georg Rehm
Georg Rehm. Transformieren, Manipulieren, Kuratieren? Technologien für die Wissensarbeit im Netz. KOOP-LITERA International. Konferenz 2017, Berlin, Germany, June 2017. June 20, 2017. Invited talk.
Georg Rehm. Kuratieren im Zeitalter der KI. #DKT17 - Kuratieren im Zeitalter der KI, Berlin, Germany, October 2017. October 12, 2017. Invited keynote talk.
Was Sie schon immer über barrierefreie PDFs wissen wolltenMarkus Erle
Vortrag von Markus Erle, Wertewerk auf der Fachtagung "Aufbereitung barrierefreier Dokumente" im Rahmen der Daisy2009-Konferenz in Leipzig am 22.09.2009
Digitale Kuratierungstechnologien: Intelligente Software für den Arbeitsplatz...Georg Rehm
Georg Rehm, Felix Sasaki. Digitale Kuratierungstechnologien: Intelligente Software für den Arbeitsplatz von morgen. Berlin, Germany. October 2014. October 06, 2014.
Human Language Technologies in a Multilingual EuropeGeorg Rehm
The document summarizes a presentation on human language technologies in a multilingual Europe. Some key points:
- There are 24 official EU languages and many regional/minority languages that have equal status but most are under-supported by language technologies and face digital extinction.
- The META-NET alliance coordinates language technology research across Europe but the field remains fragmented. There is a need for high-quality, deployable language technologies to support applications like translation, conversational interfaces, and a multilingual digital single market.
- A proposed "Multilingual Value Programme" would help enable the multilingual digital single market through technologies for translating, analyzing, processing and curating natural language content.
- A long-term
Language Technologies for Big Data – A Strategic Agenda for the Multilingual ...Georg Rehm
Georg Rehm. Language Technologies for Big Data – A Strategic Agenda for the Multilingual Digital Single Market. BDVA Summit (Big Data Value Association), Valencia, Spain, December 2016. December 1, 2016.
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...Georg Rehm
Georg Rehm. Transformieren, Manipulieren, Kuratieren? Technologien für die Wissensarbeit im Netz. KOOP-LITERA International. Konferenz 2017, Berlin, Germany, June 2017. June 20, 2017. Invited talk.
Georg Rehm. Kuratieren im Zeitalter der KI. #DKT17 - Kuratieren im Zeitalter der KI, Berlin, Germany, October 2017. October 12, 2017. Invited keynote talk.
Was Sie schon immer über barrierefreie PDFs wissen wolltenMarkus Erle
Vortrag von Markus Erle, Wertewerk auf der Fachtagung "Aufbereitung barrierefreier Dokumente" im Rahmen der Daisy2009-Konferenz in Leipzig am 22.09.2009
Digitale Kuratierungstechnologien – Beispiele aus ausgewählten BranchenGeorg Rehm
Felix Sasaki and Georg Rehm. Digitale Kuratierungstechnologien: Beispiele aus ausgewählten Branchen. #DKT15 - Digitale Kuratierungstechnologien, Berlin, Germany, October 2015. October 06, 2015
Hypertextsorten: Eine neuartige Ebene der Filterung und Herausforderung für m...Georg Rehm
Georg Rehm. Hypertextsorten: Eine neuartige Ebene der Filterung und Herausforderung für moderne Suchmaschinen. FAST Search, A Microsoft Subsidiary, Munich, Germany, August 2008. August 13, 2008. Invited talk.
Die Zeiten einfacher Web-Anwendungen sind gezählt. Moderne Unternehmen stehen heute vor der Aufgabe, unterschiedlichste Kanäle, wie Web, Desktop, Mobile oder 3rd Party Clients, parallel bedienen zu müssen. Und das mit einer Architektur. Wie aber sieht eine passende Architektur aus? Welche neuen Herausforderungen ergeben sich durch die zusätzlichen Kanäle? Und welche Auswirkungen hat dies auf Aspekte wie Security, Schnittstellendesign oder das Datenmodell? In der Session „öffnen“ wir eine Web-Anwendung und stellen uns den Herausforderungen.
Oftmals wird "Multi-Channel" gleichgesetzt mit Responsive Design. Dies setzt allerdings voraus, dass jeder Channel mehr oder minder dieselben Use-Cases bedient. Ein echter Business-Mehrwert wird aber erst erreicht, wenn jeder Channel seine speziellen Eigenschaften ausspielt, was automatisch eine deutlich größere Flexibilität - auch auf Ebene der Architektur - verlangt. Genau hier setzt die Session an und zeigt, wie eine Architektur aufgebaut sein sollte, die deutlich mehr erlaubt als "nur" Responsive Design.
Die Internationale Suchmaschinenoptimierungavenit AG
Alles rund um das Thema internationale Suchmaschinenoptimierung – darunter die verschiedenen Suchmaschinen und deren Marktanteile, sowie die Themen Keywords, Domainkonzept, GEO-Targeting und Duplicate Content - werden in dieser Präsentation von der avenit AG konkret dargestellt.
OCR – Herausforderungen und Werkzeuge auf dem Weg vom Bild zur Digitalen Editioncneudecker
Numéerisation de masse et traitement des grands corpus de textes utilisant des méthodes des humanitées numéeriques / Massendigitalisierung und die Bearbeitung großer Textkorpora mit Methoden der 'Digital Humanities', 12-13 March 2015, Stuttgart, Germany
There and back again - Responsive Webdesign mit WordPress Michael Oeser
There and back again - Responsive Webdesign (RWD) mit WordPress - Vom Desktop zum Smartphone und wieder zurück
Präsentation anlässlich der Wordpress Konferenz am 05.03.2013 in Zürich
Session von Markus Kaußen zum Thema "Übersetzungsmanagement" - Non-Profit CampNonProfitCamp
“Modernes Übersetzungsmanagement durch Crowdsourcing. Wie Non-Profits von neuen, technischen Möglichkeiten profitieren können.”
Da viele Non-Profit-Organisationen international tätig sind, werden diverse Texte häufig in mehreren Sprachen benötigt. Neben der herkömmlichen Beauftragung von professionellen Übersetzern steht insbesondere bei kleinen oder eingeschränkten Budgets auch Crowdsourcing als Option zur Verfügung.
Sören Krasel, Consultant für e-Learning und Mediengestaltung bei der Daimler AG, spricht auf dem Confluence & JIRA Community Day am 20. September 2012 in Frankfurt/Main zum Thema "Wissensmanagement @MPS".
Mehr Informationen zum CCD 2012 gibt es in unserem Techblog: http://www.communardo.de/home/?s=ccd2012
Immer mehr Abteilungen melden Übersetzungsbedarf an und schicken Dokumente per E-Mail? Content-Systeme wie Supportdatenbanken schwellen an und die manuelle Verteilung der Inhalte nimmt überhand? Neue Prozessschritte, wie das Einbinden von Grafikdesign, lassen das Projektmanagement ausufern?
In dieser Präsentation sehen Sie, welche Kriterien Sie anlegen können, um zu entscheiden, ob die Zeit reif ist, Ihre Übersetzungsprojekte mit Workflowmanagement-Software durchzuführen.
Video zur Präsentation: http://www.youtube.com/watch?v=eXDycRdJh8E&feature=youtu.be
Planung und Gestaltung internationaler Webseitenkernpunkt
Die Implementierung von Unternehmenswebseiten im internationalen Kontext ist nicht einfach. Kulturelle, technische oder sprachliche Unterschiede je nach Land oder sogar Region, verdienen besondere Aufmerksamkeit.
kernpunkt-Geschäftsführer Matthias Steinforth präsentiert wesentliche Besonderheiten bei der Planung und Gestaltung von multinationalen Unternehmenswebseiten vor.
QURATOR: A Flexible AI Platform for the Adaptive Analysis and Creative Genera...Georg Rehm
Georg Rehm. QURATOR: Developing a Flexible AI Platform for Digital Content Curation. QURATOR 2020 – Conference on Digital Curation Technologies., 1 2020. Fraunhofer FOKUS, January 20/21, 2020. Invited keynote talk.
Observations on Annotations – From Computational Linguistics and the World Wi...Georg Rehm
Georg Rehm. Observations on Annotations – From Computational Linguistics and the World Wide Web to Artificial Intelligence and back again. Annotation in Scholarly Editions and Research: Function – Differentiation – Systematization, University of Wuppertal, Germany. February 20-22, 2019. Invited keynote talk.
Weitere ähnliche Inhalte
Ähnlich wie Mehrsprachigkeit und semantische Technologien
Digitale Kuratierungstechnologien – Beispiele aus ausgewählten BranchenGeorg Rehm
Felix Sasaki and Georg Rehm. Digitale Kuratierungstechnologien: Beispiele aus ausgewählten Branchen. #DKT15 - Digitale Kuratierungstechnologien, Berlin, Germany, October 2015. October 06, 2015
Hypertextsorten: Eine neuartige Ebene der Filterung und Herausforderung für m...Georg Rehm
Georg Rehm. Hypertextsorten: Eine neuartige Ebene der Filterung und Herausforderung für moderne Suchmaschinen. FAST Search, A Microsoft Subsidiary, Munich, Germany, August 2008. August 13, 2008. Invited talk.
Die Zeiten einfacher Web-Anwendungen sind gezählt. Moderne Unternehmen stehen heute vor der Aufgabe, unterschiedlichste Kanäle, wie Web, Desktop, Mobile oder 3rd Party Clients, parallel bedienen zu müssen. Und das mit einer Architektur. Wie aber sieht eine passende Architektur aus? Welche neuen Herausforderungen ergeben sich durch die zusätzlichen Kanäle? Und welche Auswirkungen hat dies auf Aspekte wie Security, Schnittstellendesign oder das Datenmodell? In der Session „öffnen“ wir eine Web-Anwendung und stellen uns den Herausforderungen.
Oftmals wird "Multi-Channel" gleichgesetzt mit Responsive Design. Dies setzt allerdings voraus, dass jeder Channel mehr oder minder dieselben Use-Cases bedient. Ein echter Business-Mehrwert wird aber erst erreicht, wenn jeder Channel seine speziellen Eigenschaften ausspielt, was automatisch eine deutlich größere Flexibilität - auch auf Ebene der Architektur - verlangt. Genau hier setzt die Session an und zeigt, wie eine Architektur aufgebaut sein sollte, die deutlich mehr erlaubt als "nur" Responsive Design.
Die Internationale Suchmaschinenoptimierungavenit AG
Alles rund um das Thema internationale Suchmaschinenoptimierung – darunter die verschiedenen Suchmaschinen und deren Marktanteile, sowie die Themen Keywords, Domainkonzept, GEO-Targeting und Duplicate Content - werden in dieser Präsentation von der avenit AG konkret dargestellt.
OCR – Herausforderungen und Werkzeuge auf dem Weg vom Bild zur Digitalen Editioncneudecker
Numéerisation de masse et traitement des grands corpus de textes utilisant des méthodes des humanitées numéeriques / Massendigitalisierung und die Bearbeitung großer Textkorpora mit Methoden der 'Digital Humanities', 12-13 March 2015, Stuttgart, Germany
There and back again - Responsive Webdesign mit WordPress Michael Oeser
There and back again - Responsive Webdesign (RWD) mit WordPress - Vom Desktop zum Smartphone und wieder zurück
Präsentation anlässlich der Wordpress Konferenz am 05.03.2013 in Zürich
Session von Markus Kaußen zum Thema "Übersetzungsmanagement" - Non-Profit CampNonProfitCamp
“Modernes Übersetzungsmanagement durch Crowdsourcing. Wie Non-Profits von neuen, technischen Möglichkeiten profitieren können.”
Da viele Non-Profit-Organisationen international tätig sind, werden diverse Texte häufig in mehreren Sprachen benötigt. Neben der herkömmlichen Beauftragung von professionellen Übersetzern steht insbesondere bei kleinen oder eingeschränkten Budgets auch Crowdsourcing als Option zur Verfügung.
Sören Krasel, Consultant für e-Learning und Mediengestaltung bei der Daimler AG, spricht auf dem Confluence & JIRA Community Day am 20. September 2012 in Frankfurt/Main zum Thema "Wissensmanagement @MPS".
Mehr Informationen zum CCD 2012 gibt es in unserem Techblog: http://www.communardo.de/home/?s=ccd2012
Immer mehr Abteilungen melden Übersetzungsbedarf an und schicken Dokumente per E-Mail? Content-Systeme wie Supportdatenbanken schwellen an und die manuelle Verteilung der Inhalte nimmt überhand? Neue Prozessschritte, wie das Einbinden von Grafikdesign, lassen das Projektmanagement ausufern?
In dieser Präsentation sehen Sie, welche Kriterien Sie anlegen können, um zu entscheiden, ob die Zeit reif ist, Ihre Übersetzungsprojekte mit Workflowmanagement-Software durchzuführen.
Video zur Präsentation: http://www.youtube.com/watch?v=eXDycRdJh8E&feature=youtu.be
Planung und Gestaltung internationaler Webseitenkernpunkt
Die Implementierung von Unternehmenswebseiten im internationalen Kontext ist nicht einfach. Kulturelle, technische oder sprachliche Unterschiede je nach Land oder sogar Region, verdienen besondere Aufmerksamkeit.
kernpunkt-Geschäftsführer Matthias Steinforth präsentiert wesentliche Besonderheiten bei der Planung und Gestaltung von multinationalen Unternehmenswebseiten vor.
QURATOR: A Flexible AI Platform for the Adaptive Analysis and Creative Genera...Georg Rehm
Georg Rehm. QURATOR: Developing a Flexible AI Platform for Digital Content Curation. QURATOR 2020 – Conference on Digital Curation Technologies., 1 2020. Fraunhofer FOKUS, January 20/21, 2020. Invited keynote talk.
Observations on Annotations – From Computational Linguistics and the World Wi...Georg Rehm
Georg Rehm. Observations on Annotations – From Computational Linguistics and the World Wide Web to Artificial Intelligence and back again. Annotation in Scholarly Editions and Research: Function – Differentiation – Systematization, University of Wuppertal, Germany. February 20-22, 2019. Invited keynote talk.
The Preparation, Impact and Future of the META-NET White Paper Series “Europe...Georg Rehm
Georg Rehm. The Preparation, Impact and Future of the META-NET White Paper Series “Europe’s Languages in the Digital Age”. Sanskrit and Other Indian Languages Technology (SOIL-Tech), Jawaharlal Nehru University, New Delhi, India, February 2019. February 15, 2019. Invited keynote talk.
AI and Conference Interpretation – From Smart Assistants for the Human Interp...Georg Rehm
Georg Rehm. AI and Conference Interpretation - From Smart Assistants for the Human Interpreter to Automatic Solutions. DG Interpretation Lunchtime Session on Digital Transformation. European Commission, Brussels, November 2018. November 12, 2018. Invited talk.
Künstliche Intelligenz beim Dolmetschen und ÜbersetzenGeorg Rehm
Georg Rehm. Künstliche Intelligenz beim Dolmetschen und Übersetzen. Institut für Angewandte Linguistik und Translatologie, Universität Leipzig, November 2018. November 1, 2018. Invited presentation.
Herausforderungen und Lösungen für die europäische Sprachtechnologie- Forschu...Georg Rehm
Georg Rehm. Herausforderungen und Lösungen für die europäische Sprachtechnologie-Forschung und -Entwicklung. Deutsches Forschungszentrum für Künstliche Intelligenz GmbH, Berlin, Germany, October 2018. October 30, 2018. Presentation on the occasion of being awarded the appointment as a DFKI Research Fellow.
European Language Technologies – Past, Present and FutureGeorg Rehm
Georg Rehm. European Language Technologies – Past, Present and Future. Language Equality in the Digital Age. Conference on language technologies and digital equality in a multilingual Europe, European Parliament, Brussels, Belgium, September 2018. September 27, 2018. Invited talk
Towards a Human Language Project for Multilingual Europe: AI and InterpretationGeorg Rehm
Georg Rehm. Towards a Human Language Project for Multilingual Europe: AI and Interpretation. DG Interpretation Conference - Interpretation: Sharing Knowledge & Fostering Communities. European Commission, Brussels, April 2018. April 19/20, 2018. Invited talk.
KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) ÜberblickGeorg Rehm
Georg Rehm. KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) Überblick. Interdisziplinärer Forschungsverbund Digital Humanities in Berlin (ifDHb), 23. Berliner DH-Rundgang im Deutschen Forschungszentrum für Künstliche Intelligenz, Berlin, Germany, February 05, 2018.
Language Technologies for Multilingual Europe - Towards a Human Language Proj...Georg Rehm
META-NET has received funding from the EU for several projects related to language technologies, most recently the CRACKER project. The document outlines the history and development of META-NET's Strategic Research and Innovation Agenda (SRIA), including versions 0.5, 0.9, and the current version 1.0 beta, which endorses the establishment of a Human Language Project to help overcome language barriers in Europe. A recent survey of over 600 language technology experts found strong support for a large-scale Human Language Project to achieve deep natural language understanding by 2030.
AI for Translation Technologies and Multilingual EuropeGeorg Rehm
Georg Rehm. AI for Translation Technologies and Multilingual Europe. DG TRAD Conference - Translation Services in the Digital World: A Sneak Peek into the (near) Future. Luxembourg. October 16/17, 2017.
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen BibliothekenGeorg Rehm
Georg Rehm and Clemens Neudecker. Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken . Berliner Bibliothekswissenschaftliches Kolloqium (BBK), Humboldt-Universität zu Berlin, Berlin, Germany, June 2017. June 06, 2017. Invited talk.
Georg Rehm. EPUB, quo vadis? ePublishing im W3C. Jahrestagung der IG Digital. Im Rahmen der Buchtage, Jahreskongress des Börsenvereins, Berlin, Germany, June 2017. June 14, 2017. Invited talk.
Multilingual Europe in late 2016 – A Strategic Research and Innovation Agenda...Georg Rehm
Georg Rehm. Multilingual Europe in late 2016 – A Strategic Research and Innovation Agenda for the Multilingual Digital Single Market. Future and Emerging Trends in Language Technologies, Machine Learning and Big Data (FETLT 2016), Seville, Spain, November 2016. November 30, 2016.
Georg Rehm. Mehrsprachigkeit für das Digitale Europa. Ringvorlesung Digitale Lebenswelten, University of Hildesheim, Germany, November 2016. November 15, 2016.
Digitale Kuratierungstechnologien für verschiedene Branchen und Anwendungssze...Georg Rehm
Georg Rehm. Digitale Kuratierungstechnologien für verschiedene Branchen und Anwendungsszenarien. EVA Berlin 2016 – Elektronische Medien & Kunst, Kultur, Historie, Berlin, Germany, November 2016. November 09, 2016.
The Strategic Agenda for the Multilingual Digital Single Market V0.9Georg Rehm
Georg Rehm. The Strategic Agenda for the Multilingual Digital Single Market Version 0.9. META-FORUM 2016, Lisbon, Portugal, July 2016. July 04/05, 2016.
The Strategic Agenda for the Multilingual Digital Single Market V0.9
Mehrsprachigkeit und semantische Technologien
1. Mehrsprachigkeit und
semantische Technologien!
Felix Sasaki, Georg Rehm!
DFKI GmbH!
Forschungsbereich Sprachtechnologie, Berlin!
!
Statusmeeting Semantic Media Web – 6. Oktober 2014, Berlin!
!
3. Übersetzung: Ein Riesengeschäft!!
Kommerzielle Übersetzung: ein Markt von
über 20 Milliarden Euro jährlich!!
Bereitstellung von Inhalten in dutzenden
von Sprachen immer öfter unverzichtbar!
Mehrsprachige Technologien – 6. Oktober 2014! 3!
4. Übersetzung: Ein Riesengeschäft!!
Wirtschaftlicher Vorteil;!
Anforderung an öffentliche
Einrichtungen, insbesondere in Europa!
Mehrsprachige Technologien – 6. Oktober 2014! 4!
5. Übersetzung – ein Potential in Europa:
The Digital Single Market!!
• 51% der europäischen
Einzelhändler verkaufen
Waren über das Internet!
• Nur 21% unterstützen
grenzüberschreitende
Transaktionen!
• 30% der Europäer haben
bereits im Internet eingekauft!
• Nur 7% haben einen Einkauf
bei einem Händler aus einem
anderen EU-Mitgliedsstaat
getätigt!
Vgl. „Flash Eurobarometer:!
User language preferences online“!
5!
Mehrsprachige Technologien – 6. Oktober 2014!
6. Die Sprachtechnologie-Community
in Europa: META-NET!
• Exzellenznetzwerk!
• 60 Forschungseinrichtungen
in 34 Ländern!
• Ziel: technologische Basis
für das mehrsprachige
Europa!
Mehrsprachige Technologien – 6. Oktober 2014! 6!
8. Automatische Übersetzung
für Jedermann?!
Online
Übersetzungstool:
Google Translate,
Bing Translate, ...!
Meine
Inhalte!
Alle Sprachen .... ?!
Mehrsprachige Technologien – 6. Oktober 2014! 8!
9. Exkurs: Ansätze für MT!
9!
Regelbasierter Ansatz!
– Nutzt Grammatik,
Lexikon, Überset-zungsregeln
!
– Vorteil: leicht
anpassbar an
neue Bereiche!
– Nachteil: sehr
große Anzahl
handgeschriebener
Regeln nötig!
!
Mehrsprachige Technologien – 6. Oktober 2014!
10. Exkurs: Ansätze für MT!
Statistischer Ansatz!
– Nutzt Trainingsdaten von existierenden
Übersetzungen!
– Vorteil: Neue Zielsprachen sind mit
Trainingsdaten schnell implementiert!
– Nachteil: Anpassung in speziellen Domänen
wegen fehlender Trainingsdaten oft schwierig!
10!
Ich mag meine Katze || I like my cat || 7!
Ich mag meine Katze || I love my cat || 3!
P (“I like my cat” || “Ich mag meine Katze“) = 0.7!
Mehrsprachige Technologien – 6. Oktober 2014!
12. WAS BRAUCHEN KMU UM MT
ERFOLGREICH EINZUSETZEN?!
Mehrsprachige Technologien – 6. Oktober 2014! 12!
13. 1. Eigene Übersetzungssysteme!
• System anpassen via
entsprechender
Trainingsdaten!
– Verfügbarkeit variiert
stark je nach Sprachpaar!
– Vgl. die META-NET
Language White
Paper Serie!
8IJUF 1BQFS 4FSJFT
5)& (&3."/
-"/(6"(& */
5)& %*(*5"-
"(&
8FJ•CVDI4FSJF
%* %654$)
413$) *.
%*(*5-/
;*5-53
MKPTDIB #VSDIBSEU
.BSLVT HH
,BUISJO JDIMFS
#SJHJUUF ,SFOO
+ÚSO ,SFVUFM
OOFUUF -F•NÚMMNBOO
(FPSH 3FIN
.BOGSFE 4UFEF
)BOT 6T[LPSFJU
.BSUJO 7PML
Mehrsprachige Technologien – 6. Oktober 2014! 13!
14. 1. Eigene Übersetzungssysteme!
• System anpassen via entsprechender
Trainingsdaten!
– Anpassung an Domänen!
14!
...
Mehrsprachige Technologien – 6. Oktober 2014!
15. 1. Eigene Übersetzungssysteme!
• System anpassen via entsprechender
Trainingsdaten!
– Eigene Terminologie: (Firmen) spezifische
Übersetzungsrichtlinien!
15!
„Auto car“!
„Auto vehicle“!
„Auto ...“!
Mehrsprachige Technologien – 6. Oktober 2014!
16. 1. Eigene Übersetzungssysteme!
• Leichte Integration in
Digital Content
Management!
– Workflows zwischen
CMS, DMS, Enterprise
CM, Web CMS, ...!
• Schnittstellen!
Mehrsprachige Technologien – 6. Oktober 2014! 16!
17. 2. Qualität!
• Übersetzungsqualität: Was ist das?!
– Beispiel: Text verständlich, Layout kaputt –
Zeitersparnis durch Übersetzungssystem geht
verloren!
• Maße für Maschinen und den Menschen!
– Qualität = Ähnlichkeit der Sätze mit
Beispielübersetzungen!
– Qualität = passend zu den Anforderungen im
jeweiligen Übersetzungsauftrag!
Mehrsprachige Technologien – 6. Oktober 2014! 17!
18. 3. Integration in Workflows!
• Inhaltserstellung!
• Übersetzung!
• Korrektur durch menschliche Übersetzer
(Post-Editing)!
• Qualitätsüberprüfung in mehreren
Zyklen ...!
• Fertigstellung!
Mehrsprachige Technologien – 6. Oktober 2014! 18!
21. Forschungsergebnisse 1: MOSES!
• Open-Source-Übersetzungssystem!
• Übersetzungssysteme im Eigenbau!
– Trainingsdaten!
– Terminologie!
– ... fertig J!
• Achtung: Trainingsdaten sind teuer!!
– Je mehr Qualität, desto mehr Daten nötig!
Mehrsprachige Technologien – 6. Oktober 2014! 21!
22. Forschungsergebnisse 2: MQM!
• Multidimensional Quality Metrics (MQM)!
• Metamodell zur Definition von Metriken,
entwickelt im QTLaunchPad Projekt!
• Modell wird in konkreten Projekten
instanziiert, in Abhängigkeit von den
Anforderungen!
– Beispiel: Layout mehr oder weniger relevant!
Mehrsprachige Technologien – 6. Oktober 2014! 22!
23. Forschungsergebnisse 2: MQM!
• Multidimensional Quality Metrics (MQM)!
• META-Modell zur Definition von Metriken!
• Modell wird in konkreten Projekten
instanziiert, in Abhängigkeit von den
Anforderungen!
– Beispiel: Layout mehr oder weniger relevant!
24. Forschungsergebnisse 3: ITS 2.0!
• Internationalization Tag Set (ITS) 2.0!
• Metadaten („data categories“) für
Übersetzungsworkflows!
• Beispiel: „Translate“!
– Ausgewählte Zeichenketten markieren
als „nicht zu übersetzen“!
• Mehrwert!
– Qualität steigt!
– Zahl von (manuellen) Korrekturen sinkt
Geschwindigkeit wird erhöht!
Mehrsprachige Technologien – 6. Oktober 2014! 24!
25. ITS 2.0 Metadaten und
automatische Qualitätskontrolle!
25!
td class=totrans!
Canyon X and the Land of the Navajo/td!
its:domainRule .../!
its:translateRule .../!
its:storageSizeRule ... storageSize=30/!
target ... its:storageSize=30
its:locQualityIssueComment=Number of bytes in the target
(using UTF-8) is: 32. Number allowed: 30. ... mrk...Canyon X
et la terre des Navajos/mrk...!
Mehrsprachige Technologien – 6. Oktober 2014!
26. Forschungsergebnisse 4:
Integration mit mehrsprachigen
Datenquellen!
• LIDER Projekt:
Mehrsprachigkeit trifft
semantische Technologien!
• Beispielnutzung:!
– Sprachübergreifende Links bei
Wikipedia!
– Generierung von
Übersetzungsvorschlägen für
den menschlichen Übersetzer!
Mehrsprachige Technologien – 6. Oktober 2014! 26!
27. Beispiel: Generierung von
Übersetzungsvorschlägen!
• Eingabe: DBpedia + Wikidata
Abfrageergebnisse und ausgezeichnete
Dokumente!
p… the home of span!
its-ta-ident-ref=http://dbpedia.org/resource/
Samuel_Beckett!
...Samuel Beckett/span./p!
Mehrsprachige Technologien – 6. Oktober 2014! 27!
28. Beispiel: Generierung von
Übersetzungsvorschlägen!
• Ausgabe: Übersetzungsvorschläge
gespeichert als ITS 2.0 „Localization Note“!
p… the home of span!
its-ta-ident-ref=http://dbpedia.org/resource/
Samuel_Beckett its-loc-note=TRANSLATION
SUGGESTIONS: 1) wikidata:サミュエル・ベケット!
2) dbpedia:サミュエル・ベケット“ ...Samuel Beckett/
span./p!
Mehrsprachige Technologien – 6. Oktober 2014! 28!
29. Beispiel: Generierung von
Übersetzungsvorschlägen!
• Ausgabe: Übersetzungsvorschläge
gespeichert als ITS 2.0 „Localization Note“!
p… the home of span!
its-ta-ident-ref=http://dbpedia.org/resource/
Samuel_Beckett its-loc-note=TRANSLATION
SUGGESTIONS: 1) wikidata:サミュエル・ベケット!
2) dbpedia:サミュエル・ベケット“ ...Samuel Beckett/
span./p!
29!
Herausforderung:!
„Zu viel Information ist keine Information!“!
Mehrsprachige Technologien – 6. Oktober 2014!
30. Ziel: Die mehrsprachige Plattform!
• Open-Source-MT für Jedermann!
– MOSES-basiert, leicht nutzbare Schnittstellen,
Trainingsdaten, Terminologie!
• Qualitätsdefinition!
– MQM: MT für jedes Projekt neu, so wie benötigt!
• Workflowintegration!
– ITS 2.0 Metadaten, Verarbeitung standardisierter
Formate!
• Nutzung mehrsprachiger, verlinkter Daten!
– Verlinkung mit der passenden Information – nicht
zu viel!!
Mehrsprachige Technologien – 6. Oktober 2014! 30!
31. ... als Teil der Open Web Platform!!
31!
• Open Source MT!
• Qualitätsdefinition!
• Workflowintegration!
• Nutzung mehrsprachiger,
verlinkter Daten!
Mehrsprachige Technologien – 6. Oktober 2014!
32. Mehrsprachigkeit und
semantische Technologien!
Felix Sasaki, Georg Rehm!
DFKI GmbH!
Forschungsbereich Sprachtechnologie, Berlin!
!
Statusmeeting Semantic Media Web – 6. Oktober 2014, Berlin!
!