SlideShare ist ein Scribd-Unternehmen logo
Interna6onalisierung	
  bei	
  
                                            XML	
  
                                                         Felix	
  Sasaki	
  
                                         DFKI	
  /	
  Fachhochschule	
  Potsdam	
  
                                           W3C	
  deutsch-­‐österr.	
  Büro	
  
                                                  felix.sasaki@dNi.de	
  
                                                   Markupforum	
  2011	
  

Sasaki	
  –	
  Markupforum	
  2011	
  
Über	
  mich	
  
         •  Studium	
  der	
  Japanologie	
  und	
  Linguis6k	
  in	
  Deutschland	
  
            und	
  Japan	
  
         •  Disserta6on	
  im	
  Bereich	
  Computerlinguis6k	
  zu	
  
            Webtechnologien	
  und	
  mehrsprachigen	
  Daten	
  
         •  2005-­‐2009:	
  Arbeit	
  in	
  Japan	
  beim	
  W3C,	
  hauptsächlich	
  in	
  
            der	
  „Interna6onaliza6on	
  Ac6vity“	
  
         •  Seit	
  2009:	
  Professor	
  an	
  der	
  FH	
  Potsdam	
  /	
  Manager	
  des	
  
            W3C	
  deutsch-­‐österr.	
  Büro	
  
         •  Seit	
  Herbst	
  2010:	
  Senior	
  Researcher	
  am	
  DFKI	
  
            (Deutsches	
  Forschungszentrum	
  für	
  Künstliche	
  
            Intelligenz)	
  
Sasaki	
  –	
  Markupforum	
  2011	
                                                              2	
  
Über	
  W3C	
  Büros	
  
         •  Ein	
  Kontaktpunkt	
  wenn	
  man	
  ...	
  
                  –  W3C	
  (noch	
  nicht)	
  gut	
  kennt	
  
                  –  Spezifische	
  Fragen	
  hat	
  wie	
  „Wer	
  arbeitet	
  an	
  
                     Thema	
  ABC	
  ...“	
  
                  –  Neue	
  Themen	
  in	
  Webstandardisierung	
  einbringen	
  
                     will	
  und	
  sich	
  fragt	
  wo	
  sie	
  passen	
  könnten	
  
         •  Biee	
  sprechen	
  Sie	
  uns	
  an	
  –	
  zu	
  obigen	
  Themen,	
  
            und	
  sonst	
  auch	
  J	
  

Sasaki	
  –	
  Markupforum	
  2011	
                                                      3	
  
INTERNATIONALISIERUNG	
  BEI	
  XML	
  
              –	
  EINIGE	
  TRADITIONELLE	
  THEMEN	
  

Sasaki	
  –	
  Markupforum	
  2011	
                       4	
  
Nutzung	
  von	
  Unicode	
  in	
  (XML)-­‐
                                     Technologien	
  




Sasaki	
  –	
  Markupforum	
  2011	
                                    5	
  
Interna6onalisierte	
  Webadressen	
  
         •  Interna6onalized	
  Resource	
  Iden6fier	
  (IRI)	
  
         •  I18N	
  im	
  Pfad	
  einer	
  Webadresse,	
  z.B.:	
  




Sasaki	
  –	
  Markupforum	
  2011	
                                  6	
  
Spracheniden6fika6on	
  via	
  xml:lang	
  
         Sprachtags	
  wie	
  “en”,	
  “en-­‐us”,	
  “de”,	
  “ja”,	
  ...	
  
         Für	
  
         •  content-­‐negota6on	
  




Sasaki	
  –	
  Markupforum	
  2011	
                                             7	
  
Spracheniden6fika6on	
  via	
  xml:lang	
  
         Sprachtags	
  wie	
  “en”,	
  “en-­‐us”,	
  “de”,	
  “ja”,	
  ...	
  
         Für	
  
         •  content-­‐negota6on	
  
         •  Sprachspezifisches	
  Layout	
  
                                             <span	
  xml:lang="zh-­‐CN">[     zh-­‐CN]</span>	
  
                                                <span	
  xml:lang="ja">[	
     ja]</span>	
  
                                                <span	
  xml:lang="ko">[	
     ko]</span>	
  




Sasaki	
  –	
  Markupforum	
  2011	
                                                                 8	
  
NEUE	
  THEMEN	
  I:	
  KULTURSPEZIFISCHES	
  
              LAYOUT	
  AM	
  BEISPIEL	
  „JAPANISCH“	
  

Sasaki	
  –	
  Markupforum	
  2011	
                           9	
  
Japanisch	
  
         •  Geschrieben	
  in	
  vier	
  Schreibsystemen	
  
                  –  Kanji	
  (            )	
  
                            •  Basiert	
  auf	
  chinesischen	
  ideographischen	
  Zeichen	
  
                  –  Hiragana	
  (                       )	
  
                            •  Lautschriu	
  für	
  japanische	
  Wörter	
  
                  –  Katakana	
  (                     )	
  
                            •  Lautschriu	
  für	
  ausländische	
  Wörter	
  
                  –  Romaji	
  (romaji)	
  
                            •  Lateinisches	
  Alphabet	
  

Sasaki	
  –	
  Markupforum	
  2011	
                                                              10	
  
Neue	
  Layout-­‐Konzepte:	
  Beispiel	
  
                                   KIHONHANMEN	
  




Sasaki	
  –	
  Markupforum	
  2011	
                                  11	
  
„Westliches“	
  Seitenlayout	
  	
  
                                                   •  Zunächst	
  Festlegung	
  
                                                      der	
  Seitenränder	
  
                                                   •  Dann	
  Festlegung	
  des	
  
                                                      Druckbereichs	
  




Sasaki	
  –	
  Markupforum	
  2011	
                                                  12	
  
Japanisches	
  Seitenlayout	
  	
  
                                                     •  Zunächst	
  Festlegung	
  
                                                        des	
  KIHONHANMEN	
  
                                                        anhand	
  von	
  
                                                        Zeichengröße,	
  
                                                        Zeichenzahl,	
  
                                                        Spaltenzahl,	
  
                                                        Spaltenabstand	
  
                                                     •  Dann	
  Festlegung	
  der	
  
                                                        Seitenränder	
  
Sasaki	
  –	
  Markupforum	
  2011	
                                                    13	
  
Hintergrund:	
  reguläre	
  Ausmaße	
  
                               japanischer	
  Zeichen	
  
                                                  •  Vgl.	
  Dokument	
  
                                                     „Requirements	
  
                                                     for	
  Japanese	
  
                                                     Text	
  Layout“	
  
                                                  hep://www.w3.org/TR/jlreq/	
  




Sasaki	
  –	
  Markupforum	
  2011	
                                           14	
  
Neue	
  Layout-­‐Bestandteile:	
  Ruby	
  
                                         •  Annota6onen	
  zum	
  
                                            Basistext	
  
                                            –  Aussprache,	
  
                                               Erklärung,	
  ...	
  
                                         •  Darstellung	
  via	
  
                                            sprachspezifischer	
  
                                            Layoutregeln	
  



Sasaki	
  –	
  Markupforum	
  2011	
                                   15	
  
Herausforderung	
  für	
  „Single-­‐source	
  
                            Publishing“	
  
         •  Andere	
  Inhalte	
  in	
  Abhängigkeit	
  von	
  der	
  
            Layoutrichtung	
  
               	
      	
  400cm	
  
               	
      	
      	
        	
   	
  
               	
      	
      	
        	
   	
  
               	
      	
      	
        	
   	
  
               	
      	
      	
        	
   	
  
               	
      	
      	
        	
   	
  
               	
      	
      	
        	
   	
  
Sasaki	
  –	
  Markupforum	
  2011	
                                    16	
  
Zusammenfassung	
  zu	
  
                                         kulturspezifischem	
  Layout	
  
         •  Neue	
  
                  –  Konzepte	
  (vgl.	
  KIHONHANMEN)	
  
                  –  Bestandteile	
  (vgl.	
  Ruby)	
  
                  –  Sichten	
  auf	
  Verfahren	
  (z.B.	
  „Single-­‐source	
  
                     Publishing“)	
  
         =	
  neue	
  Terminologie!	
  
         •  Wo	
  kommt	
  XML?	
  


Sasaki	
  –	
  Markupforum	
  2011	
                                                17	
  
Input	
  und	
  Output:	
  „W3C	
  Japanese	
  
                               Layout	
  Task	
  force“	
  
         •  Teilnehmer:	
  Experten	
  der	
  japanischen	
  
            Druckindustrie	
  +	
  aus	
  allen	
  Layout-­‐relevanten	
  
            Arbeitsgruppen	
  
                  –  CSS	
  
                  –  XSL	
  
                  –  SVG	
  
         •  Ähnliche	
  Gruppen	
  im	
  W3C	
  für	
  Layout	
  im	
  
            Chinesischen	
  und	
  Koreanischen	
  
         •  Einfluss	
  auch	
  auf	
  die	
  Entwicklung	
  von	
  ePub	
  3.0	
  

Sasaki	
  –	
  Markupforum	
  2011	
                                                 18	
  
NEUE	
  THEMEN	
  II:	
  
              MEHRSPRACHIGKEIT	
  

Sasaki	
  –	
  Markupforum	
  2011	
      19	
  
Interna6onalisierung:	
  
         •  Basis	
  (Zeichenkodierung,	
  
            Spracheniden6fika6on)	
  
         •  Erweiterungen	
  hinsichtlich	
  Darstellung	
  
            (interna6onales	
  Layout)	
  
         •  Erweiterungen	
  hinsichtlich	
  
            Informa6onsverarbeitung:	
  Mehrsprachigkeit	
  
            (mit	
  automa6schen	
  Mieeln)	
  
                  –  Automa6sche	
  Übersetzung,	
  Zusammenfassung,	
  
                     Qualitätskontrolle,	
  ...	
  

Sasaki	
  –	
  Markupforum	
  2011	
                                       20	
  
Was	
  man	
  für	
  Mehrsprachigkeit	
  im	
  Web	
  
                               braucht	
  
•  Input	
  von	
  www.postbank.de	
  
          „Ob	
  Postbank	
  direkt,	
  Online-­‐Banking,	
  
            Online-­‐Brokerage	
  oder	
  myBHW.	
  Die	
  
            häufigsten	
  Fragen	
  zu	
  unseren	
  
            Transak6onssystemen	
  finden	
  Sie	
  an	
  
            dieser	
  Stelle.“	
  	
  
•  Ausgabe	
  via	
  Google	
  translate	
  
          “Whether	
  Postbank	
  direct,	
  online	
  
           banking,	
  online	
  brokerage	
  or	
  myBHW.	
  
           Frequently	
  asked	
  ques6ons	
  about	
  our	
  
           transac6on	
  systems	
  can	
  be	
  found	
  at	
  
           this	
  loca6on.”	
  


Sasaki	
  –	
  Markupforum	
  2011	
                               21	
  
Lücke	
  1:	
  Maschinen	
  nutzen	
  keine	
  
                         Metadaten	
  in	
  der	
  Eingabe	
  
•  Input	
  von	
  www.postbank.de	
                        Feste	
  Terminology	
  
    „Ob	
  Postbank	
  direkt,	
  Online-­‐Banking,	
       Sollte	
  nicht	
  
      Online-­‐Brokerage	
  oder	
  myBHW.	
  Die	
   übersetzt	
  werden.	
  
      häufigsten	
  Fragen	
  zu	
  unseren	
  
      Transak6onssystemen	
  finden	
  Sie	
  an	
   Wenn	
  ein	
  Autor	
  
      dieser	
  Stelle.“	
  	
                              diese	
  Informa6on	
  
•  Ausgabe	
  via	
  Google	
  translate	
                  markiert	
  häee,	
  
    “Whether	
  Postbank	
  direct,	
  online	
             wäre	
  das	
  
      banking,	
  online	
  brokerage	
  or	
  myBHW.	
   automa6sche	
  Tool	
  
      Frequently	
  asked	
  ques6ons	
  about	
  our	
  
      transac6on	
  systems	
  can	
  be	
  found	
  at	
   besser	
  
                this	
  loca6on.”	
  


Sasaki	
  –	
  Markupforum	
  2011	
                                              22	
  
Lücke	
  2:	
  Maschinen	
  kennen	
  keine	
  
                       Prozesse	
  zur	
  Datenerzeugung	
  
•  Input	
  aus	
  einer	
  Datenbank	
  –	
  dem	
  
                                                            Feste	
  Terminologie	
  
   „hidden	
  web“:	
  
                                                            (=	
  Metadaten)	
  …	
  
          „Ob	
  <term>Postbank	
  direkt</term>,	
  
            <term>Online-­‐Banking</term>,	
  
            <term>Online-­‐Brokerage</term>	
  …“	
  	
             Publika6ons-­‐	
  
                                                                      prozess	
  

•  Ausgabe	
  im	
  Web:	
  
          „Ob	
  <em>Postbank	
  direkt</em>,	
             	
  …	
  wird	
  verloren	
  im	
  
            <em>Online-­‐Banking</em>,	
  
            <em>Online-­‐Brokerage</em>	
  …“	
  	
         Web	
  L	
  

Sasaki	
  –	
  Markupforum	
  2011	
                                                        23	
  
Lücke	
  3:	
  keine	
  eindeu6ge	
  
                                                Iden6fika6on	
  
         •  Von	
  Metadaten	
  und	
  Verarbeitungsprozessen	
  
            (vorherige	
  Folien)	
  
         •  Von	
  Ressourcen	
  –	
  was	
  ist	
  z.B.	
  ein	
  Lexikon	
  
                  –  In	
  maschineller	
  Übersetzung?	
  
                  –  In	
  Lokalisierung?	
  
                  –  Für	
  den	
  menschlichen	
  Leser?	
  
                  –  ...	
  
         •  Wiederverwendung	
  und	
  Kombina6on	
  von	
  
            Ressourcen	
  wird	
  behindert	
  

Sasaki	
  –	
  Markupforum	
  2011	
                                             24	
  
Wer	
  kann	
  diese	
  Lücken	
  füllen?	
  
         •  Autoren(systeme)	
  
                  –  Nutzung	
  von	
  Terminologie	
  /	
  Markierung	
  von	
  
                     Übersetzbarkeit	
  z.B.	
  in	
  CMS	
  
         •  Lokalisierer	
  
                  –  Lokalisierungsworkflows	
  sensibel	
  für	
  Metadaten	
  
                     (Quelltext-­‐	
  und	
  Prozess-­‐bezogen)	
  machen	
  
         •  „Sprachtechnologie”	
  Experten	
  
                  –  Tools	
  sensibel	
  machen	
  für	
  Metadaten	
  im	
  Quelltext	
  
                     und	
  im	
  Prozess	
  
                  –  Ressourcen	
  und	
  Workflows	
  klar	
  beschreiben	
  

Sasaki	
  –	
  Markupforum	
  2011	
                                                          25	
  
Wie	
  können	
  die	
  Lücken	
  gefüllt	
  
                                         werden?	
  
         •  Metadaten	
  standardisieren	
  
         •  Metadatennutzung	
  propagieren	
  bei	
  
                  –  Erzeugern	
  von	
  Inhalten	
  
                  –  Verschiedenen	
  Gliedern	
  der	
  Verarbeitungskeee	
  
         •  Anwendungsszenarien	
  Community-­‐
            übergreifend	
  definieren	
  



Sasaki	
  –	
  Markupforum	
  2011	
                                             26	
  
ZUM	
  SCHLUSS:	
  
              PROJEKTHINTERGRUND	
  

Sasaki	
  –	
  Markupforum	
  2011	
     27	
  
EU-­‐Projekt	
  „Mul6lingual	
  Web“	
  




                            Vgl.	
  hep://www.mul6lingualweb.eu/	
  	
  
Sasaki	
  –	
  Markupforum	
  2011	
                                       28	
  
Hintergrund	
  
         •  Teilnehmer	
  aus	
  Industrie	
  und	
  Akademia	
  (z.B.	
  
            Computerlinguis6k)	
  
         •  Ziel:	
  Lücken	
  zwischen	
  Industrien,	
  Nutzern	
  und	
  Forschern	
  
            schließen	
  
         •  Outreach	
  zu	
  neuen	
  Entwicklungen	
  (z.B.	
  hinsichtlich	
  
            interna6onalisiertem	
  Layout)	
  –	
  wie	
  in	
  dieser	
  Präsenta6on	
  
            J	
  
         •  Mehr	
  gegenwär6ges	
  Verständnis	
  für	
  Bedürfnisse	
  von	
  
            Nutzern	
  und	
  Möglichkeiten	
  (automa6scher)	
  Verarbeitung)	
  
         •  Toolentwicklung	
  
                  –  Beispiel	
  “I18n	
  checker”	
  hep://rishida.net/tools/i18nchecker/	
  	
  



Sasaki	
  –	
  Markupforum	
  2011	
                                                                 29	
  
Teilnehmer	
  
         •      ERCIM/W3C:	
  coordina6on	
                   •  SAP	
  
         •      CNR-­‐ILC	
                                   •  The	
  Transla6on	
  Automa6on	
  User	
  
         •      Facebook	
  Ireland	
                            Society	
  (TAUS)	
  
         •      The	
  University	
  of	
  Applied	
          •  Teknillinen	
  Korkeakoulu	
  
                Sciences	
  (UAS)	
  Potsdam	
                •  University	
  of	
  Oviedo	
  (ILTO)	
  
         •      Ins6tut	
  Josef	
  Stefan	
  (JSI)	
         •  Universidad	
  Politécnica	
  de	
  
         •      Ins6tutul	
  de	
  Cercetari	
  Pentru	
         Madrid	
  (UPM)	
  
                Intelegen6a	
  Ar6cificiala	
  (RACAI)	
       •  The	
  Language	
  Resource	
  Centre	
  
         •      The	
  Language	
  Technology	
  Centre	
     •  University	
  of	
  Economics,	
  Prague	
  
         •      Lionbridge	
  Belgium	
                       •  Transware	
  Ltd	
  (WeLocalize)	
  
         •      Microsou	
  Ireland	
                         •  XML-­‐INTL	
  
         •      Opera	
  Souware	
  


Sasaki	
  –	
  Markupforum	
  2011	
                                                                            30	
  
Workshops	
  zum	
  Community-­‐Bildung	
  
         •  Erster	
  Workshop	
  26.-­‐27.	
  Oktober	
  2010,	
  
            Madrid:	
  „The	
  Mul6lingual	
  Web	
  –	
  Where	
  Are	
  
            We?“	
  
         •  Zweiter	
  Workshop	
  4.-­‐5.	
  April	
  2011,	
  Pisa:	
  
            „Content	
  On	
  The	
  Mul6lingual	
  Web“	
  




Sasaki	
  –	
  Markupforum	
  2011	
                                         31	
  
EU-­‐Projekt	
  „META-­‐NET“	
  
         •  Enge	
  Verbindung	
  zu	
  „Mul6lingual	
  Web“	
  
         •  Hauptziel:	
  Langfris6ge	
  Allianz	
  für	
  
            Sprachtechnologie	
  in	
  Europa	
  bauen	
  
         •  Umfasst	
  mehr	
  als	
  40	
  teilnehmende	
  
            Organisa6onen	
  aus	
  30+	
  Ländern	
  
         •  Wich6g:	
  Nutzer	
  von	
  Sprachtechnologie	
  
            involvieren	
  


Sasaki	
  –	
  Markupforum	
  2011	
                                    32	
  
META-­‐NET	
  
         •  Nutzer	
  und	
  Sprachtechnologiefirmen	
  =	
  in	
  
            Europa	
  ou	
  KMUs	
  
         •  Ziel	
  von	
  META-­‐NET	
  sind	
  schnelle	
  und	
  flexible	
  
            Einheiten	
  –	
  wie	
  Sie	
  J	
  
         •  Die	
  EU	
  hat	
  entsprechende	
  Förderprogramme	
  
            veröffentlicht	
  -­‐	
  vgl.	
  
            hep://6nyurl.com/eu-­‐lt-­‐sme	
  	
  	
  („objec6ve	
  4.1“)	
  	
  


Sasaki	
  –	
  Markupforum	
  2011	
                                                33	
  
META-­‐NET	
  
         •  Event:	
  META-­‐FORUM	
  2011	
  
         •  Budapest,	
  27.-­‐29.	
  Juni	
  2011	
  
         •  Ziel:	
  Nutzer	
  /	
  Sprachtechnologieentwickler	
  /	
  
            „Entscheider“	
  zusammenbringen	
  
         •  Ziele	
  für	
  die	
  Sprachtechnologie	
  in	
  den	
  
            nächsten	
  10	
  Jahren	
  disku6eren	
  
         •  Details	
  und	
  bald	
  Registrierung	
  unter	
  
         hep://www.meta-­‐net.eu/events	
  	
  
Sasaki	
  –	
  Markupforum	
  2011	
                                       34	
  
Thank	
  you	
  for	
  your	
  aeen6on!	
  
                            Vielen	
  Dank	
  für	
  Ihre	
  
                                Aufmerksamkeit	
  
                                                              	
  


Sasaki	
  –	
  Markupforum	
  2011	
                                  35	
  

Weitere ähnliche Inhalte

Andere mochten auch

Conferencia Nuevo Codigo Penal Militar
Conferencia Nuevo Codigo Penal MilitarConferencia Nuevo Codigo Penal Militar
Conferencia Nuevo Codigo Penal Militar
osalarah
 
Deshidratacion+En+Pediatra.Icasa.
Deshidratacion+En+Pediatra.Icasa.Deshidratacion+En+Pediatra.Icasa.
Deshidratacion+En+Pediatra.Icasa.
pediatria
 
Introducción a la inmunologia
Introducción a la inmunologiaIntroducción a la inmunologia
Introducción a la inmunologia
CasiMedi.com
 
Ud 5 la herencia biologica
Ud 5 la herencia biologicaUd 5 la herencia biologica
Ud 5 la herencia biologica
juliomsanjuan
 
FunçãO Do 1º E 2º Grau Autor Antonio Carlos Carneiro Barroso
FunçãO Do 1º  E 2º Grau Autor Antonio Carlos Carneiro BarrosoFunçãO Do 1º  E 2º Grau Autor Antonio Carlos Carneiro Barroso
FunçãO Do 1º E 2º Grau Autor Antonio Carlos Carneiro Barroso
Antonio Carneiro
 
Recubrimiento pulpar pulpotomia-apicoformación
Recubrimiento pulpar  pulpotomia-apicoformaciónRecubrimiento pulpar  pulpotomia-apicoformación
Recubrimiento pulpar pulpotomia-apicoformación
carmenpvis
 
Kp 1.1.3.1 (etik kedokteran)
Kp 1.1.3.1 (etik kedokteran)Kp 1.1.3.1 (etik kedokteran)
Kp 1.1.3.1 (etik kedokteran)
Carlo Prawira
 

Andere mochten auch (18)

Conferencia Nuevo Codigo Penal Militar
Conferencia Nuevo Codigo Penal MilitarConferencia Nuevo Codigo Penal Militar
Conferencia Nuevo Codigo Penal Militar
 
Marcapasos
MarcapasosMarcapasos
Marcapasos
 
Ligações Químicas - 1º ano
Ligações Químicas - 1º anoLigações Químicas - 1º ano
Ligações Químicas - 1º ano
 
LA CASA ROMANA
LA CASA ROMANALA CASA ROMANA
LA CASA ROMANA
 
Deshidratacion+En+Pediatra.Icasa.
Deshidratacion+En+Pediatra.Icasa.Deshidratacion+En+Pediatra.Icasa.
Deshidratacion+En+Pediatra.Icasa.
 
Introducción a la inmunologia
Introducción a la inmunologiaIntroducción a la inmunologia
Introducción a la inmunologia
 
Messe als Instrument der Unternehmenskommunikation
Messe als Instrument der UnternehmenskommunikationMesse als Instrument der Unternehmenskommunikation
Messe als Instrument der Unternehmenskommunikation
 
Navidad En Mexico
Navidad En MexicoNavidad En Mexico
Navidad En Mexico
 
Ud 5 la herencia biologica
Ud 5 la herencia biologicaUd 5 la herencia biologica
Ud 5 la herencia biologica
 
VisãO Geral da Filosofia
VisãO Geral da FilosofiaVisãO Geral da Filosofia
VisãO Geral da Filosofia
 
Ferramentas de Gerência de Projetos
Ferramentas de Gerência de ProjetosFerramentas de Gerência de Projetos
Ferramentas de Gerência de Projetos
 
FunçãO Do 1º E 2º Grau Autor Antonio Carlos Carneiro Barroso
FunçãO Do 1º  E 2º Grau Autor Antonio Carlos Carneiro BarrosoFunçãO Do 1º  E 2º Grau Autor Antonio Carlos Carneiro Barroso
FunçãO Do 1º E 2º Grau Autor Antonio Carlos Carneiro Barroso
 
Recubrimiento pulpar pulpotomia-apicoformación
Recubrimiento pulpar  pulpotomia-apicoformaciónRecubrimiento pulpar  pulpotomia-apicoformación
Recubrimiento pulpar pulpotomia-apicoformación
 
Twittern – wie und wozu?
Twittern – wie und wozu?Twittern – wie und wozu?
Twittern – wie und wozu?
 
Kp 1.1.3.1 (etik kedokteran)
Kp 1.1.3.1 (etik kedokteran)Kp 1.1.3.1 (etik kedokteran)
Kp 1.1.3.1 (etik kedokteran)
 
Timeline e historia do design
Timeline e historia do designTimeline e historia do design
Timeline e historia do design
 
AULA DE TRIGONOMETRIA
AULA DE TRIGONOMETRIAAULA DE TRIGONOMETRIA
AULA DE TRIGONOMETRIA
 
Técnicas para o Desenvolvimento de Cronogramas
Técnicas para o Desenvolvimento de CronogramasTécnicas para o Desenvolvimento de Cronogramas
Técnicas para o Desenvolvimento de Cronogramas
 

Mehr von Felix Sasaki

Freme at feisgiltt 2015 freme use cases
Freme at feisgiltt 2015   freme use casesFreme at feisgiltt 2015   freme use cases
Freme at feisgiltt 2015 freme use cases
Felix Sasaki
 
Sasaki ins-netz-gegangen-20111117
Sasaki ins-netz-gegangen-20111117Sasaki ins-netz-gegangen-20111117
Sasaki ins-netz-gegangen-20111117
Felix Sasaki
 
"Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation
"Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation"Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation
"Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation
Felix Sasaki
 
Sasaki webtechcon2010
Sasaki webtechcon2010Sasaki webtechcon2010
Sasaki webtechcon2010
Felix Sasaki
 
Mlw sasaki-20101027
Mlw sasaki-20101027Mlw sasaki-20101027
Mlw sasaki-20101027
Felix Sasaki
 

Mehr von Felix Sasaki (15)

Thb tag-des-offenen-fensters-2021-sasaki-graphdatenbanken
Thb tag-des-offenen-fensters-2021-sasaki-graphdatenbankenThb tag-des-offenen-fensters-2021-sasaki-graphdatenbanken
Thb tag-des-offenen-fensters-2021-sasaki-graphdatenbanken
 
XML Seminar
XML SeminarXML Seminar
XML Seminar
 
Sasaki Presentation at EVA 2016
Sasaki Presentation at EVA 2016Sasaki Presentation at EVA 2016
Sasaki Presentation at EVA 2016
 
Linked data-tooling-xml
Linked data-tooling-xmlLinked data-tooling-xml
Linked data-tooling-xml
 
Sasaki datathon-madrid-2015
Sasaki datathon-madrid-2015Sasaki datathon-madrid-2015
Sasaki datathon-madrid-2015
 
Freme at feisgiltt 2015 freme & linked data & localisers
Freme at feisgiltt 2015   freme & linked data & localisersFreme at feisgiltt 2015   freme & linked data & localisers
Freme at feisgiltt 2015 freme & linked data & localisers
 
Freme at feisgiltt 2015 freme use cases
Freme at feisgiltt 2015   freme use casesFreme at feisgiltt 2015   freme use cases
Freme at feisgiltt 2015 freme use cases
 
Sasaki practical-linked-data
Sasaki practical-linked-dataSasaki practical-linked-data
Sasaki practical-linked-data
 
1114 sasaki-metadata
1114 sasaki-metadata1114 sasaki-metadata
1114 sasaki-metadata
 
Its2 ontology-localization
Its2 ontology-localizationIts2 ontology-localization
Its2 ontology-localization
 
Sasaki ins-netz-gegangen-20111117
Sasaki ins-netz-gegangen-20111117Sasaki ins-netz-gegangen-20111117
Sasaki ins-netz-gegangen-20111117
 
"Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation
"Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation"Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation
"Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation
 
Sasaki webtechcon2010
Sasaki webtechcon2010Sasaki webtechcon2010
Sasaki webtechcon2010
 
Mlw sasaki-20101027
Mlw sasaki-20101027Mlw sasaki-20101027
Mlw sasaki-20101027
 
HTML5 - presentation at W3C-Tag 2009
HTML5 - presentation at W3C-Tag 2009HTML5 - presentation at W3C-Tag 2009
HTML5 - presentation at W3C-Tag 2009
 

Sasaki markupforum2011

  • 1. Interna6onalisierung  bei   XML   Felix  Sasaki   DFKI  /  Fachhochschule  Potsdam   W3C  deutsch-­‐österr.  Büro   felix.sasaki@dNi.de   Markupforum  2011   Sasaki  –  Markupforum  2011  
  • 2. Über  mich   •  Studium  der  Japanologie  und  Linguis6k  in  Deutschland   und  Japan   •  Disserta6on  im  Bereich  Computerlinguis6k  zu   Webtechnologien  und  mehrsprachigen  Daten   •  2005-­‐2009:  Arbeit  in  Japan  beim  W3C,  hauptsächlich  in   der  „Interna6onaliza6on  Ac6vity“   •  Seit  2009:  Professor  an  der  FH  Potsdam  /  Manager  des   W3C  deutsch-­‐österr.  Büro   •  Seit  Herbst  2010:  Senior  Researcher  am  DFKI   (Deutsches  Forschungszentrum  für  Künstliche   Intelligenz)   Sasaki  –  Markupforum  2011   2  
  • 3. Über  W3C  Büros   •  Ein  Kontaktpunkt  wenn  man  ...   –  W3C  (noch  nicht)  gut  kennt   –  Spezifische  Fragen  hat  wie  „Wer  arbeitet  an   Thema  ABC  ...“   –  Neue  Themen  in  Webstandardisierung  einbringen   will  und  sich  fragt  wo  sie  passen  könnten   •  Biee  sprechen  Sie  uns  an  –  zu  obigen  Themen,   und  sonst  auch  J   Sasaki  –  Markupforum  2011   3  
  • 4. INTERNATIONALISIERUNG  BEI  XML   –  EINIGE  TRADITIONELLE  THEMEN   Sasaki  –  Markupforum  2011   4  
  • 5. Nutzung  von  Unicode  in  (XML)-­‐ Technologien   Sasaki  –  Markupforum  2011   5  
  • 6. Interna6onalisierte  Webadressen   •  Interna6onalized  Resource  Iden6fier  (IRI)   •  I18N  im  Pfad  einer  Webadresse,  z.B.:   Sasaki  –  Markupforum  2011   6  
  • 7. Spracheniden6fika6on  via  xml:lang   Sprachtags  wie  “en”,  “en-­‐us”,  “de”,  “ja”,  ...   Für   •  content-­‐negota6on   Sasaki  –  Markupforum  2011   7  
  • 8. Spracheniden6fika6on  via  xml:lang   Sprachtags  wie  “en”,  “en-­‐us”,  “de”,  “ja”,  ...   Für   •  content-­‐negota6on   •  Sprachspezifisches  Layout   <span  xml:lang="zh-­‐CN">[ zh-­‐CN]</span>   <span  xml:lang="ja">[   ja]</span>   <span  xml:lang="ko">[   ko]</span>   Sasaki  –  Markupforum  2011   8  
  • 9. NEUE  THEMEN  I:  KULTURSPEZIFISCHES   LAYOUT  AM  BEISPIEL  „JAPANISCH“   Sasaki  –  Markupforum  2011   9  
  • 10. Japanisch   •  Geschrieben  in  vier  Schreibsystemen   –  Kanji  ( )   •  Basiert  auf  chinesischen  ideographischen  Zeichen   –  Hiragana  ( )   •  Lautschriu  für  japanische  Wörter   –  Katakana  ( )   •  Lautschriu  für  ausländische  Wörter   –  Romaji  (romaji)   •  Lateinisches  Alphabet   Sasaki  –  Markupforum  2011   10  
  • 11. Neue  Layout-­‐Konzepte:  Beispiel   KIHONHANMEN   Sasaki  –  Markupforum  2011   11  
  • 12. „Westliches“  Seitenlayout     •  Zunächst  Festlegung   der  Seitenränder   •  Dann  Festlegung  des   Druckbereichs   Sasaki  –  Markupforum  2011   12  
  • 13. Japanisches  Seitenlayout     •  Zunächst  Festlegung   des  KIHONHANMEN   anhand  von   Zeichengröße,   Zeichenzahl,   Spaltenzahl,   Spaltenabstand   •  Dann  Festlegung  der   Seitenränder   Sasaki  –  Markupforum  2011   13  
  • 14. Hintergrund:  reguläre  Ausmaße   japanischer  Zeichen   •  Vgl.  Dokument   „Requirements   for  Japanese   Text  Layout“   hep://www.w3.org/TR/jlreq/   Sasaki  –  Markupforum  2011   14  
  • 15. Neue  Layout-­‐Bestandteile:  Ruby   •  Annota6onen  zum   Basistext   –  Aussprache,   Erklärung,  ...   •  Darstellung  via   sprachspezifischer   Layoutregeln   Sasaki  –  Markupforum  2011   15  
  • 16. Herausforderung  für  „Single-­‐source   Publishing“   •  Andere  Inhalte  in  Abhängigkeit  von  der   Layoutrichtung      400cm                                                               Sasaki  –  Markupforum  2011   16  
  • 17. Zusammenfassung  zu   kulturspezifischem  Layout   •  Neue   –  Konzepte  (vgl.  KIHONHANMEN)   –  Bestandteile  (vgl.  Ruby)   –  Sichten  auf  Verfahren  (z.B.  „Single-­‐source   Publishing“)   =  neue  Terminologie!   •  Wo  kommt  XML?   Sasaki  –  Markupforum  2011   17  
  • 18. Input  und  Output:  „W3C  Japanese   Layout  Task  force“   •  Teilnehmer:  Experten  der  japanischen   Druckindustrie  +  aus  allen  Layout-­‐relevanten   Arbeitsgruppen   –  CSS   –  XSL   –  SVG   •  Ähnliche  Gruppen  im  W3C  für  Layout  im   Chinesischen  und  Koreanischen   •  Einfluss  auch  auf  die  Entwicklung  von  ePub  3.0   Sasaki  –  Markupforum  2011   18  
  • 19. NEUE  THEMEN  II:   MEHRSPRACHIGKEIT   Sasaki  –  Markupforum  2011   19  
  • 20. Interna6onalisierung:   •  Basis  (Zeichenkodierung,   Spracheniden6fika6on)   •  Erweiterungen  hinsichtlich  Darstellung   (interna6onales  Layout)   •  Erweiterungen  hinsichtlich   Informa6onsverarbeitung:  Mehrsprachigkeit   (mit  automa6schen  Mieeln)   –  Automa6sche  Übersetzung,  Zusammenfassung,   Qualitätskontrolle,  ...   Sasaki  –  Markupforum  2011   20  
  • 21. Was  man  für  Mehrsprachigkeit  im  Web   braucht   •  Input  von  www.postbank.de   „Ob  Postbank  direkt,  Online-­‐Banking,   Online-­‐Brokerage  oder  myBHW.  Die   häufigsten  Fragen  zu  unseren   Transak6onssystemen  finden  Sie  an   dieser  Stelle.“     •  Ausgabe  via  Google  translate   “Whether  Postbank  direct,  online   banking,  online  brokerage  or  myBHW.   Frequently  asked  ques6ons  about  our   transac6on  systems  can  be  found  at   this  loca6on.”   Sasaki  –  Markupforum  2011   21  
  • 22. Lücke  1:  Maschinen  nutzen  keine   Metadaten  in  der  Eingabe   •  Input  von  www.postbank.de   Feste  Terminology   „Ob  Postbank  direkt,  Online-­‐Banking,   Sollte  nicht   Online-­‐Brokerage  oder  myBHW.  Die   übersetzt  werden.   häufigsten  Fragen  zu  unseren   Transak6onssystemen  finden  Sie  an   Wenn  ein  Autor   dieser  Stelle.“     diese  Informa6on   •  Ausgabe  via  Google  translate   markiert  häee,   “Whether  Postbank  direct,  online   wäre  das   banking,  online  brokerage  or  myBHW.   automa6sche  Tool   Frequently  asked  ques6ons  about  our   transac6on  systems  can  be  found  at   besser   this  loca6on.”   Sasaki  –  Markupforum  2011   22  
  • 23. Lücke  2:  Maschinen  kennen  keine   Prozesse  zur  Datenerzeugung   •  Input  aus  einer  Datenbank  –  dem   Feste  Terminologie   „hidden  web“:   (=  Metadaten)  …   „Ob  <term>Postbank  direkt</term>,   <term>Online-­‐Banking</term>,   <term>Online-­‐Brokerage</term>  …“     Publika6ons-­‐   prozess   •  Ausgabe  im  Web:   „Ob  <em>Postbank  direkt</em>,    …  wird  verloren  im   <em>Online-­‐Banking</em>,   <em>Online-­‐Brokerage</em>  …“     Web  L   Sasaki  –  Markupforum  2011   23  
  • 24. Lücke  3:  keine  eindeu6ge   Iden6fika6on   •  Von  Metadaten  und  Verarbeitungsprozessen   (vorherige  Folien)   •  Von  Ressourcen  –  was  ist  z.B.  ein  Lexikon   –  In  maschineller  Übersetzung?   –  In  Lokalisierung?   –  Für  den  menschlichen  Leser?   –  ...   •  Wiederverwendung  und  Kombina6on  von   Ressourcen  wird  behindert   Sasaki  –  Markupforum  2011   24  
  • 25. Wer  kann  diese  Lücken  füllen?   •  Autoren(systeme)   –  Nutzung  von  Terminologie  /  Markierung  von   Übersetzbarkeit  z.B.  in  CMS   •  Lokalisierer   –  Lokalisierungsworkflows  sensibel  für  Metadaten   (Quelltext-­‐  und  Prozess-­‐bezogen)  machen   •  „Sprachtechnologie”  Experten   –  Tools  sensibel  machen  für  Metadaten  im  Quelltext   und  im  Prozess   –  Ressourcen  und  Workflows  klar  beschreiben   Sasaki  –  Markupforum  2011   25  
  • 26. Wie  können  die  Lücken  gefüllt   werden?   •  Metadaten  standardisieren   •  Metadatennutzung  propagieren  bei   –  Erzeugern  von  Inhalten   –  Verschiedenen  Gliedern  der  Verarbeitungskeee   •  Anwendungsszenarien  Community-­‐ übergreifend  definieren   Sasaki  –  Markupforum  2011   26  
  • 27. ZUM  SCHLUSS:   PROJEKTHINTERGRUND   Sasaki  –  Markupforum  2011   27  
  • 28. EU-­‐Projekt  „Mul6lingual  Web“   Vgl.  hep://www.mul6lingualweb.eu/     Sasaki  –  Markupforum  2011   28  
  • 29. Hintergrund   •  Teilnehmer  aus  Industrie  und  Akademia  (z.B.   Computerlinguis6k)   •  Ziel:  Lücken  zwischen  Industrien,  Nutzern  und  Forschern   schließen   •  Outreach  zu  neuen  Entwicklungen  (z.B.  hinsichtlich   interna6onalisiertem  Layout)  –  wie  in  dieser  Präsenta6on   J   •  Mehr  gegenwär6ges  Verständnis  für  Bedürfnisse  von   Nutzern  und  Möglichkeiten  (automa6scher)  Verarbeitung)   •  Toolentwicklung   –  Beispiel  “I18n  checker”  hep://rishida.net/tools/i18nchecker/     Sasaki  –  Markupforum  2011   29  
  • 30. Teilnehmer   •  ERCIM/W3C:  coordina6on   •  SAP   •  CNR-­‐ILC   •  The  Transla6on  Automa6on  User   •  Facebook  Ireland   Society  (TAUS)   •  The  University  of  Applied   •  Teknillinen  Korkeakoulu   Sciences  (UAS)  Potsdam   •  University  of  Oviedo  (ILTO)   •  Ins6tut  Josef  Stefan  (JSI)   •  Universidad  Politécnica  de   •  Ins6tutul  de  Cercetari  Pentru   Madrid  (UPM)   Intelegen6a  Ar6cificiala  (RACAI)   •  The  Language  Resource  Centre   •  The  Language  Technology  Centre   •  University  of  Economics,  Prague   •  Lionbridge  Belgium   •  Transware  Ltd  (WeLocalize)   •  Microsou  Ireland   •  XML-­‐INTL   •  Opera  Souware   Sasaki  –  Markupforum  2011   30  
  • 31. Workshops  zum  Community-­‐Bildung   •  Erster  Workshop  26.-­‐27.  Oktober  2010,   Madrid:  „The  Mul6lingual  Web  –  Where  Are   We?“   •  Zweiter  Workshop  4.-­‐5.  April  2011,  Pisa:   „Content  On  The  Mul6lingual  Web“   Sasaki  –  Markupforum  2011   31  
  • 32. EU-­‐Projekt  „META-­‐NET“   •  Enge  Verbindung  zu  „Mul6lingual  Web“   •  Hauptziel:  Langfris6ge  Allianz  für   Sprachtechnologie  in  Europa  bauen   •  Umfasst  mehr  als  40  teilnehmende   Organisa6onen  aus  30+  Ländern   •  Wich6g:  Nutzer  von  Sprachtechnologie   involvieren   Sasaki  –  Markupforum  2011   32  
  • 33. META-­‐NET   •  Nutzer  und  Sprachtechnologiefirmen  =  in   Europa  ou  KMUs   •  Ziel  von  META-­‐NET  sind  schnelle  und  flexible   Einheiten  –  wie  Sie  J   •  Die  EU  hat  entsprechende  Förderprogramme   veröffentlicht  -­‐  vgl.   hep://6nyurl.com/eu-­‐lt-­‐sme      („objec6ve  4.1“)     Sasaki  –  Markupforum  2011   33  
  • 34. META-­‐NET   •  Event:  META-­‐FORUM  2011   •  Budapest,  27.-­‐29.  Juni  2011   •  Ziel:  Nutzer  /  Sprachtechnologieentwickler  /   „Entscheider“  zusammenbringen   •  Ziele  für  die  Sprachtechnologie  in  den   nächsten  10  Jahren  disku6eren   •  Details  und  bald  Registrierung  unter   hep://www.meta-­‐net.eu/events     Sasaki  –  Markupforum  2011   34  
  • 35. Thank  you  for  your  aeen6on!   Vielen  Dank  für  Ihre   Aufmerksamkeit     Sasaki  –  Markupforum  2011   35