»
Stefan Göbel
Word und XML
»
Stefan Göbel Content Labs GmbH
» Was beschäftigt uns bei „Word und XML“?
» leichte Konvertierung
» Voraussetzungen
» Was tun, wenn…
» Aufbau einer Word-Datei
» Text, Tabellen, Bilder, Links, Indexeinträge, Listen
» Word nach XML
» XML nach Word
» Anregungen
» Ihre Fragen
Heute abend
»
Stefan Göbel Content Labs GmbH
Leichte
Konver-
tierung
»
Stefan Göbel Content Labs GmbH
» Einheitlich und eindeutig formatierte Daten
» Formatierungen/Styles auf Zielstruktur abgestimmt
» Wege zu guten Daten
» kurze Erfassungsrichtlinien für Autoren zusammenstellen
» möglichst einfache Dokumentvorlage
» Makros unterstützen Autor beim Erfassen komplexerer Textteile
(z.B. Referenzen)
» Prüfungen, möglichst vor der Konvertierung
» Prüfmakro mit Rückmeldung möglicher Fehler
» Ablauf der Konvertierung zeigen: „So schnell ist Ihr Werk
veröffentlich, wenn Sie die Erfassungsrichtlinien beachten!“
Leichte Konvertierung: Voraussetzungen
»
Stefan Göbel Content Labs GmbH
» Gibt es andere Muster, auf die der Konverter aufsetzen kann?
» Dokumentvorlage, Makros und Tools für Hilfskräfte erstellen
» „Halbautomatische“ Korrekturen
» Per Makro in Word
» Im XML-Editor
» Prüfungen
» Per Makro in Word
» Im XML-Editor
» automatisch erstelltes Prüf-PDF oder -HTML
» Dokumentstruktur
» Linkinformationen
» Indexeinträge
Was tun, wenn … Daten nicht oder nicht ausreichend formatiert sind
»
Stefan Göbel Content Labs GmbH
XML in Word
Aufbau einer Word-Datei
»
Stefan Göbel Content Labs GmbH
Word zu XML
»
Stefan Göbel Content Labs GmbH
» Le-tex transpect
» upCast
» OpenContent
» andere?
Word zu XML
»
Stefan Göbel Content Labs GmbH
» Vorteile
» Liest DOCX und IDML
» erzeugt XML, XHTML, ePub, DOCX
» Schematron kann eingebunden werden
» in Serverumgebung einsetzbar
» Open Source
» mögliche Nachteile
» Konfiguration technisch anspruchsvoll
» sehr hoher Einrichtungsaufwand
» keine GUI
Word zu XML: le-tex transpect
»
Stefan Göbel Content Labs GmbH
» Vorteile
» liest RTF, DOCX nur mit installiertem Word, XML
» Schreibt RTF und XML
» in Serverumgebung einsetzbar
» GUI
» eigene Programmiersprache zur Strukturierung von „hart“
ausgezeichneten Dokumenten
» Heuristik zur Erkennung von Listen
» mögliche Nachteile
» eigene Programmiersprache zur Strukturierung von „hart“
ausgezeichneten Dokumenten
» Heuristik zur Erkennung von Listen
Word zu XML: upCast
»
Stefan Göbel Content Labs GmbH
» Vorteile
» liest DOCX, IDML und XML
» schreibt XML und ePub
» in Serverumgebung einsetzbar
» GUI
» leichtes Erzeugung von Container-Elementen
» Gleiche Einrichtung für DOCX und IDML einsetzbar
» Mögliche Nachteile
» Prüfungen nur über externe Programmaufrufe
» kein Export von Layout-Informationen
» XML wird sequentiell verarbeitet, also ohne XSLT
» hohe Performance
» konvertiert auch sehr große Dateien
» Demo
Word nach XML: OpenContent
»
Stefan Göbel Content Labs GmbH
XML nach Word
»
Stefan Göbel Content Labs GmbH
» le-tex transpect
» upCast
» XSLT/OpenContent
» Alternativen
» für Word angepasstes HTML
» Apache FOP nur eingeschränkt nutzbar, da keine Absatz- und
Zeichenformate vergeben werden können
XML nach Word
»
Stefan Göbel Content Labs GmbH
» Anfang 2010 wegen einer Patentverletzung aus Word entfernt
XML mit/in Word?
»
Stefan Göbel Content Labs GmbH
Anregungen
»
Stefan Göbel Content Labs GmbH
» Haben Ihre Autoren eine einfache Vorlage?
» Wenden sie sie korrekt an?
» Geben Sie dem Autor Tools zur Arbeitserleichterung an die Hand!
» Legen Sie eine verlagsinterne Autorität fest
» entscheidet bei Widerspüchen zwischen Struktur und Inhalt
» weist evtl. auch Autorenwünsche ab
» Schulen Sie Autoren/Redakteure/Dienstleister!
» Falls Externe konvertieren: statten Sie sie mit einem zentral
entwickelten Konverter aus
» Kostenersparnis
» einheitliche Qualität
» auch Dienstleister mit geringerem technischen Niveau einsetzbar
» Können Sie auf Strukturen verzichten?
Anregungen
»
Stefan Göbel
Ihre Fragen
»
Stefan Göbel Content Labs GmbH
Stefan Göbel
stefan.goebel@content-labs.de
Content Labs GmbH
www.content-labs.de
(0 76 33) 9 33 47 74
Twitter: @Stefan_Goebel
Content Labs
»
Stefan Göbel Content Labs GmbH
» OOXML/WordML
» Einführung:
http://msdn.microsoft.com/en-
us/library/bb266220%28v=office.12%29.aspx
» Einführung und Referenz:
http://www.data2type.de/xml-xslt-xslfo/wordml/
» Rezepte:
http://msdn.microsoft.com/en-
us/library/ff433639%28v=office.12%29.aspx
» Konverter
» http://www.content-labs.de/opencontent/
» http://www.le-tex.de/de/transpect.html
» http://www.upcast.de
» https://xmlgraphics.apache.org/fop/ (nur XML nach RTF)
Links

Word und XML - Vortrag XML User Group München

  • 1.
  • 2.
    » Stefan Göbel ContentLabs GmbH » Was beschäftigt uns bei „Word und XML“? » leichte Konvertierung » Voraussetzungen » Was tun, wenn… » Aufbau einer Word-Datei » Text, Tabellen, Bilder, Links, Indexeinträge, Listen » Word nach XML » XML nach Word » Anregungen » Ihre Fragen Heute abend
  • 3.
    » Stefan Göbel ContentLabs GmbH Leichte Konver- tierung
  • 4.
    » Stefan Göbel ContentLabs GmbH » Einheitlich und eindeutig formatierte Daten » Formatierungen/Styles auf Zielstruktur abgestimmt » Wege zu guten Daten » kurze Erfassungsrichtlinien für Autoren zusammenstellen » möglichst einfache Dokumentvorlage » Makros unterstützen Autor beim Erfassen komplexerer Textteile (z.B. Referenzen) » Prüfungen, möglichst vor der Konvertierung » Prüfmakro mit Rückmeldung möglicher Fehler » Ablauf der Konvertierung zeigen: „So schnell ist Ihr Werk veröffentlich, wenn Sie die Erfassungsrichtlinien beachten!“ Leichte Konvertierung: Voraussetzungen
  • 5.
    » Stefan Göbel ContentLabs GmbH » Gibt es andere Muster, auf die der Konverter aufsetzen kann? » Dokumentvorlage, Makros und Tools für Hilfskräfte erstellen » „Halbautomatische“ Korrekturen » Per Makro in Word » Im XML-Editor » Prüfungen » Per Makro in Word » Im XML-Editor » automatisch erstelltes Prüf-PDF oder -HTML » Dokumentstruktur » Linkinformationen » Indexeinträge Was tun, wenn … Daten nicht oder nicht ausreichend formatiert sind
  • 6.
    » Stefan Göbel ContentLabs GmbH XML in Word Aufbau einer Word-Datei
  • 7.
    » Stefan Göbel ContentLabs GmbH Word zu XML
  • 8.
    » Stefan Göbel ContentLabs GmbH » Le-tex transpect » upCast » OpenContent » andere? Word zu XML
  • 9.
    » Stefan Göbel ContentLabs GmbH » Vorteile » Liest DOCX und IDML » erzeugt XML, XHTML, ePub, DOCX » Schematron kann eingebunden werden » in Serverumgebung einsetzbar » Open Source » mögliche Nachteile » Konfiguration technisch anspruchsvoll » sehr hoher Einrichtungsaufwand » keine GUI Word zu XML: le-tex transpect
  • 10.
    » Stefan Göbel ContentLabs GmbH » Vorteile » liest RTF, DOCX nur mit installiertem Word, XML » Schreibt RTF und XML » in Serverumgebung einsetzbar » GUI » eigene Programmiersprache zur Strukturierung von „hart“ ausgezeichneten Dokumenten » Heuristik zur Erkennung von Listen » mögliche Nachteile » eigene Programmiersprache zur Strukturierung von „hart“ ausgezeichneten Dokumenten » Heuristik zur Erkennung von Listen Word zu XML: upCast
  • 11.
    » Stefan Göbel ContentLabs GmbH » Vorteile » liest DOCX, IDML und XML » schreibt XML und ePub » in Serverumgebung einsetzbar » GUI » leichtes Erzeugung von Container-Elementen » Gleiche Einrichtung für DOCX und IDML einsetzbar » Mögliche Nachteile » Prüfungen nur über externe Programmaufrufe » kein Export von Layout-Informationen » XML wird sequentiell verarbeitet, also ohne XSLT » hohe Performance » konvertiert auch sehr große Dateien » Demo Word nach XML: OpenContent
  • 12.
    » Stefan Göbel ContentLabs GmbH XML nach Word
  • 13.
    » Stefan Göbel ContentLabs GmbH » le-tex transpect » upCast » XSLT/OpenContent » Alternativen » für Word angepasstes HTML » Apache FOP nur eingeschränkt nutzbar, da keine Absatz- und Zeichenformate vergeben werden können XML nach Word
  • 14.
    » Stefan Göbel ContentLabs GmbH » Anfang 2010 wegen einer Patentverletzung aus Word entfernt XML mit/in Word?
  • 15.
    » Stefan Göbel ContentLabs GmbH Anregungen
  • 16.
    » Stefan Göbel ContentLabs GmbH » Haben Ihre Autoren eine einfache Vorlage? » Wenden sie sie korrekt an? » Geben Sie dem Autor Tools zur Arbeitserleichterung an die Hand! » Legen Sie eine verlagsinterne Autorität fest » entscheidet bei Widerspüchen zwischen Struktur und Inhalt » weist evtl. auch Autorenwünsche ab » Schulen Sie Autoren/Redakteure/Dienstleister! » Falls Externe konvertieren: statten Sie sie mit einem zentral entwickelten Konverter aus » Kostenersparnis » einheitliche Qualität » auch Dienstleister mit geringerem technischen Niveau einsetzbar » Können Sie auf Strukturen verzichten? Anregungen
  • 17.
  • 18.
    » Stefan Göbel ContentLabs GmbH Stefan Göbel stefan.goebel@content-labs.de Content Labs GmbH www.content-labs.de (0 76 33) 9 33 47 74 Twitter: @Stefan_Goebel Content Labs
  • 19.
    » Stefan Göbel ContentLabs GmbH » OOXML/WordML » Einführung: http://msdn.microsoft.com/en- us/library/bb266220%28v=office.12%29.aspx » Einführung und Referenz: http://www.data2type.de/xml-xslt-xslfo/wordml/ » Rezepte: http://msdn.microsoft.com/en- us/library/ff433639%28v=office.12%29.aspx » Konverter » http://www.content-labs.de/opencontent/ » http://www.le-tex.de/de/transpect.html » http://www.upcast.de » https://xmlgraphics.apache.org/fop/ (nur XML nach RTF) Links