Universität zu KölnHistorisch-Kulturwissenschaftliche InformationsverarbeitungIT-Zertifikat der Phil.-Fak.: Daten- und Met...
Universität zu KölnHistorisch-Kulturwissenschaftliche InformationsverarbeitungIT-Zertifikat der Phil.-Fak.: Daten- und Met...
Universität zu KölnHistorisch-Kulturwissenschaftliche InformationsverarbeitungIT-Zertifikat der Phil.-Fak.: Daten- und Met...
Nächste SlideShare
Wird geladen in …5
×

IT-Zertifikat: Advanced Markup & Metadata - Handout XML

1.318 Aufrufe

Veröffentlicht am

0 Kommentare
0 Gefällt mir
Statistik
Notizen
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Keine Downloads
Aufrufe
Aufrufe insgesamt
1.318
Auf SlideShare
0
Aus Einbettungen
0
Anzahl an Einbettungen
95
Aktionen
Geteilt
0
Downloads
8
Kommentare
0
Gefällt mir
0
Einbettungen 0
Keine Einbettungen

Keine Notizen für die Folie

IT-Zertifikat: Advanced Markup & Metadata - Handout XML

  1. 1. Universität zu KölnHistorisch-Kulturwissenschaftliche InformationsverarbeitungIT-Zertifikat der Phil.-Fak.: Daten- und MetadatenstandardsJan G. Wieners, MA / www.hki.uni-koeln.de/wieners- 1/3 -IT-Zertifikat: Daten- und MetadatenstandardsXML – Ein kurzer ÜberblickXML ist eine Auszeichnungssprache, eine sog. „Markup“-Sprache. Wie HTML, so verwendet auchXML Tags zur Auszeichnung von Elementen:<tagname>Information, die durch das Tag „tagname“ ausgezeichnetist.</tagname>Exkurs „Tags“: Ein Tag ist durch spitze Klammern gekennzeichnet; unterschieden wird zwischenöffnenden Tags, z.B. <tagname> und schließenden Tags, z.B. </tagname>, charakterisiert durch denSchrägstrich („/“). Zu jedem öffnenden Tag muss ein schließendes Tag vorhanden sein.Leere Tags (<beispieltag> </beispieltag>) lassen sich abkürzen mit <beispieltag />.XML ist deutlich allgemeiner als HTML: XML ist eine Auszeichnungssprache, die dazu dient,beliebige Markupsprachen zu definieren. So lässt sich mit XML die Markupsprache HTMLdefinieren (vgl. XHTML als XML-basierte Version von HTML).„Mit Hilfe von XML ist es möglich, die Struktur, den Inhalt und die Darstellung eines Dokumentsstreng zu trennen und entsprechend dann auch unabhängig voneinander zu be- und verarbeiten.Während die Tags in HTML in erster Linie festlegen, in welcher Form Inhalte in einementsprechenden Medium ausgegeben werden sollen, wird mit XML versucht, die Bedeutung vonDaten so festzuhalten, dass nicht nur Menschen, sondern auch Maschinen damit etwas anfangenkönnen. Das erlaubt zum einen eine Prüfung der Gültigkeit von Dokumenten, ist zugleich aber auchdie Basis für erweiterte Formen der Gestaltung und der Verknüpfung von Dokumenten.“1Übersicht über die Sprachfamilie XML2Ausgewählte XML-Anwendungen:XHTML WML SMIL SOAPProgrammierschnittstellen:DOM SAXCo-Standards:XSL / XSLT XPath Xpointer XlinkKern-Standards:XML-Infoset XML 1.0 Namensräume XML-Schema1 Vonhoegen, H.: Einstieg in XML: Aktuelle Standards: XML Schema, XSL, XLink. Bonn: Galileo Computing, 2009. S. 30.2 Vgl.: ebenda, S.33.
  2. 2. Universität zu KölnHistorisch-Kulturwissenschaftliche InformationsverarbeitungIT-Zertifikat der Phil.-Fak.: Daten- und MetadatenstandardsJan G. Wieners, MA / www.hki.uni-koeln.de/wieners- 2/3 -XML (eXtensible Markup Language) in 10 Punkten(http://www.w3.org/XML/1999/XML-in-10-points.html)1. XML bietet eine Methode, um Daten zu strukturieren und mittels einer Textdatei abzubilden2. XML ähnelt HTML ein wenig3. XML wird von Maschinen gelesen, ist aber dem Menschen verständlich4. XML umfasst eine ganze Familie von Technologien5. XML ist wortreich6. XML ist relativ neu, hat aber bedeutende Wurzeln7. XML führt HTML nach XHTML8. XML bietet die Möglichkeit, Modularität zu implementieren9. XML bietet die Grundlage für RDF (Resource Description Framework) und das SemanticWeb10.XML ist lizenzfrei, plattformunabhängig und wird breit unterstützt(Grund)Aufbau eines XML-DokumentesXML-Deklaration: XML-Dokumente beginnen (üblicherweise) mit einer einleitenden XML-Deklaration, die das Dokument als XML-Dokument kennzeichnet (xml), der Versionsnummer(version=“1.0“) des verwendeten XML-Standards und der Angabe des Kodierungsformates zurFestlegung der Zeichenkodierung (encoding=“utf-8“):<?xml version=“1.0“ encoding=“utf-8“ ?>Mit der vorangehenden Zeile wird die Übereinstimmung des XML-Dokumentes mit der (derzeit) gültigenSpezifikation von XML deklariert.Anforderungen an XML-DokumenteXML-Dokumente müssen wohlgeformt (well-formed) sein, d.h. sie müssen den Regeln der XML-Syntaxgenügen (Auszug aus den Syntax-Regeln):Es existiert ein – und nur ein – Wurzelelement(!)<emailadressen><adresse1>example@example.com</adresse1><adresse2>secondexample@example.com</adresse2></emailadressen>Jedes Element muss ein Start- und ein Endtag besitzen<beispiel> Element mit Kindelementen<element1>Irgendein Textinhalt</element1><element2></element2><element3/></beispiel>Falsch:<beispiel> Element<element1> Text</beispiel>
  3. 3. Universität zu KölnHistorisch-Kulturwissenschaftliche InformationsverarbeitungIT-Zertifikat der Phil.-Fak.: Daten- und MetadatenstandardsJan G. Wieners, MA / www.hki.uni-koeln.de/wieners- 3/3 -Bitte beachten: Der Elementtypname im Start-Tag und im End-Tag müssen exakt übereinstimmen. Ungültigwäre folgender XML-Code:<titel> Ein Titel </TITEL>Elemente dürfen geschachtelt sein, sich aber nicht überlappen<strong><em> Beispielinhalt </strong></em> Falsch<strong><em> Beispielinhalt </em></strong> RichtigEs muss genau ein Wurzelelement existieren:<wurzelelement><element1>Irgendein Textinhalt</element1></wurzelemenent>Attributwerte müssen in Anführungszeichen stehen:<element1 attributwert=500>Textinhalt</element1> Falsch<element1 attributwert=“500“>Textinhalt</element1> Richtig<name vorname=“Francis“ vorname=“Scott“ nachname=“Fitzgerald“/> Falsch<name vorname=“Francis Scott“ nachname=“Fitzgerald“/> RichtigRegeln für die Namensgebung Ein Elementname muss mit einem Buchstaben oder mit Unterstrich oder Doppelpunkt beginnen. „xml“ darf nicht am Beginn eines Namens stehen. Die Länge der Namen ist nicht begrenzt – kürzere Namen erhöhen jedoch mitunter die Lesbarkeit. XML-Namen sind fallsensitiv. <Name> … </name> ist nicht zulässig.XML: wohlgeformt vs. gültigXML-Dokumente können gültig sein. Gültige (valide) Dokumente müssen strengeren Anforderungen bzgl.Ihrer Struktur genügen. Diese Struktur kann entweder in einer DTD (Document Type Definition) oder in einerXML Schema-Datei beschrieben werden.XML-Schema ist eine XML-Anwendung und nutzt die bekannte XML-Syntax.Elemente vs. AttributeMit Hilfe von Attributen lassen sich Zusatzinformationen zur Information repräsentieren, die das Elemententhält. Notiert werden Attribute im öffnenden Tag nach der folgenden Syntax:<kontakt name=“Jan Wieners“ email=“jan.wieners@uni-koeln.de“ />Häufig sind Elemente den Attributen vorzuziehen, da Attribute keine Schachtelung zulassen und der Inhaltvon Elementen über Programmierschnittstellen („API“s wie SAX / DOM) leichter zugänglich ist.KommentareKommentare lassen sich in XML über die Zeichenfolge „<!--„ bzw. „-->“ einbetten:<!--Dieser Text wird nicht angezeigt-->

×