Allgemeines zu XML

Was ist XML?

XML (Extensible Markup Language) ist eine Meta-Auszeichnungssprache, die es ermöglicht, hierarchisch strukturierte Daten in Form von Textdateien darzustellen.

Mithilfe des XML Formats können Daten innerhalb unterschiedlicher IT-Systeme ausgetauscht werden. Wurde XML ursprünglich für den Austausch strukturierter Daten im World Wide Web konzipiert, wird es inzwischen für unterschiedlichste Zwecke eingesetzt, u. a. für die Veröffentlichung und das Management von Dokumenten sowie im Bereich der Webdienste.

Der Grundgedanke von XML ist es, Inhalt und Struktur eines Dokumentes zu trennen. Dies hat den Vorteil, dass der Inhalt und die Struktur eines Dokumentes unabhängig voneinander abgelegt und behandelt und zu unterschiedlichen Zwecken wieder zusammengeführt werden können. So können dieselben Daten im XML-Format z. B. als Tabelle oder als Grafik dargestellt werden.

1. Fachbegriffe


1.1 Wohlgeformtheit
Ein XML-Dokument heißt wohlgeformt, wenn es sämtliche XML-Regeln einhält (also keine verletzt). Beispielhaft seien hier folgende genannt:

  • Das Dokument besitzt genau ein Wurzelelement.
  • Alle Elemente mit Inhalt besitzen eine Beginn- und eine End-Kennung (z. B. <Eintrag 1>). Elemente ohne Inhalt können auch in sich geschlossen sein, wenn sie aus nur einer Kennung bestehen, die mit />  abschließt (z. B. <Eintrag 1/>). Diese Kennungen werden im Allgemeinen "tags" genannt.
  • Die Beginn- und End-Kennungen (tags) sind ebenentreu-paarig verschachtelt.
  • Ein Element darf nicht mehrere Attribute mit demselben Namen besitzen.


1.2 Gültigkeit
Soll XML für den Datenaustausch verwendet werden, ist es von Vorteil, wenn das Format mittels einer Grammatik (z. B. einer Dokumenttypdefinition (DTD) oder eines XML-Schemas) definiert ist. Der Standard definiert ein XML-Dokument als gültig, wenn es wohlgeformt ist, den Verweis auf eine Grammatik enthält und das durch die Grammatik beschriebene Format einhält.

1.3 Parser
Programme oder Programmteile, die XML-Daten auslesen, interpretieren und ggf. auf Gültigkeit prüfen, nennt man XML-Parser. Prüft der Parser die Gültigkeit, so ist er ein validieren der Parser.

2. Die Struktur eines XML-Dokumentes

2.1 Ein erstes XML-Dokument

alt
Dies ist ein wohlgeformtes XML-Dokument. Es besteht dabei aus dem Prolog, dem Wurzelelement (und seinen Inhalten) sowie Verschiedenes.

2.2 Prolog

alt

Der Prolog besteht zunächst aus der XML-Deklaration, welche die Version des XML-Dokumentes sowie den Zeichensatz angibt in dem das Dokument verfasst wurde. Optional folgen die Dokumententypendefinition (DTD) sowie Verarbeitungsanweisungen und Kommentare.

2.3 Wurzelelement

alt

Ein XML-Dokument enthält  ein Wurzelelement, welches alle anderen Elemente und deren Inhalte umschließt.

2.4 Verschiedenes

alt

Nachdem ein Wurzelelement geschlossen ist, sind nur noch Kommentare erlaubt.

3. Transformation und Darstellung von XML-Dokumenten

Ein XML-Dokument kann mittels geeigneter Transformationssprachen wie z. B. XSLT in ein anderes Dokument transformiert werden. Oftmals dient die Transformation zur Überführung eines Dokuments aus einer XML-Sprache in eine andere XML-Sprache, beispielsweise zur Transformation nach XHTML, um das Dokument in einem Webbrowser anzuzeigen.

4. Schemasprachen

Um die Struktur von XML-Sprachen zu beschreiben, bedient man sich so genannter Schemasprachen. Die zwei bekanntesten sind DTD und XML-Schema.

4.1 DTD
Eine DTD (Dokumententypendefinition) ist eine Beschreibung eines XML-Dokuments. Sie wurde zusammen mit XML standardisiert, zu einem Zeitpunkt, an dem XML noch hauptsächlich für narrative documents (erzählende Dokumente, also Zeitungsartikel, Bücher, …) gedacht war, weniger als Datenaustauschformat. Daher ist es z. B. in DTD nicht möglich, zwischen Texten und Zahlen zu unterscheiden. Ein weiterer Nachteil ist die Tatsache, dass die DTD in einer eigenen Sprache abgefasst werden muss. Außerdem kennt die DTD keine Namensräume.

4.2 XML-Schema/XSD
XML-Schema (bzw. XSD = XML-Schema-Definition) ist die moderne Möglichkeit, die Struktur von XML-Dokumenten zu beschreiben. XML-Schema bietet auch die Möglichkeit, den Inhalt von Elementen und Attributen zu beschränken, z. B. auf Zahlen, Datumsangaben oder Texte, z. B. mittels regulärer Ausdrücke. Ein Schema ist selbst ein XML-Dokument, welches erlaubt, komplexere (auch inhaltliche) Zusammenhänge zu beschreiben, als dies mit einer formalen DTD möglich ist.

Weitere Informationen über das Format XML bietet etwa der Wikipedia Artikel Extensible Markup Language.

Achtung, öffnet in einem neuen Fenster.

E-MailDrucken