Optionen und weiterführende Links



In der Datenbank befinden sich derzeit 477 Specials. Alle Specials anzeigen...

Wohlgeformtes

Wohlgeformtes

Wie HTML, arbeitet auch XML mit Tags. Im Gegensatz zu HTML jedoch seit Ihr nicht auf eine vordefinierte Menge von Tags festgelegt, sondern könnt nahezu beliebige eigene Tags verwenden. Dabei müßt Ihr nur einige Regeln beachten. Die meisten dieser Regeln gelten so oder ähnlich auch bei HTML, werden bei XML allerdings deutlich strenger kontrolliert

  • Tags stehen in spitzen Klammern (<name>, <book>, ...)
  • Jedes Tag muß abgeschlossen werden mit einem passenden Endtag (</name>, </book>, ...). Auch sogenannte leere Tags, die keinen Inhalt haben, müssen abgeschlossen werden (in HTML beispielsweise <br></br>). Als Kurzform könnt Ihr in solchen Fällen auch Start- und Endtag zusammenfassen als <br /> (mit einem Leerzeichen zwischen Tagname und Schrägstrich).
  • Ihr könnt Tags verschachteln, solange sie sich nicht überlappen. Also ist folgendes zulässig
    <book>
      <name>Der coole Comic</name>
    </book>
    folgendes aber nicht
    <book>
    
      <name>Der coole Comic
    </book></name>
  • Ihr könnt Euren Tags Attribute mitgeben. Deren Werte müssen in einfachen (') oder doppelten (") Anführungszeichen eingeschlossen werden
    <prize currency="euro">5,99</prize>
    Es darf nicht mehrere Attribute mit demselben Namen bei einem Tag geben. Boolsche Attribute bekommen als Wert den Attributnamen zugewiesen.
  • Aus HTML kennt Ihr Entities, mit denen meist Sonderzeichen dargestellt werden (beispielsweise &auml; für ein ä). In XML könnt Ihr eigene Entities definieren (dazu später mehr).
  • Jedes XML-Dokument muß genau ein Wurzelelement besitzen. Das ist ein Tag, der das gesamte Dokument umschließt. In einem HTML-Dokument ist das Wurzeltag <html> ... </html>.

Die Namen Eurer Tags und Attribute (und einiger anderer Konstrukte) sind sogenannte XML-Namen. Ein XML-Name darf (wie gewohnt) die normalen Buchstaben von A bis Z und von a bis z und die Ziffern 0 bis 9 enthalten. Darüber hinaus sind auch nicht-englische Buchstaben, Zahlen und Ideogramme erlaubt, beispielsweise deutsche Umlaute oder griechische Buchstaben (φ, ψ, ...). Erlaubt sind auch Bindestrich (-), Unterstrich (_) und Punkt (.), aber keine anderen Interpunktszeichen (Anführungszeichen, Dollar-Zeichen, Klammern, ...) oder Leerzeichen, Zeilenumbrüche oder ähnliches. Der Doppelpunkt (:) ist erlaubt, hat aber eine spezielle Funktion (mehr dazu beim Thema «Namensräume»). Am Beginn muß ein Buchstabe oder Ideogram oder dem Unterstrich stehen, aber keine Ziffer, kein Bindestrich und kein Punkt. In XML wird zwischen Groß- und Kleinschreibung unterschieden, folgendes Beispiel ist also nicht zulässig

<tag>Der Inhalt</TAG>

Kommentare in XML folgen der HTML-Syntax

<!-- Dieses ist ein Kommentar in einer XML-Datei -->

Ein XML-Dokument kann Steueranweisungen (PI, Processing Instructions) enthalten. Damit könnt Ihr Informationen an Programme übergeben, die Euer XML-Dokument lesen. Solche Programme sind beispielsweise PHP oder der JavaScript-Interpreter Eueres Browsers: Beide filtern Informationen aus dem umgebenen HTML-Code und werten diese Informationen aus. Eine XML-PI beginnt mit <? und endet mit ?>. Nach dem <? folgt direkt das sogenannte Ziel, ein XML-Name. Das Ziel kann der Name der auswertenden Anwendung sein (<?php ... ?>) oder auch nur ein Schlüsselwort, an dem die Anwendung erkennt, was gewünscht wird.

Ein XML-Dokument, das alle diese Regeln einhält, ist wohlgeformt. Jedes XML-Dokument muß wohlgeformt sein, sonst kann es nicht geparset (von einem Programm ausgewertet) werden.

Zu Beginn jedes XML-Dokuments sollte außerdem eine XML-Deklaration stehen. Darin ist die verwendete XML-Version angegeben (im Moment noch immer 1.0), die verwendete Zeichensatz-Codierung und das standalone-Attribut. Dieses kann den Wert 'yes' oder 'no' haben und steht im Zusammenhang mit der verwendeten DTD (mehr dazu im nächsten Abschnitt). Insgesamt sieht eine Deklaration so aus

<?xml version="1.0" encoding="ISO-8859-1" standalone="yes"?>

Die Attribute 'encoding' und 'standalone' sind optional.

Das in der Einleitung gezeigte XML-Fragment müßte also als komplettes Dokument so aussehen

<?xml version="1.0" encoding="ISO-8859-1" standalone="yes"?>
<book>
  <name>Der coole Comic</name>
  <number>1234-5</number>

  <prize currency="euro">5,99</prize>
</book>


Special vom: 16.01.2003
Autor dieses Specials: Henning Kockerbeck
Die weiteren Unterseiten dieses Specials:
Die reine Lehre - HTML
Stilvoll - CSS
Kleiner Grundkurs Programmieren
Jetzt wird's dynamisch - JavaScript
Die andere Seite der Dynamik - PHP
Neue Gefilde - XML
Weiterführende Links
Zurück zur Hauptseite des Specials


?>