XMLidP2000

Sitemap

Sitemap

1 Einführung
1.1 Warum mehr weniger ist
1.2 Warum mehr mehr ist
1.3 Wohin die Reise geht
2 Was sind Dokumente?
2.1 Eine kurze Geschichte der Textverarbeitung
2.2 Bestandteile eines Dokumentes
2.3 Die neue, alte Idee: Strukturorientiert schreiben
2.4 Die Entwicklung des Hypertextes
2.5 Textformate im Web
2.6 Das SGML-Konzept: Generic Markup
2.7 Dokumente versus Daten
3 XML im Web
3.1 XML bei der Verwaltung von Websites
3.2 Clientseitige XML-Interpretation
3.2.1 XML mit CSS
3.2.2 XML mit XSL(T)
3.3 XML auf dem Server
3.4 Linking-Möglichkeiten von XML
3.5 XML als Datenaustauschformat
4 XML Quick Start
4.1 Dokumenttyp-Definition (DTD) und Instanzen
4.2 Verarbeitung der Dokumente
4.2.1 Beispiel: Verarbeitung mit Cost/TCL
4.2.2 Beispiel: Verarbeitung mit XSLT
4.2.3 Beispiel: XML/XSLT im Internet Explorer
4.2.4 Fazit
5 XML-DTDs: Die verständliche Beschreibung
5.1 Ein Wort zur Notation
5.2 Dokumente
5.3 Elemente
5.4 Zeichen, Namen und Zeichendaten
5.5 Kommentare
5.6 Processing Instructions
5.7 Wo bleibt Multimedia?
5.8 Dokumenttyp-Definition (DTD)
5.8.1 Elementtyp-Deklaration
5.8.2 Attributlisten-Deklaration
5.8.3 Möglichkeiten, die DTD zu gestalten und zu gliedern
5.8.4 Notation-Deklaration
6 Namensräume in XML
7 XPath: Adressierung von XML-Dokumentteilen
7.1 Zu Grunde liegendes Datenmodell
7.2 Zugriff auf den Datenbaum
7.3 Hilfe von Operatoren
7.4 Kernfunktionen für den Datenzugriff
8 XML: Linking
8.1 Notwendige Begriffe
8.2 XLink: einfache und erweiterte Links
8.2.1 Einfache Verweise
8.2.2 Erweiterte Links
8.2.3 XLink in der Praxis
8.3 XPointer: Verweise in Dokumente hinein
8.3.1 XPath-Erweiterungen in XPointer
9 Überblick über Stylesheet-Sprachen
9.1 Cascading Style Sheets
9.1.1 Wertzuweisungen
9.1.2 Formatierungsmodell
9.1.3 CSS und XML
9.1.4 Ein Beispiel: XML im Mozilla
9.2 Document Style Semantics and Specification Language
9.2.1 Flow Objects
9.2.2 Verarbeitungs-Modus
9.2.3 DSSSL praktisch
9.2.4 Langer Marsch von DSSSL nach HTML
9.3 Extensible Stylesheet Language (XSLT und XSL)
9.3.1 Verhältnis von XSLT zu XSL
9.3.2 Formatierung mit XSL
10 XSL-Transformationen
10.1 Grundsätzliches über Templates
10.2 Ergänzungen zum Datenmodell von XPath
10.3 Struktur von XSLT-Stylesheets
10.4 Den Ergebnisbaum erzeugen
10.4.1 Diverse Basiselemente
10.4.2 Formatierte Nummerierung
10.4.3 Schleifen und bedingte Verarbeitung
10.4.4 Sortieren
10.4.5 Variable und Parameter
10.4.6 Zusätzliche Funktionen
10.4.7 XSLT-Erweiterungen
10.4.8 message, output
11 XSLT in Web-Anwendungen
11.1 XSLT im Internet Explorer
11.2 Linklisten erzeugen
11.3 Details einer Literaturgeschichte
11.3.1 Sortierte Überblicksseiten
11.3.2 Kalender: einzelne Tage ausgeben
12 XML-Editoren
12.1 Übersicht
12.1.1 Emacs + PSGML (mit XML-Unterstützung)
12.1.2 XML Notepad
12.1.3 XML Spy
12.1.4 XMetal
12.1.5 Epic
12.1.6 MarkupKit (für MS Word)
12.1.7 WordPerfect Office2000
12.2 Emacs und PSGML (mit XML-Unterstützung)
12.3 XML-Notepad
12.4 XML Spy
12.5 XMetal
12.6 Epic
12.7 MarkupKit (für MS Word)
12.8 WordPerfect Office2000
12.9 Fazit
13 Entwicklung einer DTD
13.1 Auswahl einer Mehrzweck-DTD
13.2 Entwurf einer DTD
13.2.1 Dokumentanalyse
13.2.2 Tipps und Tricks
13.3 Instanzen ohne DTD
14 Herstellung dieses Buches
14.1 Zielsetzung und Randbedingungen
14.2 Definition der DTD
14.2.1 Schritt 1: Die Grobstruktur
14.2.2 Schritt 2: Elemente auf Zeichenebene
14.2.3 Schritt 3: Die Details
14.3 Formatieren des Manuskriptes
14.3.1 Konvertierung in HTML
14.3.2 Aufbereitung für den Ausdruck
14.4 Erfahrungen mit der zweiten Auflage
15 Anwendungsbeispiel Literatur
15.1 Vorüberlegungen
15.2 En détail: die Autoren in der DTD
15.3 Wie die Daten ins Web gelangen
15.3.1 Inhaltsverzeichnis generieren
15.3.2 Ausgabe der Autorendaten
15.4 Vollständige Listings
15.4.1 DTD für die Literaturgeschichte
15.4.2 DSSSL-Listing: Inhaltsverzeichnis
15.4.3 DSSSL-Listing: Ausgabe eines einzelnen Autors
15.4.4 Perl-Code für Ausgabe einzelner Autoren
16 Verteilte Softwareverwaltung mit XML
16.1 Aufgabenbeschreibung
16.2 XML als Datenbasis
16.3 Bilden von DTD-Hierarchien
16.4 Zusammentragen von verteilten XML-Fragmenten
16.5 Fazit
16.6 Stylesheet zur Transformation in HTML
17 E-Commerce mit XML
17.1 B2B-E-Commerce
17.1.1 Die Rolle von XML
17.1.2 Technische Aspekte
17.2 BMEcat
17.3 Electronic Business XML (ebXML)
17.3.1 Arbeitsgruppen
17.3.2 Zeitplan des Projekts
17.4 XML und EDIFACT
18 XML und Apache
18.1 XML-Transformation per CGI
18.1.1 Konfiguration des Servers
18.1.2 CGI-Skript: xmlhandler.cgi
18.1.3 Beispiel: von HTML nach HTML mit DSSSL oder XSLT
18.2 Cocoon
18.2.1 Extensible Server Pages (XSP)
18.2.2 Beispiel: Formatierung in PDF mit XSL
18.2.3 Beispiel: Simuliertes XLink mit Dynamic HTML/JavaScript
18.2.4 Installation
19 XHTML: Neues HTML 4 — erweiterbar
19.1 Status quo: HTML neu definiert
19.2 Modulare Zukunft
20 Transformation von XML in WML und HTML
20.1 Erzeugen der WML-Dateien
20.2 Erzeugen der HTML-Dateien
21 Ausblick
21.1 XML Schema
21.2 Programmierung mit XML-Daten
21.3 XML und Java
21.4 Resource Description Framework
21.5 Die Zukunft
A Extensible Markup Language (XML) 1.0
A.1 Einleitung
A.1.1 Herkunft und Ziele
A.1.2 Terminologie
A.2 Dokumente
A.2.1 Wohlgeformte XML-Dokumente
A.2.2 Zeichen
A.2.3 Allgemeine syntaktische Konstrukte
A.2.4 Zeichendaten und Markup
A.2.5 Kommentare
A.2.6 Processing Instructions
A.2.7 CDATA-Abschnitte
A.2.8 Prolog und Dokumenttyp-Deklaration
A.2.9 Standalone-Dokumentdeklaration
A.2.10 Behandlung von Leerraum
A.2.11 Behandlung des Zeilenendes
A.2.12 Identifikation der Sprache
A.3 Logische Strukturen
A.3.1 Start-Tags, End-Tags und Leeres-Element-Tags
A.3.2 Elementtyp-Deklarationen
A.3.3 Attributlisten-Deklaration
A.3.4 Bedingte Abschnitte
A.4 Physikalische Strukturen
A.4.1 Zeichen- und Entity-Referenzen
A.4.2 Entity-Deklarationen
A.4.3 Analysierte Entities
A.4.4 Behandlung von Entities und Referenzen durch einen XML-Prozessor
A.4.5 Konstruktion des Ersetzungstextes von internen Entities
A.4.6 Vordefinierte Entities
A.4.7 Notation-Deklarationen
A.4.8 Dokument-Entity
A.5 Konformität
A.5.1 Validierende und nicht-validierende Prozessoren
A.5.2 Benutzen von XML-Prozessoren
A.6 Notation
A.7 Anhang A: Referenzen
A.7.1 Normative Referenzen
A.7.2 Weitere Referenzen
A.8 Anhang B: Zeichenklassen
A.9 Anhang C: XML und SGML (nicht normativ)
A.10 Anhang D: Expansion von Entity- und Zeichenreferenzen (nicht normativ)
A.11 Anhang E: Deterministische Inhaltsmodelle (nicht normativ)
A.12 Anhang F: Automatische Erkennung von Zeichenkodierungen (nicht normativ)
A.13 Anhang G: XML-Arbeitsgruppe des W3C (nicht normativ)
B Verknüpfen von Style Sheets mit XML-Dokumenten Version 1.0
B.1 Die xml-stylesheet-Processing-Instruction
B.2 Anhang A: Referenzen
B.3 Anhang B: Begründung
C Verhältnis von XML zu SGML und HTML
C.1 XML und SGML
C.2 XML und HTML
D Übersichten
D.1 Cascading Style Sheets
D.1.1 CSS-Eigenschaften und -Werte
D.1.2 CSS-Muster
D.2 DSSSL: Flow Objects
D.3 Syntax der XSLT-Elemente
D.4 DTD-Fragment für XSLT-Stylesheets (nicht normativ)
D.5 Relevante Spezifikationen und Organisationen
D.5.1 International Organization for Standardization
D.5.2 World Wide Web Consortium
D.5.3 Organization for the Advancement of Structured Information Standards
D.5.4 Internet Society und Internet Engineering Task Force
D.5.5 ISO-639-Sprachcodes
D.5.6 ISO-3166-Ländercodes
D.5.7 Zeichensatz ISO-Latin-1
D.5.8 Sonderzeichen
D.6 XML-1.0-Regeln

10 XSL-Transformationen

I use emacs, which might be thought of as a thermonuclear word processor. It was created by Richard Stallman; enough said. It is written in Lisp, which is the only computer language that is beautiful.FussnoteDas Zitat ist dem 1999 bei Avon Books erschienenen Taschenbuch In the beginning ... was the command line entnommen. Deutsch: Ich benutze Emacs, was man sich als thermonukleare Textverarbeitung vorstellen kann. Richard Stallman hat ihn geschrieben; genug gesagt. Geschrieben ist er in Lisp, der einzigen Programmiersprache, die schön ist. Als bekennender Emacs-Benutzer können wir dem nur wenig hinzufügen, außer vielleicht, dass wir als guter Europäer natürlich dem in Frankreich und Großbritannien entwickelten Prolog den Vorzug gäben ;-)

Neal Stephenson

Da es sich bei XML selbst lediglich um die Definition einer Syntax handelt, in der sich Sprachen beschreiben lassen, sind weitere Spezifikationen erforderlich, die beispielsweise die Formatierung von XML-Dokumenten oder die Möglichkeiten des Verweisens auf andere Dokumente beschreiben. Die Cascading Style Sheets (CSS) sind eine davon, aber sie reichten den XML-Entwicklern nicht.

Bis zum Frühjahr 1999 galt XSL, die Extensible Stylesheet Language als die Sprache, die analog zu DSSSL die Transformation und Formatierung von XML-Daten und -Dateien übernehmen sollte (bereits 1997 hatte es einen ersten Entwurf gegeben). Im April 1999 legte die zuständige Arbeitsgruppe des World Wide Web Consortium (W3C) zwei verschiedene Entwürfe vor: einen, der die Formatierung betraf, und einen, der die möglichen Transformationen beschrieb. Darüber hinaus legte das W3C einen Entwurf vor, der darstellt, wie Autoren auf Teile eines Dokumentes zugreifen können: XML Path Language, kurz XPath.

Vorhanden: W3C-Empfehlungen für Transformationen und Zugriff auf Elemente

Im Wesentlichen folgt die Aufteilung in einen Transformations- und einen Formatierungsteil dem, was innerhalb von DSSSL bereits vorhanden war (siehe 9.2). Ersterer ermöglicht die Wandlung beliebigen XML-Inhalts in ein anderes XML-Format. Auf diese Weise können sich beispielsweise Firmen, die mit unterschiedlichen DTDs arbeiten, auf ein Zwischenformat einigen, über das sie Daten austauschen. Vor allem aber, denn das dürfte der häufigste Fall sein, können Web-Autoren ihr XML in HTML wandeln, sodass auch Browser, die kein XML verstehen, Dokumente darstellen können.

Damit innerhalb solcher Transformationen und im Linking dieselben Regeln gelten, was den Zugriff auf Dokumentteile angeht, haben Mitglieder der XSL- und der Linking-Arbeitsgruppen mit XPath eine Sprache entwickelt, die für beide vorschreibt, wie Teile von Dokumenten anzusprechen sind.

Seit Mitte November 1999 liegen sowohl XSLT als auch XPath als so genannte Recommendation vor, wie das W3-Konsortium seine Spezifikationen nennt. Tim Berners-Lee hat in seinem Buch [bern99] [bern99]Weaving the Web - The Original Design an Ultimate Destiny of the World Wide Web by its Inventor - The Original Design an Ultimate Destiny of the World Wide Web by its Inventor, Tim Berners-Lee, Mark Fischetti, San Francisco, 1999, HarperSanFrancisco zur Geschichte des World Wide Web betont, dass es ihm (und anderen) von Anfang an darum gegangen sei, nicht Normen (Standards) vorzugeben, sondern Empfehlungen. Nicht zuletzt, um den Konsens zu fördern; denn vorschreiben lassen sich die (großen) Firmen, die im Konsortium mitarbeiten, nichts. Die Analogie zu den RFCs, den Internet-Standards, liegt auf der Hand: Von der wörtlichen Bedeutung her klingen Request For Comments und Recommendation fast vorsichtig, beide haben sich aber zu Standards entwickelt.

Im Folgenden geht es zunächst darum, was XSLT beziehungsweise Software, die diese Spezifikation umsetzt, an Transformationen leistet. James Clark, der die W3C-Empfehlung verfasst hat, ist seit längerem in der SGML-Szene bekannt, unter anderem durch sein Programm Jade, James' DSSSL Engine, das in diesem und für dieses Buch Verwendung gefunden hat. Er hat analog dazu XT geschrieben, das wie Jade frei erhältlich ist (http://www.jclark.com/xml/). Eine Alternative zu XT ist Saxon, das Michael Kay entwickelt hat. Auch Saxon ist frei verfügbar (http://users.iclway.co.uk/mhkay/saxon/). Wie sich später zeigen wird, ist es durch seine ausführliche Dokumentation für manche Aufgabe besser geeignet als XT. Beide dienen in diesem Buch als Grundlage der Transformationen.

Die Beispiele, die wir hier verwenden, dienen bis auf wenige Ausnahmen in Kapitel 18 und am Ende dieses Kapitels der Transformation in HTML. Dafür gibt es mehrere Gründe. Erstens kann bislang (beim Schreiben dieses Kapitels) nur Microsofts Internet Explorer Dateien mit XSLT-Stylesheets darstellen. Und zweitens dauert die dynamische Wandlung mit Hilfe der genannten Programme einfach zu lange, um diesen Weg ernsthaft gehen zu wollen.

In Kapitel (7) haben wir die Syntax von XPath bereits beschrieben; hier folgen Beispiele für die Anwendungsmöglichkeiten von XPath in XSLT-Stylesheets — und ein bisschen Theorie ...

Herunter 10.1 Grundsätzliches über Templates
Herunter 10.2 Ergänzungen zum Datenmodell von XPath
Herunter 10.3 Struktur von XSLT-Stylesheets
Herunter 10.4 Den Ergebnisbaum erzeugen

Valid HTML 4.01!Valid CSS!