Dr. Charles Goldfarb

Transcrição

Dr. Charles Goldfarb
Dr. Charles Goldfarb
von Christian Bosse
19. Januar 2006
1 Biographie
Charles Goldfarb wurde 1941 geboren und machte 1964 seinen Abschluss an der Harvard Law School. Anschließend begann er seine
Karriere als Rechtsanwalt in Boston und hatte von Computern keinerlei Ahnung. Sein Interesse wurde eher zufällig geweckt, als einer
seiner Freunde erwähnte, dass die Wegbeschreibungen, die Charles
Goldfarb in seiner Freizeit erstellte, Computerprogrammen ähnelten.
Aus diesem Grund wagte er 1967 den Quereinstieg zu IBM und erhoffte sich, durch die neu zu erlangenden Kentnisse ebenfalls einen
neuen Kundenstamm als Rechtsanwalt. Zu seinen ersten Aufgaben
in der Firma gehörte unter anderem das Installieren von Computersystemen hauptsächlich im Verlagswesen. Daher auch seine Motivation und Idee im Jahr
1969 GML zu entwickeln und ab 1978 die Standardisierung zu SGML zu leiten. Seitdem
schrieb er mehrere Bücher und steht bis heute als Berater bei SGML bzw. XML Problemen zur Verfügung. Primär arbeitet Charles Goldfarb heutzutage jedoch als Rechtsanwalt
in Saratoga, Californien.
2 Motivation
In den 60er Jahren besaßen die Computer zwar immer noch Kleiderschrankgröße, konnten
aber dank der neuen Magnetbandlaufwerke für die damaligen Verhältnisse riesige Datenmengen speichern. So begannen große Unternehmen und Verwaltungen ihre Akten und
Papiere als Daten auf einem Computer zu speichern. Damit kam auch die Frage nach einem möglichen Datenaustausch zwischen verschiedenen Programmen oder Computern auf
und stellte die Entwickler vor neue Probleme: Wie konnte man einen solchen Austausch
und unabhängige Mehrfachnutzung von Daten ermöglichen?
3 Generalized Markup Language (GML)
Genau dieses Problem versuchten Charles Goldfarb, Edward Mosher und Raymond Lorie
bei IBM mit GML zu lösen. Sie definierten Dokumente einheitlich mit Hilfe von vorgegebenen tags, die den beschriebenen Inhalt einklammerten und so eine vorher festgelegte
Struktur in das Dokument brachten. Somit war GML eine der ersten Markup Languages,
die es ermöglichten, Daten zwischen Programmen und sogar verschiedenen Systemen auszutauschen und nutzbar zu machen.
Heutzutage gibt es die verschiedensten Arten von Markup Languages, die sich aber in
zwei Gruppen gliedern lassen: Die descriptive Markup Languages beschreiben lediglich
die Form des Dokuments, also welche Bausteine in welcher Reihenfolge vorhanden sein
müssen und welche Funktion sie haben. Das Layout, wie die verschiedenen Bausteine im
1
Zusammenhang dargestellt werden, bleibt dem System bzw. dem Benutzer überlassen. Die
Procedural Markup Languages dagegen definieren nur die Art und Weise der Darstellung
auf Ausgabegeräten wie Druckern, Plottern oder Bildschirmen.
4 Standard Generalized Markup Language (SGML)
Nachdem das Interesse an GML gewachsen war, entdeckte man, dass es noch zu uneinheitlich war. Viele verschiedene Definitionen waren in Gebrauch, was den Nutzungsgrad
als Austauschformat wieder einschränkte. So übernahm Charles Goldfarb die Leitung der
Gruppe des American National Standard Institute (ANSI). Diese machte sich an die Arbeit, durch eine Verallgemeinerung der neuen Sprache, das gesteckte Ziel eines Austauschformates zu erreichen. Die wichtigste Neuerung dabei war die Document Typ Definition
(DTD), die getrennt vom eigentlichen Inhalt die Form des Dokumentes vorgab. Außerdem
ermöglichte sie die freie Namensgebung für tags und eine damit verbundene größere Übersicht im Dokument. Ab 1984 wurde das Projekt neu organisiert und auch die Organization
for Standardization (ISO) interessierte sich für den zu entwickelnden Standard. So versuchte man mit zwei getrennten Gruppen die Entwicklungsarbeit zu forcieren. Damit dies ohne
Überschneidungen in der Arbeit der beiden Gruppen funktionierte, wurde Charles Goldfarb der organisatorische Leiter. Er sorgte für die Abstimmung und gab Hilfestellung, bis
1986 endlich das Ziel erreicht war und SGML als ISO-Standard 8879 veröffentlicht wurde.
4.1 Beispiel
Im Folgenden wird eine SGML- DTD für eine Notiz, wie sie bei der Terminverwaltung
verwendet wird, gezeigt:
<!-<!ELEMENT
<!ELEMENT
<!ELEMENT
<!ELEMENT
<!ELEMENT
Element
notiz
titel
datum
absatz
wichtig
Minimum Inhaltsmodell
- - (titel, datum, absatz+)
- o (#PCDATA)
- o (#PCDATA)
- - (#PCDATA | wichtig)
- - (#PCDATA)
-->
>
>
>
>
>
Die erste Zeile dieser DTD ist nur ein Kommentar, die restlichen Zeilen sind Definitionen
von tags, gekennzeichnet durch ’!ELEMENT’. Die eigentlichen tags werden durch die Benennung, einer Zeichenkombination und dem Inhalt definiert. Dabei gibt die Zeichenkombination an, ob ein Anfangs- und Endtag (’- -’) oder nur ein Anfangstag (’- o’) vorhanden
sein muss. Der Inhalt besteht aus einer Zusammensetzung weiterer tag-Definitionen oder
einer Zeichenfolge (’#PCDATA’), gleich einer regulären Grammatik.
5 Umsetzung und Nutzen heutzutage
SGML schaffte zwar den Durchbruch nicht auf breiter Front, jedoch im Sektor des Verlagswesens und des Militärs. Die Komplexität von SGML und die damit verbundene, lange
Einarbeitungszeit sowie die hohen Kosten für die SGML- Tools bremsten die Verbreitung
enorm. Als 1989 Tim Berners-Lee den Grundstein für das World Wide Web am CERN (Europäische Organisation für Kernforschung) legte, entschied er sich für eine durch SGML
spezifizierte Anwendungssprache. Diese nannte er HyperText Markup Language (HTML)
und wird heute weltweit zur Darstellung von Internetseiten genutzt. Um die Komplexität
von SGML zu überwinden wurde seit 1997 die jüngste Form, die Extensible Markup Language (XML) entwickelt. Sie besteht aus einer kleinen Teilmenge von SGML, wodurch die
Einarbeitungszeit wesentlich kürzer und die Kosten für Software geringer wurden. XML
wird betreut durch das World Wide Web Consortium (W3C) unter der Leitung von Jon
Bosak. Sie findet heutzutage Anwendung in allen möglichen Bereichen und wird nicht nur
von großen Firmen sondern auch von kleinen Betrieben und sogar Privatleuten genutzt. So
schaffte XML das, was SGML nie wirklich gelang, der weltweite Durchbruch.
2
Literatur
[1] Goldfarb, Charles: The SGML Handbook. Oxford University Press (1990).
ISBN: 0-19-853737-9
[2] Goldfarb, C./Prescod, P.: The XML Handbook. Prentice Hall (2004).
ISBN: 0-13-049765-7
[3] Rieger, Wolfgang: SGML für die Praxis. Axel Springer Verlag (1995).
ISBN: 3-540-57534-0
[4] Born, Günter: Jetzt lerne ich XML. Markt und Technik Verlag (2005).
ISBN: 3-8272-6854-0
[5] Goldfarb, Charles: Charles Goldfarb’s SGML Source Homepage.
<http://www.sgmlsource.com>1
[6] Mintert, Stefan: Die Standard Generalized Markup Language, Leise Revolution.
<http://www.mintert.com/xml/leise-revolution/leise_revolution.
html>1
[7] Mintert, Stefan: Auszeichnungssprachen im World Wide Web.
<http://www.mintert.com/xml/mlweb/MarkUpLang.html>1
[8] Wikipedia:
[8.1.] Charles Goldfarb:
<http://de.wikipedia.org/wiki/Charles_Goldfarb>1
[8.2.] SGML:
<http://en.wikipedia.org/wiki/SGML>1
[8.3.] SGML:
<http://de.wikipedia.org/wiki/SGML>1
[8.4.] GML:
<http://en.wikipedia.org/wiki/Generalized_Markup_Language>1
[8.5.] HTML:
<http://en.wikipedia.org/wiki/Hypertext_Markup_Language>1
[8.6.] HTML:
<http://de.wikipedia.org/wiki/Hypertext_Markup_Language>1
[8.7.] XML:
<http://en.wikipedia.org/wiki/XML>1
[8.8.] XML:
<http://de.wikipedia.org/wiki/XML>1
[8.9.] Markup Language:
<http://de.wikipedia.org/wiki/Markup_language>1
[8.10.] Auszeichnungssprache:
<http://de.wikipedia.org/wiki/Auszeichnungssprache>1
[8.11.] Reguläre Ausdrücke:
<http://de.wikipedia.org/wiki/Regul%C3%A4re_Ausdr%C3%BCcke>1
1 Links
überprüft am 22.12.2005
3

Documentos relacionados