Sitemetatags Producte Schnell Info Toppositionen Lieferung Kontakt Referenz
 

 

Mit RDF können Informationen über Web-Seiten im World Wide Web zugänglich gemacht werden, die nicht auf der eigentlichen Webseite enthalten sind. Die Metadaten können dabei Informationen wie beispielsweise Titel, Name oder Copyright, enthalten. RDF besteht sowohl aus einem grafischen Modell zur Repräsentation der erzeugten Metadaten, wie auch aus einer XML-Syntax mit gleichem Ziel.

RDF-Modell

Das eigentliche RDF-Modell besteht aus den drei Objekttypen: Ressourcen, Eigenschaftselementen und Objekten. Jeweils eine Ressource, eine Eigenschaft und ein Objekt bilden zusammen ein so genanntes RDF-Tripel. Durch die Kombination, bei der man auch von Subjekt, Prädikat und Objekt spricht, wird eine Aussage über ein bestimmtes Objekt innerhalb einer Domäne gemacht, was auch als ein so genanntes Statement bezeichnet wird. Daher ist ein RDF-Modell, welches eine beliebige Anzahl an Subjekten, Prädikaten und Objekten besitzt, immer eine Sammlung von Statements, wodurch der gewünschte Netzwerkeffekt entsteht.

Innerhalb von RDF-Dokumenten werden Tripel in einer einfachen Art und Weise dargestellt, so dass es sowohl für Computer als auch für Menschen möglich ist, diese zu lesen und zu verstehen. Allgemein dargestellt hat ein RDF-Tripel den folgenden Aufbau:

subjekt, prädikat, objekt

Hyperlink

Typisches Anzeichen für einen Hyperlink: Ein Mauszeiger in Form einer Hand über Text mit Her-
vorhebung (Unterstrich)

Als Hyperlink ['ha?p?l??k], auch kurz Link (engl. für Verknüpfung, Verbindung, Verweis), bezeichnet man einen Verweis auf ein anderes Dokument innerhalb eines Hypertextes, der automatisch durch das „Hypertextsystem“ verfolgt werden kann.

Das Konzept von Hyperlinks entspricht funktional dem Querverweis oder der Fußnote aus der konventionellen Literatur, bei der das Ziel des Verweises allerdings in der Regel manuell aufgesucht werden muss.

Man spricht von einem verlinktem Dokument, wenn es mindestens einen Hyperlink enthält, der auf ein Drittes gerichtet ist.

World Wide Web

Hyperlinks sind ein charakteristisches Merkmal des Internet. Sie sind im heutigen World Wide Web ein elementares Element; so etwas wie das „Salz in der WWW-Suppe“. Mit ihrer Hilfe lassen sich Webseiten auf andere HTML-Seiten verbinden, die entweder auf demselben Rechner liegen oder am anderen Ende der Welt darauf warten aufgerufen zu werden. Eingebunden werden Hyperlinks meist mittels der standardisierten Auszeichnungssprache „HTML“.

Die Syntax lautet dabei folgendermaßen:
<a href="http://www.example.com">Linktext</a> würde einen Hyperlink auf die Internetseite http://www.example.com anlegen;
Linktext ist dabei der Text, der für den Benutzer (User) auf der Seite als Weiterleitung auf die entsprechende Internetseite angezeigt wird.

Ziel eines solchen Links kann eine andere Datei (Webseite, Bild, Audio- o. Videodatei etc.) oder ein dynamisch erstelltes Dokument sein. Ein Link enthält die Adresse des Ziels, in der Regel als URL. Meistens definiert ein Link zusätzlich, wie er für den Benutzer dargestellt werden soll. Bei Hypertext-Dokumenten wird dazu fast immer in dem Link ein Linktext angegeben, der dem Benutzer angezeigt wird.

Die Interpretation des Aufrufs eines Links übernimmt typischerweise ein Webbrowser. Allerdings können Hyperlinks kann auch von Softwareprogrammen, die solche Verlinkungen erkennen, automatisch gefolgt werden.

Bei den Linkverweisen im Web handelt es sich oft um eine sehr einfache Implementation von Hyperlinks; im Gegensatz zu früheren Systemen sind diese Weblinks unidirektional, d. h. das Ziel des Links weiß nichts darüber, dass ein Link auf ihn zeigt; wird das Zieldokument umbenannt oder gelöscht, wird der Link nicht automatisch korrigiert entsteht ein sogenannter „Toter Link“.

Bei grafischen Links wird der Linktext durch eine Grafik ersetzt. Genauso kann auch ein eingebettes Objekt, wie z. B. eine „flash-Animation“ verwendet werden. In jedem Fall gleich bleibt aber die Möglichkeit, über „alt tags“ - HTML für Altenativtext - für den Betrachter sinnvolle Hinweise oder aber Schlüsselwörter für Suchmaschinen bzw. den aufrufenden Computer einzubinden.

Internetlinks können auch auf andere als die vom Benutzer erwartete Adresse führen können. Zu solchen Zwecken erstellte Weiterleitungen (engl. redirects) führen dann entwder auf eine weitere Webseite oder zu anderen Zielen (Dateien). Dies kann unter Umständen auch so geschehen, dass es dem Anwender verborgen bleibt. Mehrfache Weiterleitungen sind ebenfalls möglich. Weiterleitungen werden häufig auch verwendet, wenn veraltete Hyperlinks vorhanden sind.

Wikis

Auch die einzelnen Seiten eines Wikis sind mit Hyperlinks, den so genannten WikiLinks miteinander verbunden. Hier wurde ebenfalls eine relativ einfache Implementation von Hyperlinks realisiert, allerdings kennt die Wikipedia Rückverweise (so genannte Backlinks), die Links sind damit zumindest partiell bidirektional, und es werden von den internen Links innerhalb eines Wikis auch noch verschiedene andere Linkarten unterschieden, beispielsweise solche auf externe Dokumente.

Auch die „Wikipedia“ ist ein Wiki; hier wird zur Kennzeichnung eines Links eine eigene Syntax verwendet:
[[Ziel des Links]] würde einen Hyperlink auf die fiktive Wikipedia-Seite Ziel des Links anlegen;
Hyperlinks, die aus dem internen Artikelnetz der Wikipedia auf externe Webseiten verweisen – meist Weblinks genannt –, werden ähnlich angelegt: [http://Ziel.des.externen.Links] würde einen Hyperlink auf die fiktive externe Website Ziel.des.externen.Links anlegen.

Andere Wiki-Systeme generieren Hyperlinks durch eine andere Syntax, beispielsweise durch das so genannte CamelCase.

Andere Hypertext-Systeme

Auch andere Hypertext-Systeme setzen Hyperlinks ein. Die Verwendung von Hyperlinks in diesen anderen Systemen wird im Artikel Hypertext beschrieben.

Rechtliches

Tim Berners-Lee, der „Erfinder“ des World Wide Web, geht in Analogie zu Fußnoten und Querverweisen in der wissenschaftlichen Literatur davon aus, dass das bloße Vorhandensein eines Hyperlinks keine Rechtsverletzung darstellen kann; der Autor eines Textes mache sich durch Anbringen einer Fußnote oder eines Querverweises nicht automatisch den Inhalt des referenzierten Dokuments zueigen. Das Prinzip des wechselseitigen Verweisens sei für wissenschaftliches Arbeiten grundlegend; wäre dieses Verweisprinzip illegal, würde dies jegliches wissenschaftliche Arbeiten in unserem heutigen Verständnis unmöglich machen (vgl. Auf den Schultern von Giganten).

Diese Auffassung teilen nicht alle Gerichte, obwohl die Rechtsliteratur selbst intensiv das Verweisprinzip einsetzt. Bisher hat sich noch keine einheitliche Rechtsprechung herausgebildet, jedoch kann in Deutschland das Anbringen eines Hyperlinks auf einer Website kostenpflichtig abgemahnt werden; dabei werden in der Regel hohe Streitwerte im Bereich von 50.000 bis 250.000 Euro angesetzt, woraus in jedem Fall hohe Anwaltskosten in der Größenordnung von mehreren tausend Euro resultieren. Die Policen von Rechtsschutzversicherungen decken derartige Rechtsstreitigkeiten grundsätzlich nicht ab.

Bislang gab es im bundesdeutschen Raum mehrere Urteile, die Websitebetreiber, deren Sites auf inkriminierte Seiten linkten, wegen Beihilfe zu vielerlei Straftaten verurteilten. Deshalb wurde es von einer Vielzahl von Website-Betreibern als ratsam angesehen, sich auf der eigenen Site ausdrücklich von den Inhalten zu distanzieren. (Das oft zitierte Urteil des LG Hamburg, Aktenzeichen 312 O 85/98, war auf Grund eines Vergleiches nicht rechtskräftig, und das Gericht hatte auch nie dazu geraten, sich von verlinkten Inhalten zu distanzieren.) Mittlerweile scheint die Rechtsprechung hiervon abzurücken, wie neueste Urteile zeigen. Beispielsweise hatte ein Websitebetreiber im Rahmen einer Dokumentation unter anderem auf Sites gelinkt, die die Staatsanwaltschaft als rechtsextrem und gewaltverherrlichend wertete. Mittlerweile wurde der Websitebetreiber von einer höheren Instanz freigesprochen.[1]

Visualisierung

Gerichteter zyklischer Graph

In der Regel lassen sich kleine oder große verlinkte Netze als gerichtete zyklische Graphen abbilden, in denen Hyperlinks mit Hilfe von Kanten und Ecken bzw Knoten von oder zu referenzierten Dokumenten dargestellt werden. Interpretiert man das nebenstehende Bild als verlinktes Netz, enthält beispielsweise das Dokument B einen Hyperlink auf das Dokument C. Der Pfeil von der Ecke B zu der Ecke C (eine gerichtete Kante des Graphen) stellt den Hyperlink dar. Von der Ecke B gelangt man über C, E und D wieder zurück zu B (Zyklus), was in diesem Fall bedeutet, dass man von B ausgehend durch Folgen der entsprechenden Hyperlinks wieder zu dem Ausgangspunkt, dem Dokument B, gelangt.

Hypertext

Hypertext ist eine multi-lineare Organisation von Objekten, deren netzartige Struktur durch logische Verbindungen (so genannte Hyperlinks) zwischen Wissenseinheiten (Knoten, z. B. Texten oder Textteilen) hergestellt wird. Hypertext ist eine Anwendung des Verweis-Knoten-Konzepts.

Die Begriffe Hypertext und Hypermedia werden meistens synonym benutzt; Hypertext betont dabei jedoch den textuellen Anteil, Hypermedia dagegen mehr den multimedialen. Beispiele für Hypertext sind Wikipedia-Artikel wie dieser, aber auch das World Wide Web selbst.

Nutzen

Hypertexte bieten gegenüber der linearen Informationsdarstellung den Vorteil, eine größere Komplexität redundanzfrei oder zumindest vergleichsweise redundanzarm vermitteln zu können. Die assoziative Struktur eines Hypertextes entspricht eher der Funktionsweise des menschlichen Denkens als lineare Texte. Dies hat seine Ursache in der Annahme, dass unser vernetztes Denken ähnlich abläuft wie die Strukturen eines Hypertextes. Schulmeister verwendet dafür in diesem Zusammenhang den Verweis auf die „kognitive Plausibilitätshypothese“[1]

Probleme

Ein Problem aller Hypertexte ist das gezielte Auffinden von Informationen (Information Retrieval) in einem nichtlinearen Text. Während literate Menschen über Jahrhunderte in der Rezeption von linearen Texten geschult worden sind, beginnt man erst heute den Umgang mit komplexen Hypertexten zu erlernen.

Ein weiteres Problem ist das Navigieren in Hypertexten, da häufig eine vom Autor vorgegebene Lesestruktur (z. B. Guided Tour) fehlt; als Folge eines Übermaßes an Querverweisen können so ein so genannter Information Overload, die Überflutung mit ungeordneten Informationen und eine Desorientiertheit im weit verzweigten Netz von Texten (Lost in Hyperspace) entstehen.

Die Lesegewohnheiten spielen hier jedoch eine wichtige Rolle. So haben Jüngere oft weniger Schwierigkeiten damit, das Lesen eines Textes zu unterbrechen, um einem Querverweis zu folgen.

Problemlösungsansätze hierzu sind virtuelle Mindmaps und Web-Ontologien.

Erst in Ansätzen gelöst ist das Problem der Visualisierung von Hypertexten, also die grafisch aufbereitete Darstellung der typischerweise netzwerkförmigen und daher nicht hierarchisch präsentierbaren Struktur eines Hypertextes (siehe auch Hyperbolic Tree).

Anwendungen

Die Wikipedia und das gesamte World Wide Web sind Beispiele für einen komplexen Hypertext.

Auch viele Software-Dokumentationen, Hilfe-Texte und Nachschlagewerke wie die elektronischen Ausgaben des Brockhaus und der Encyclopædia Britannica sind als Hypertext konzipiert.

Geschichte und Entwicklung

Hypertextuelle Strukturen sind seit Jahrhunderten bekannt; die im Aufschreibesystem der Neuzeit ausdifferenzierten Erschließungshilfen für lineare Texte wie Inhaltsverzeichnisse, Indizes, Querverweise und Fußnoten sowie jegliche Verweissysteme entsprechen funktional einem Hypertext. Der Unterschied besteht darin, dass zum einen die Verweisziele nicht vor Ort präsent sein müssen, und zum anderen, dass das Verfolgen der Verweise nicht mechanisiert bzw. automatisiert ist. Als Vorläufer heutiger digitalisierter Hypertexte gilt daher beispielsweise Agostino Ramellis Bücherrad aus dem 15. Jahrhundert und Roussels Lesemaschine, eine Art Wechselrad für Notizzettel, siehe Zettels Traum von Arno Schmidt. Literaturgeschichtlich prominent ist James Joyce’ vertracktes Werk Finnegans Wake, das an semantische Netze des Hypertext erinnert.

Das moderne Hypertext-Konzept wurde erstmals von Vannevar Bush im Jahr 1945 in einem Artikel As We May Think im Journal The Atlantic Monthly erwähnt. Er sprach darin über ein zukünftiges System Memex (für Memory Extender), das das Wissen eines bestimmten Gebietes elektronisch aufbereitet leicht zugänglich darstellen kann. Die Kernidee des Konzepts ist zum einen, dass das Verfolgen von Verweisen mit elektronischer Hilfe erleichtert wird und zum anderen, dass Bücher und Filme aus einer Bibliothek verfügbar gemacht und angezeigt werden können. Die Idee von Hypertext ist also von Anfang an mit alten Utopien von der „universellen Bibliothek“ verbunden (siehe auch Bibliotheksutopie). Daher ist es kein Zufall, dass der Herausgeber der Universalklassifikation Paul Otlet als frühester Pionier des Hypertext gilt und diese Universalsprache völkerverbindend einsetzen wollte. Er gilt nicht von ungefähr als Mitbegründer des Völkerbunds, aus dem die UNO hervorging.

Ein Beispiel für ein hypertext-artiges Gedicht sind die Cent mille milliards de poèmes von Raymond Queneau (1961).

Der Gesellschaftswissenschaftler Ted Nelson (Projekt Xanadu) prägte den Begriff „Hypertext“ im Jahr 1965.

Eines der ersten Hypertextsysteme, das einer größeren Gruppe zugänglich war, war HyperCard der Firma Apple, das mit den Apple-Macintosh-Computern ausgeliefert wurde.

Das heute am weitesten verbreitete Hypertext-System ist der Internet-Dienst World Wide Web (WWW), obwohl ihm einige wichtige Funktionen früherer Hypertextsysteme fehlen. So ist zum Beispiel das Problem der so genannten toten Links (engl. dead links oder dangling links) im WWW ungelöst. Auch die Implementierung der Uniform Resource Identifiers (URIs) ist über die im Web gebräuchlichen URLs nur unvollständig erfüllt. Im Gegenzug erlaubt das WWW aber auch das Einbinden von nichtsprachlichen Datentypen. Dadurch ist es, obwohl auf Hypertext beruhend, streng genommen ein Hypermedia-System. Die Sprache, in der die Texte des World Wide Web beschrieben werden, heißt Hypertext Markup Language; Web-Dokumente werden von Webtextern und Webdesignern konzipiert und erstellt.

Im Folgenden werden die Bestandteile der RDF-Tripel näher erklärt:
Ressourcen (Subjekte) sind alle Dinge, die durch RDF-Ausdrücke beschrieben werden. Dies können einzelne Web-Seiten, Sammlungen von Web-Seiten, aber auch Objekte, auf die nicht über das Web zugegriffen werden kann, wie z.B. Bücher, Gemälde oder Computer sein. Das Wichtige dabei ist, dass die Ressource eine eindeutige Bezeichnung, beispielsweise durch eine URI, erhält. In der grafischen RDF-Modellierung werden Ressourcen durch eine Ellipse symbolisiert. Jede Ressource wird durch ihre Eigenschaften beschrieben.
Eigenschaftselemente (Prädikate) haben in der sprachlichen Grammatik die Aufgabe, etwas über das Subjekt zu erläutern. Beispielsweise sagt in dem Satz „die Firma verkauft Batterien“ das Prädikat aus, was die Firma – das Subjekt – und damit die Ressource – macht, nämlich verkaufen. Bezogen auf RDF gibt ein Eigenschaftselement Auskunft über die ihm zugeordnete Ressource. Des Weiteren stellt das Eigenschaftselement einen Bezug zum Objekt her, verbindet damit eine Ressource mit einem Objekt. Prädikate werden grafisch durch eine benannte Kante dargestellt, die eine Ressource und deren Wert miteinander verbindet.
Objekte beschreiben den Wert eines Prädikats. Im obigen Beispielsatz ist das Objekt Batterien. Dieses wird durch das Eigenschaftselement näher erläutert. Es existieren mehrere Möglichkeiten zur Darstellung von Objekten. Literale sind dabei die einfachste Art, da sie lediglich einen Wert zugeordnet bekommen. Literale werden in der grafischen Modellierung als Rechtecke dargestellt. Ein Objekt kann neben einem Literal auch eine Ressource oder eine leere Ressource sein. Diese Möglichkeiten werden in der folgenden Aufzählung näher beschrieben:
Ressourcen können auf weitere Ressourcen verweisen, beispielsweise um Redundanzen zu vermeiden.
Leere Knoten werden verwendet, wenn eine bestimmte Ressource noch nicht existiert oder wenn eine Ressource keinen Namen hat.
Literale enthalten Werte.

Der RDF-Graph

Die RDF-Entwicklungsgruppe am W3C entschied sich dafür, den RDF-Graphen als Standardentwicklungsmethode zu verwenden, da ein RDF-Graph, wie im folgenden Beispiel gezeigt wird, sehr einfach für Menschen zu lesen ist. Die folgende Abbildung zeigt ein einfach modelliertes Tripel in der vorgestellten grafischen Syntax, welches man auch als gerichteten Graphen (Directed Graph) bezeichnet. Folgende Grafik wurde mit dem W3C RDF Validator aus dem weiter unten angegebenen Beispiel erzeugt. Dargestellt sind zwei Tripel mit demselben Subjekt „http://de.wikipedia.org/wiki/Resource_Description_Framework“.

 

Der RDF-Graph in der obigen Abbildung sagt aus, dass die Ressource – in diesem Fall der vorliegende Artikel – einen Titel namens „Resource Description Framework“ hat und einen Publisher, die Wikipedia. Zur Modellierung des Objektes wird ein Literal verwendet. Dabei muss beachtet werden, dass in einem RDF-Netz die Wikipedia wiederum als Ressource dargestellt werden kann, die auch noch (sehr) viele andere Statements hat.

Die Besonderheit des RDF-Modells liegt zum einen darin, dass über die als Prädikat verwendeten Ressourcen (Properties) auch wiederum Aussagen getroffen werden können. Dadurch lassen sich Properties selbst mit RDF beschreiben und als Metadatenformat ablegen. Andere RDF-Angaben können diese Vokabulare durch Referenzierung weiterverwenden. Ein prominentes Beispiel dafür ist die Repräsentation von Dublin Core in RDF.

Zum anderen bilden RDF Statements selbst Ressourcen, auf die mit weiteren Statements verwiesen werden kann. Diese Technik der Aussagen über Aussagen wird als Reification bezeichnet.

Zusätzlich enthält RDF vordefinierte Datentypen für Listen und Mengen, um Gruppen von Ressourcen zusammenzufassen. Ressourcen, die keinen expliziten URI haben, sondern nur zur Gruppierung von anderen Objekten dienen, werden in der Regel durch so genannte „blank nodes“ modelliert. Ein Beispiel dafür ist die Zuweisung eines Namens, der aus separaten Zeichenketten für Vor- und Nachnamen besteht.

RDF-Syntax

Das RDF-Modell (der RDF-Graph) ist unabhängig von einer speziellen Darstellungsform. Am verbreitetsten ist die Repräsentation in XML. Eine kürzere Syntax ist die von Tim Berners-Lee entworfene Notation 3 (N3). Für die Speicherung von RDF in Datenbanken und Datenstrukturen gibt es verschiedene Konzepte, da ein reines Ablegen der N-Tripel in einer Tabelle nicht sehr effizient ist.

Abfrage von RDF-Graphen

Zur Suche in RDF-Daten gibt es verschiedene Abfragesprachen. Ein Vergleich von diversen RDF-Abfragesprachen zeigt, dass die Standardisierung hier noch nicht sehr weit fortgeschritten ist. Mit der SPARQL Query Language, vorgeschlagen vom W3C (2006-02-22), scheint sich jedoch ein neuer Standard auf diesem Gebiet zu etablieren.

Ein Vertreter einer RDF-Abfragesprache - welcher auch im Jena Framework verfügbar ist - ist die RDF Query Language (RDQL), welche der Form nach stark an SQL erinnert. Die prinzipielle Syntax ist:
SELECT {Liste von Variablen}
WHERE {Vergleichsmuster zum Graphen}
AND {Filter}
USING {Namespace-Mappings}

Im folgenden Beispiel wird eine konkrete Abfrage gezeigt.

Beispiel

Nehmen wir zur Erläuterung die folgende Aussage über diesen Artikel (wobei Titel und Herausgeber nach Dublin Core definiert sind): ‚http://de.wikipedia.org/wiki/Resource_Description_Framework‘ hat den Titel ‚Resource Description Framework‘ und den Herausgeber ‚Wikipedia - Die freie Enzyklopädie‘.

Diese Aussage wird in RDF mit zwei Tripeln ausgedrückt. In N3 (das has dient hier nur der besseren Lesbarkeit):
<http://de.wikipedia.org/wiki/Resource_Description_Framework> has <http://purl.org/dc/elements/1.1/title> "Resource Description Framework" .
<http://de.wikipedia.org/wiki/Resource_Description_Framework> has <http://purl.org/dc/elements/1.1/publisher> "Wikipedia - Die freie Enzyklopädie" .

In RDF/XML lässt sich die Aussage so ausdrücken:
<?xml version="1.0" encoding="UTF-8" ?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://de.wikipedia.org/wiki/Resource_Description_Framework">
<dc:title>Resource Description Framework</dc:title>
<dc:publisher>Wikipedia - Die freie Enzyklopädie</dc:publisher>
</rdf:Description>
</rdf:RDF>

Nun soll auf dem oben gezeigten Graphen eine Abfrage mit RDQL (RDF Data Query Language) durchgeführt werden, die herausfindet, wie der Titel einer vom Herausgeber „Wikipedia - Die freie Enzyklopädie“ definierten Ressource lautet.
SELECT
?title

WHERE
(?res, <dc:publisher>, ?pub),
(?res, <dc:title>, ?title)

AND
?pub eq 'Wikipedia - Die freie Enzyklopädie'

USING
rdf for <http://www.w3.org/1999/02/22-rdf-syntax-ns#>,
dc for <http://purl.org/dc/elements/1.1/>

Im WHERE-Teil werden die Aussagen gematcht, die Herausgeber bzw. Titel-Eigenschaften besitzen. Im AND-Teil werden dann noch die Knoten herausgefiltert, deren Herausgeber-Wert eben das Literal Wikipedia - Die freie Enzyklopädie hat. Das Ergebnis ist eine Tabelle mit genau einem Eintrag (Bindung der Variable ?title) mit dem Wert Resource Description Framework.

Anwendung

RDF ist unter anderem eine Möglichkeit, Informationen über Dokumente im World Wide Web und andere Ressourcen zu repräsentieren. Diese Angaben über andere Informationen bezeichnet man als Metadaten. Dazu gehören beispielsweise Titel, Autor, Änderungsdatum und Lizenzinformationen oder die Verfügbarkeit eines Dokumentes.

Ganz konkret ermöglicht z.B. Inkscape das Einbetten von RDF in SVG-Bilder.

Geschichte

Als Vorläufer von RDF kann das Meta Content Framework (MCF) in XML gelten, eine Sprache, die 1995-1997 von Ramanathan V. Guha entwickelt und nach seinem Wechsel zu Netscape im Juni 1997 beim W3C eingereicht wurde.[2]. Im Rahmen der Browserkriege war MCF auch eine Reaktion auf das Channel Definition Format von Microsoft. Anstatt MCF den Vorzug zu geben, entschloss man sich beim W3C eine allgemeine Sprache zur Formulierung von Metadaten zu entwickeln, die den Namen RDF tragen sollte.[3] Der erste RDF-Standard wurde im August 1997 als Entwurf vorgelegt[4] und im Februar 1998 als Empfehlung veröffentlicht[5]. Jedoch wurde diese zur Überarbeitung zurückgezogen, die 2004 fertiggestellt wurde. Ab 1999 wurde mit der Entwicklung von RDF-Schema begonnen

 

Linktext

Als Linktext oder Verweistext bezeichnet man Text, der in einem Hypertext-Dokument als Hyperlink fungiert. Der Text ist mit einem Verweis auf eine Zieladresse (Link) verbunden. Linktext und Zieladresse werden bei einem Hyperlink separat angegeben.

Beispiel für HTML:
<a href="Zieladresse">Linktext</a>

Im Dokument wird dann nur der beschreibende Linktext angezeigt, die Zieladresse bleibt im Textfluß verborgen. Bei den meisten Webbrowsern wird sie beim Überfahren mit dem Mauszeiger in der Statusleiste oder als Tooltip angezeigt.

Der Linktext wird meist farbig dargestellt, vorzugsweise so, dass er sich vom normalen Textbild deutlich abhebt. Bereits besuchte Links werden oft in einer weiteren Farbe angezeigt.

Einstellung

Abhängig von der Voreinstellung des verwendeten Webbrowsers oder Programms, das Hyperlinks unterstützt, ist der Linktext unterschiedlich gefärbt, mitunter auch unterstrichen oder anderweitig ausgezeichnet (versal, fett, kursiv, überstrichen usw.). Der Anwender kann normalerweise die Einstellung nach seinen eigenen Vorstellungen ändern.

Viele Webbrowser lassen sich auch so einstellen, dass die Auszeichnungsangaben der anzuzeigenden Seiten in jedem Fall ignoriert werden. Das kann sinnvoll sein, wenn der Besucher die selbstgewählten Präferenzen den unter Umständen schlecht lesbaren Vorgaben des Webdesigners vorzieht.

Siehe auch: Barrierefreies Internet

HTML

Neben der standardmäßigen oder benutzerspezifischen Voreinstellung kann die zugeordnete Farbgebung auch durch HTML-Code beeinflusst werden, zum Beispiel:
<body bgcolor="#XXXXXX" text="#XXXXXX"
link="farbname" vlink="#XXXXXX" alink="#XXXXXX" />

Erläuterungen:
Attribute:
bgcolor – Hintergrundfarbe
text – Schriftfarbe
link – Farbe für Links noch nicht besuchter Ziele
vlink – Farbe für Links bereits besuchter Ziele
alink – Farbe für aktivierte Verweise
Werte:
"#XXXXXX" ist eine hexadezimal notierte RGB-Farbe (zum Beispiel #FF0000, #003399, #00FF00)
"farbname" ist die Alternative mit einem erlaubten Farbnamen (zum Beispiel red, navy, green)

Diese Methode ist allerdings veraltet. In letzter Zeit wird vermehr CSS für die Gestaltung von HTML-Seiten und damit auch für Links verwendet.

Cascading Style Sheets

Mit CSS lassen sich die Darstellungseigenschaften von Links noch flexibler beeinflussen, zum Beispiel:
a:link { color: #EE0000; text-decoration: none; }
a:visited { color: #EEAAAA; text-decoration: none; }
a:focus { color: #EE0000; text-decoration: none; background: #FFFF99; }
a:hover { color: #EE0000; text-decoration: none; background: #FFFF99; }
a:active { color: #0000EE; background: #FFFF99; }

Erläuterungen:
a – einleitendes Element, gilt für Links (engl. anchor)
Hinter dem Doppelpunkt (Kolon) steht das festgelegte Schlüsselwort:
:link – für Attribute der Links noch nicht besuchter Ziele
:visited – für Attribute der Links bereits besuchter Ziele
:focus – für Verweise, die den Fokus erhalten, zum Beispiel durch „Durchsteppen“ mit der Tabulator-Taste
:hover – für Attribute der Links beim Überfahren mit dem Mauszeiger
:active – für Attribute der aktivierten (angeklickten) Links während des Ladens
In geschwungenen Klammern „{ ... }“ stehen dahinter die konkreten Formatierungsanweisungen.

Die entsprechenden HTML- oder CSS-Auszeichnungen können auch dynamisch erzeugt werden, zum Beispiel mit PHP, Java (serverseitig) oder JavaScript (clientseitig).

Wiki

In der Wiki-Syntax, die auch Wikipedia verwendet, ist die Zieladresse oft bewusst mit dem Linktext identisch:
[[Zieladresse]] wird dann angezeigt als Zieladresse.

Es ist aber auch möglich, mit der so genannten Pipe-Syntax explizit einen Linktext anzugeben:
[[Zieladresse|Linktext]] wird dann angezeigt als Linktext, verweist aber tatsächlich auf Zieladresse.

Die Angaben dienen nur der Bequemlichkeit und besseren Übersicht bei der Eingabe und werden für den Webbrowser entsprechend umgesetzt.

Zugängliche Linktexte

Für den Linktext sollte ein möglichst aussagekräftiger Text verwendet werden. Links, die mit „klick mich“ oder „hier“ beschriftet sind, geben den Nutzer keine Auskunft darüber, welche Seite verlinkt wurde. Das spielt vor allem für blinde Menschen eine Rolle. Werden die Links mit der Tabulatortaste durchgeblättert und vom Screenreader vorgelesen, kann der Besucher nicht erkennen, wohin der Link führt. Außerdem sollten alle Links mit dem selben Linktext auch auf die selbe Seite führen.

 

Überblick
Das wesentliche Merkmal von Webseiten ist, dass sie Verweise (Hyperlinks) auf andere Webseiten enthalten und somit einen Hypertext darstellen. Jede Webseite hat mind. eine Adresse (URL), über die sie aufgerufen werden kann.
Die Gesamtheit der Webseiten einer Organisation wird als Website, Webpräsenz, Webauftritt oder unzutreffenderweise oft auch als Homepage oder Internetpräsenz bezeichnet. Meistens entspricht sie der Gesamtheit der Webseiten, die unter einer Domain erreichbar sind.
Webseiten können statische (feste) oder dynamische (d. h. die Inhalte werden bei jedem Aufruf vorzugsweise basierend auf dem Ergebnis einer Datenbankanfrage neu generiert) Inhalte haben und ggf. aus mehreren Segmenten – sogenannte (Frames) – zusammengesetzt werden.
Webseiten bestehen zumeist aus strukturiertem Text, in dem Bilder und andere Multimediaelemente eingebunden sein können. Gleiche Inhalte werden möglicherweise verschiedenenartig dargeboten, z. B. Druckversion oder Textversion (engl. text-only). Webseiten werden meist aus dem Internet oder einem Intranet geladen, können aber auch auf einem lokalen Speichermedium, zum Beispiel einer Festplatte, abgelegt sein.

Um Webseiten zu erstellen, kommt hauptsächlich die Auszeichnungssprache HTML zur Anwendung, was jedoch langsam von XHTML abgelöst wird. Zusätzliche Technologien wie CSS und JavaScript werden in vielen Webdokumenten verwendet, um die optische Darstellung im Webbrowser zu beeinflussen oder Interaktivität hinzuzufügen.

Geschichte

Die erste Webseite wurde am 13. November 1990 von Tim Berners-Lee auf einem NeXT-Rechner verfasst und veröffentlicht – einen Tag, nachdem dieser gemeinsam mit Robert Cailliau ein neugefasstes Konzept für ein weltweites Hypertext-Projekt veröffentlicht hatte.

Dynamische Webseiten

Im Gegensatz zu statischen Webseiten, die technisch eine einfache Datei auf dem Webserver darstellen, werden Seiten auch häufig dynamisch im Moment der Anforderung erzeugt. Das ist dann sinnvoll, wenn eine Webseite sehr aktuelle Informationen wie z. B. Börsenkurse oder das Wetter von morgen enthalten sollten. In diesem Fall führt der Webserver ein Programm aus, das vorher spezifisch für diese Aufgabe entwickelt wurde. Es trägt die Daten z. B. aus Datenbanken zusammen und erstellt das HTML-Dokument. Dieses wird dann vom Webserver an den Browser übertragen und beim Benutzer angezeigt.

Ein anderer Anwendungsfall ergibt sich aus dem Bedürfnis, auf Eingaben des Benutzers zu reagieren. Diese Eingabe kann z. B. ein Suchbegriff in einer Suchmaschine sein. Die Software der Suchmaschine erstellt anhand des Suchbegriffs eine Liste von passenden Links und erzeugt eine Webseite, die dem Benutzer diese Liste komfortabel darstellt.

Die Möglichkeit, Webseiten dynamisch in Abhängigkeit von Benutzereingaben und Datenbankinhalten zu generieren, machte das Web schnell zu einer universellen Plattform für alle Arten von Anwendungen. Die Vorteile liegen in Unabhängigkeit von Betriebssystemen und anderen Eigenschaften der Clients. Grundvoraussetzungen sind lediglich eine Netzwerkverbindung zum Server und ein Webbrowser.

Zum Generieren von dynamischen Webseiten kommt jedes Programm in Frage, das sich auf dem Serversystem ausführen lässt. Um die Programmierung zu vereinfachen, wurden jedoch Standards wie das Common Gateway Interface (CGI) eingeführt, um Webanwendungen auch unabhängig von der Art des Webservers zu machen. Die Mehrzahl von CGI-Anwendungen wurden und werden in der Programmiersprache Perl geschrieben. Aufgrund des rasant steigenden Bedarfes nach sehr leistungsfähigen Servern zum Betrieb von Web-Anwendungen entwickelten sich Technologien wie PHP, J2EE und .NET.

In der Praxis gibt es einen starken Trend, auf sog. Content-Management-Systeme (CMS) aufzusetzen. Oftmals wird allerdings der Erstellungsaufwand unterschätzt. Es drängen mehr und mehr, meist PHP und MySQL basierte, Lösungen in freier Software auf den Markt, die auch für ungeübte Programmierer schnell zu bedienen sind.

Siehe auch: DHTML, ASP, Servlet

Ein Content-Management-System (kurz CMS, übersetzt etwa Inhaltsverwaltungssystem), im Medienbereich auch: Redaktionssystem, ist ein Anwendungsprogramm, das die gemeinschaftliche Erstellung und Bearbeitung des Inhalts von Text- und Multimedia-Dokumenten (Content) ermöglicht und organisiert. Der darzustellende Informationsgehalt wird in diesem Zusammenhang als Content (Inhalt) bezeichnet. Der Benutzer sollte das System auch ohne Programmierkenntnisse sowie ohne Kenntnis von HTML oder XML bedienen können.

Aufbauschema eines (W)CMS

Besonderer Wert wird auf eine medienneutrale Datenhaltung gelegt. So sollte ein Inhalt auf Wunsch beispielsweise als PDF- oder als HTML-Dokument abrufbar sein können, indem die Formate zur Laufzeit aus der Datenbank generiert werden. Je nach Anwendung kann auch eine Rechteverwaltung von Bedeutung sein.

Serverseitiges CMS

Ein serverseitiges CMS braucht eine serverseitige Programmiersprache, die dort meistens in Verbindung mit einer Datenbank steht, welche die Daten direkt auf dem Server verwaltet. Dadurch können Daten weltweit direkt – in der Regel ist nur ein Browser erforderlich – über das Internet verwaltet werden (siehe WCMS oder auch WMS). Mehrere Nutzer können so eine Website verwalten. Viele serverseitige CMS können benutzerspezifische Berechtigungen verwalten. Serverseitige CMS sind für Websites jeglicher Größe geeignet.

Clientseitiges CMS

Clientseitige CMS werden meistens mit Hilfe eines Programms, das auf einem Rechner installiert wird, gesteuert. Die Daten werden dann (meistens mittels FTP) auf den Server hochgeladen. Deswegen ist keine serverseitige Programmiersprache nötig. Dadurch muss die Website immer von diesem einen Rechner verwaltet werden. Diese Variante ist insbesondere für Webseiten zu empfehlen, die mit großen Medien (z. B. Videos) arbeiten, da deren Bearbeitung über das Internet zu zeitaufwändig oder im Browser nicht möglich ist. Clientseitige CMS bieten meistens auch leistungsstarke Layoutfunktionen, mit denen eigene Seitentypen und Vorlagen (so genannte Templates) erstellt werden können.

Mischungen

Es gibt auch Systeme, die eine Mischung aus beiden Systemen sind. Möglich ist z. B. die Verwaltung der Website mit einem Programm, aber nur in Bereichen, für die man eine Berechtigung hat. Dadurch ist eine einfachere Bearbeitung möglich, z. B. direkt aus einem Textverarbeitungsprogramm durch Plug-ins oder einem eigenen Editor, der die Daten zum Server überträgt.

Dynamik & Statik

Weiterhin unterscheiden sich Systeme in der Art der Auslieferung der erstellten Seiten an den Nutzer.

Volldynamische Systeme

Volldynamische Systeme berechnen eine angeforderte Seite bei jedem Aufruf dynamisch neu. Vorteile: Die Seite ist immer aktuell; eine Personalisierung für den Surfer ist in der Regel sehr einfach oder sogar bereits vorhanden. Nachteile: Die Berechnung kann unter Last zu einer verzögerten Auslieferung der Seiten führen (Performance der Website).

Statische Systeme

Statische Systeme berechnen eine Website vollständig vor und legen diese im Dateisystem ab. Vorteile: Die Auslieferung der Seite ist äußerst schnell, da der Webserver nur statische Seiten ausliefern muss; auf dem Liveserver werden ausschließlich zur Veröffentlichung freigegebene Seiten gelagert, wodurch ein Zugriff auf nicht veröffentlichte Inhalte ausgeschlossen werden kann. – Nachteile: Informationen sind immer nur mit einem kleinen Zeitverzug exportiert verfügbar; soll eine Personalisierung (Portal) erfolgen, so muss dieses in der Regel extra angebunden werden.

Hybride Systeme

Hybride Systeme kombinieren die Vorteile der statischen und der volldynamischen Seitenerzeugung. Lediglich die Inhalte, die dynamisch aus einer Datenbank generiert werden müssen (z. B. News, Suchabfragen, personalisierte Inhalte, Shopdaten ...) werden zur Laufzeit aus der Datenbank erzeugt. Alle anderen Inhalte, die nicht laufend Änderungen unterzogen werden (z. B. Seitengerüst, Navigation, aber auch bestimmte Texte und Bilder ...) liegen statisch vor und sorgen damit für ein Optimum an Performance. Hybride Systeme erkennen anhand der Inhalte, welche Seiten statisch sind und welche dynamisch generiert werden müssen.

Halbstatische Systeme

Halbstatische Systeme generieren den Inhalt so, dass dieser statisch ist, aber gleichzeitig auch dynamisch, d.h. es werden alle Daten direkt in statisch generierten Dateien gespeichert, die dann bei Abruf sofort ausgegeben werden. Die dynamischen Inhalte werden dann generiert, wenn ein Code in der Programmsprache in die Datei eingebunden wird. Die abgefragte Seite wird also direkt ausgegeben und während der Ausgabe generiert.

WCM wird heute als Bestandteil übergreifender Enterprise-Content-Management-Systeme (ECM) betrachtet. CMS dagegen wird, zumindest außerhalb Deutschlands, allgemein für Content Management Systeme benutzt und beschränkt sich nicht nur auf Web-Content-Management-Systeme (WCMS) oder Redaktionssysteme.

Gemischte Systeme

Oft enthalten Webseiten neben umfangreichem Content auch Produkte und Dienstleistungen, die direkt verkauft werden sollen. Das Web stellt damit sowohl einen Kommunikations- als auch einen Distributionskanal dar. Für die Erstellung und Verwaltung von Inhalten sowie den eigentlichen Online-Verkauf können jeweils getrennte Systeme eingesetzt werden. Einfacher und kostengünstiger ist jedoch der Einsatz eines kombinierten Systems, mit dem Kommunikations- und Distributionsprozesse eines Unternehmens mit einer einzigen Software erledigt werden können.

Die Hypertext Markup Language (HTML, dt. Hypertext-Auszeichnungssprache), oft auch kurz als Hypertext bezeichnet, ist eine textbasierte Auszeichnungssprache zur Strukturierung von Inhalten wie Texten, Bildern und Hyperlinks in Dokumenten. HTML-Dokumente sind die Grundlage des World Wide Web und werden von einem Webbrowser dargestellt. Neben den vom Browser angezeigten Inhalten einer Webseite enthält HTML zusätzliche Angaben in Form von Metainformationen, die z. B. über die im Text verwendete Sprache oder den Autor Auskunft geben oder den Inhalt des Textes zusammenfassen. Die Auszeichnungssprache wurde vom World Wide Web Consortium (W3C) bis Version 4.01 weiterentwickelt und soll durch XHTML ersetzt werden.

Überblick

Zur Adressierung anderer Dokumente im Internet werden innerhalb des Dokumentes Hyperlinks verwendet. Dies ist die Grundlage des World Wide Web. Namen gebend sind die Hypertext-Elemente, die zum Verweis auf andere Textstellen oder auf andere Dokumente dienen. Die Programme, die die Struktur des Dokuments interpretieren und als formatierte Webseiten darstellen, werden Webbrowser genannt.

Syntax

Dem Text wird durch Auszeichnungen (engl. markup) von Textteilen mit Tags eine Struktur verliehen. Die meisten HTML-Elemente werden durch ein Tag-Paar markiert, d. h. durch einen Starttag und einen dazugehörigen Schlusstag. Ein Starttag beginnt immer mit dem Zeichen „<“ (kleiner als). Es folgt die eigentliche Bezeichnung des Tags (z. B. „p“ für einen Absatz oder „h1“ für eine Überschrift) und optional eine Liste seiner Attribute (jeder Tag kann nur ganz bestimmte Attribute haben). Mit einem „>“ (größer als) hört der Starttag wieder auf. Ein Schlusstag besteht aus den Zeichen „</“, der Bezeichnung des Tags und dem abschließenden „>“. Ein Schlusstag kann keine Attribute haben. Die jeweils zusammengehörenden Start- und Schlusstags bilden zusammen mit dem dazwischenliegenden Text (Inhalt) ein Element. Diese Elemente lassen sich nach Regeln, die in einer Dokumenttypdefinition (DTD) angegeben sind, verschachteln:
<p>Ein Textabsatz, der ein <em>betontes</em> Wort enthält.</p>

In älteren HTML-Versionen durften bestimmte Tags ausgelassen werden, sofern sie keine Attribute hatten (z. B. <html>/</html>, <head>/</head>, <body>/</body>). Bei bestimmten Tagpaaren durfte der Schlusstag fehlen (z. B. </p> oder </li>). Zum Vergleich: In XML muss auf jeden Starttag ein entsprechender Schlusstag auf gleicher Ebene folgen. Diese Regel gilt auch in der Definition von XHTML, sodass schließende Tags hier nicht weggelassen werden können.

Neben Elementen mit Start- und Schlusstag gibt es in HTML auch leere Elemente, wie etwa Zeilenumbrüche oder Bilder.
Eine Textzeile,<br>die hier fortgesetzt wird.
<img src="E-Mail-Button.jpg" alt="E-Mail">

Es geht in HTML um so genannte beschreibende, nicht um verfahrens- und darstellungsorientierte Textauszeichnung, auch wenn sich HTML in früheren Versionen dafür verwenden ließ. Das heißt, HTML-Tags sind keine Angaben zur Präsentation, die dem Webbrowser mitteilen, wie er den Text (zwischen den Tags) visuell zu formatieren hat. Vielmehr sind Tags eine strukturierende Auszeichnung, mit der sich Textbereichen eine Bedeutung zuordnen lässt, z. B. <h1>…</h1> für eine Überschrift, <p>…</p> für einen Textabsatz und <em>…</em> für betonten Text. Wie diese Bedeutung letztlich dem Benutzer vermittelt wird (im Falle einer Überschrift z. B. durch vergrößerte, fette Schrift), ist zunächst dem Webbrowser überlassen und hängt von der Ausgabe-Umgebung ab. Denn obwohl HTML-Dokumente in der Regel auf Computerbildschirmen dargestellt werden, können sie auch auf anderen Medien ausgegeben werden, etwa auf Papier oder mittels Sprachausgabe.

Um auf die Präsentation eines HTML-Dokuments in verschiedenen Medien Einfluss zu nehmen, eignen sich CSS-Formatvorlagen. Daher gelten Elemente und Attribute zur Präsentation wie <font>…</font>, <b>…</b> und width als veraltet und sollten nach allgemeiner Auffassung vermieden werden. Die meisten Elemente und Attribute zur Präsentation wurden in der HTML-4.01-Spezifikation als missbilligt (engl. deprecated) markiert.

Wer diesen so genannten Quelltext auf Webseiten ansehen möchte, kann dafür in den meisten Browsern die Funktion „Quelltext anzeigen“ oder „show source“ wählen. Der Browser öffnet dann ein neues Fenster und zeigt das HTML-Dokument so, wie er es vom Server empfangen hat.

Sprachtyp

HTML ist keine Seitenbeschreibungssprache wie etwa PostScript, da keine Papier-Seiten beschrieben werden, sondern Text strukturell und logisch ausgezeichnet wird. HTML ist eine Auszeichnungssprache und wird als solche auch nicht programmiert, sondern schlicht geschrieben.

Ein ähnliches Konzept (logische Beschreibung) wie hinter HTML steht hinter dem Satzsystem TeX/LaTeX, das im Unterschied zu HTML jedoch auf die Ausgabe per Drucker auf Papier zielt.

Versionen

HTML wurde 1989 von Tim Berners-Lee am CERN in Genf festgelegt.[1]
HTML (ohne Versionsnummer, 3. November 1992): Die Urversion, die sich nur an Text orientierte.[2]
HTML (ohne Versionsnummer, 30. April 1993): Zu Text kommt neben Attributen wie fette oder kursive Darstellung die Bildintegration dazu.
HTML+ (November 1993) Geplante Erweiterungen, die in spätere Versionen einflossen, aber nie als HTML+ verabschiedet wurden.[3]
HTML 2.0 (November 1995): Die mit RFC 1866 definierte Version führt u. a. Formulartechnik ein. Der Status dieses Standards ist „HISTORIC“. Auch die Vorgänger sind veraltet.
HTML 3.0: Die Version erscheint nicht, weil sie mit der Einführung des Netscape-Browsers in der Version 3 bereits vor der Veröffentlichung veraltet ist.
HTML 3.2 (14. Januar 1997): Neu in dieser Version sind zahlreiche Features wie Tabellen, Textfluss um Bilder, Einbindung von Applets.
HTML 4.0 (18. Dezember 1997): Mit dieser Version werden Stylesheets, Skripte und Frames eingeführt. Auch eine Trennung in Strict, Frameset und Transitional erfolgt. Am 24. April 1998 erscheint eine leicht korrigierte Version dieses Standards.
HTML 4.01 (24. Dezember 1999): Ersetzt HTML 4.0 mit vielen, kleineren Korrekturen.
HTML 5 (Working Draft, 22. Januar 2008):[4] HTML 5 schafft auf Basis von HTML 4.01 und XHTML 1.0 ein neues Vokabular. Die zu HTML gehörende DOM-Spezifikation wird ebenfalls überarbeitet und erweitert.
XHTML 1.0 (26. Januar 2000): Eine Neuformulierung von HTML 4.01 mit Hilfe von XML. Am 1. August 2002 erscheint eine überarbeitete Version.
XHTML 1.1 (31. Mai 2001): Nachdem XHTML in Module aufgeteilt wurde, wird mit XHTML 1.1 eine strikte Version definiert, bei der die mit HTML 4 eingeführten Varianten Frameset und Transitional entfallen.
XHTML 2.0 (öffentlicher Entwurf): Diese Version basiert nicht mehr auf HTML 4.01 und führt einige neue Tags ein, so z. B. <nl> für Navigationslisten. Die Trennung von Auszeichnung und Stil soll in dieser Version vollendet werden.

HTML-Struktur

Allgemeine Struktur

Ein HTML-Dokument besteht aus drei Bereichen:
der Dokumenttypdefinition ganz am Anfang der Datei, die die verwendete DTD angibt, z. B. HTML 4.01 Strict,
dem HTML-Kopf (HEAD), der hauptsächlich technische oder dokumentarische Informationen enthält, die nicht direkt im Browser sichtbar sind und
dem HTML-Körper (BODY), der anzuzeigende Informationen enthält.

Somit sieht die Grundstruktur einer Webseite wie folgt aus:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<title>
Titel der Webseite
</title>

<!-- Evtl. weitere Kopfinformationen -->
</head>

<body>
Inhalt der Webseite
</body>
</html>

HTML-Kopf

Im Kopf können sieben verschiedene Elemente angewandt werden:
title
bezeichnet den Titel der Seite, der im Browserfenster sowie oft in Suchmaschinen angezeigt wird.
meta
kann vielfältige Metadaten enthalten. Siehe Meta-Tags.
base
gibt entweder eine Basis-URI oder einen Basisframe an.
link
dient zur Angabe von logischen Beziehungen zu anderen Ressourcen. Am häufigsten zur Einbindung von Stylesheets benutzt.
script
bindet Code in einer bestimmten Skriptsprache ein, hauptsächlich JavaScript.
style
enthält Stylesheet-Code, hauptsächlich CSS-Regeln.
object
bindet eine externe Datei ein. Browser dürfen solche Objekte im Dokumentkopf nicht darstellen.

HTML-Körper

HTML unterscheidet zwischen Block- und Inline-Elementen. Der wesentliche Unterschied ist, dass erstere in der Ausgabe einen eigenen Block erzeugen, in dem der Inhalt untergebracht wird, während die Inline-Elemente den Textfluss nicht unterbrechen - dabei sei gesagt, dass einige Elemente mit Hilfe von CSS in das jeweils andere Format transformiert werden können. Zu den Block-Elementen gehören z. B. die Überschriften und die Tabellen.

Eine Hauptüberschrift wird so ausgezeichnet:
<h1>Hauptüberschrift</h1>

h1 steht für Heading 1, zeichnet also eine Überschrift der höchsten Gliederungsstufe aus. Weiter möglich sind h2 bis h6, Überschriften zweiter bis sechster Gliederungsstufe. Die Präsentation dieser Überschriften ist von ihrer strukturierenden Bedeutung unabhängig und kann mit CSS beeinflusst werden.

Ein Hyperlink:
<a href="http://www.example.com/">Dies ist ein Link auf example.com</a>

Hyperlinks sind Verweise auf andere Dateien, meistens ebenfalls HTML-Dateien, die üblicherweise im Browser durch Klick verfolgt werden können. Dieser Link könnte so gerendert werden: Dies ist ein Link auf example.com.

Zur Logik stehen zum Beispiel die Elemente strong und em bereit, mit denen sich stark hervorgehobener oder betonter Text auszeichnen lässt. Per Voreinstellung (lt. W3C-Standard) werden strong- und em-Elemente durch Fettschrift beziehungsweise kursive Schrift gerendert.

Die Strukturbeschreibung des Textes, wie sie die obigen Beispielen veranschaulichen, vereinfacht es, das Rendern dem Betrachter anzupassen, um etwa Text einem Sehbehinderten vorzulesen oder als Braille auszugeben.

HTML-Varianten

Beim Entwurf der letzten HTML-Version 4 sollte der Tatsache, dass in vielen HTML-Dokumenten noch Elemente und Attribute zur Präsentation eingesetzt werden, Rechnung getragen, aber auch eine stilistisch saubere Dokumenttypdefinition angeboten werden. Das Ergebnis waren schließlich drei Varianten:

Strict

Diese DTD umfasst den Kernbestand an Elementen und Attributen. Es fehlen die meisten Elemente und Attribute zur Beeinflussung der Präsentation, unter anderem die Elemente font, center und u sowie Attribute wie bgcolor, align und target. Deren Rolle sollen in Strict-Dokumenten Stylesheets übernehmen. Text und nicht-blockbildende Elemente innerhalb der Elemente body, form, blockquote und noscript müssen sich grundsätzlich innerhalb eines Container-Elements befinden, zum Beispiel in einem p-Element.

Transitional

Die Transitional-Variante enthält noch ältere Elemente und Attribute, die auch physische Textauszeichnung ermöglichen. Durch diese DTD soll auch Webautoren, die noch nicht logische Strukturierung und Präsentation voneinander trennen, die Möglichkeit gegeben werden, standardkonformes HTML zu schreiben. Gleichzeitig soll sie sicherstellen, dass bestehende Webseiten weiterhin durch aktuelle Webbrowser angezeigt werden können.

Frameset

Diese Variante enthält zusätzlich zu allen Elementen der Transitional-Variante noch die Elemente für die Erzeugung von Framesets.

Zukunft der Varianten

Mit XHTML 1.1, der neuesten Version von HTML, verzichtet das W3-Consortium wieder auf die Unterscheidung und führt lediglich die Strict-Variante als „reine Lehre“ weiter. Dies setzt sich auch im momentan (2005) im Entwicklungsstadium begriffenen XHTML 2.0 fort.

Elemente, die bislang nur in den Varianten Transitional und Frameset vorkamen, werden beinahe alle entfallen. Entsprechende Effekte müssen dann durch CSS, JavaScript, XFrames oder andere Methoden erreicht werden, da sie zur logischen Textauszeichnung nicht notwendig sind.

Ein Attribut, das aus der Transitional-Variante voraussichtlich den „Sprung“ in XHTML 2.0 schafft, ist das „value“-Attribut bei nummerierten Listenpunkten, das erlaubt, die Nummer des Listenpunktes selbst festzulegen.

Zusatztechniken und Weiterentwicklungen

Stylesheets

Im Laufe der Jahre ist HTML um Elemente erweitert worden, die sich mit der Gestaltung des Dokuments befassen, was der ursprünglichen Idee der Systemunabhängigkeit entgegen lief. Eine Rückbesinnung auf die Trennung von Inhalt (Struktur) und Layout wurde durch die Definition von Cascading Style Sheets (CSS) vorgenommen. So soll das Aussehen des Dokuments in einer separaten Datei, dem so genannten Stylesheet, festgelegt werden. Dies verbessert die Anpassungsfähigkeit des Layouts an das jeweilige Ausgabegerät und an spezielle Bedürfnisse der Benutzer, z. B. von Sehbehinderten. Heutzutage ist die CSS-Unterstützung der Browser ausreichend, um damit eine anspruchsvolle Gestaltung zu realisieren.

Dynamisches HTML

Schon sehr früh in der Geschichte von HTML wurden Zusatztechniken erfunden, die es ermöglichen, HTML-Dokumente während der Anzeige im Browser dynamisch zu verändern. Die gebräuchlichste ist JavaScript. Man spricht bei solchen interaktiven Dokumenten von dynamischem HTML. Diese Techniken wurden von verschiedenen Browser-Herstellern, allen voran Microsoft und Netscape, unabhängig voneinander entwickelt. Daher gab es erhebliche Probleme bei der Umsetzung der Techniken zwischen den verschiedenen Browsern. Mittlerweile interpretieren alle verbreiteten JavaScript-fähigen Browser das Document Object Model (DOM). Dadurch ist es möglich, in allen Browsern lauffähige Skripte zu schreiben. Es gibt jedoch noch immer Differenzen bei der Unterstützung des DOM-Standards.

XML

Mittlerweile wurde die letzte Version des HTML-Standards (HTML 4.01) in der Metasprache XML neu formuliert. Das daraus entstandene XHTML 1.0 genügt den im Vergleich zu SGML strengeren syntaktischen Regeln von XML, ist aber in seinen drei DTD-Varianten semantisch mit der jeweils entsprechenden DTD-Variante von HTML 4.01 identisch. Aktuell liegt der XHTML-Standard in der Version 1.1 vor, der eine zusätzliche Modularisierung der Elemente einführt.

Als zukünftiges universelles Format wird zunehmend XML selbst eingesetzt. Dieses arbeitet ebenfalls mit Tags, die jedoch per Dokumenttypdefinition sehr restriktiv eingesetzt werden können. XML ermöglicht somit ein selbstbeschreibendes Datenmodell. Zur Umwandlung von in XML gespeicherten Daten in die entsprechenden Anzeigeformate (z. B. XHTML) kann die Stylesheet-Sprache XSL Transformation verwendet werden.

Ajax

Ajax beschreibt die Kombination bekannter Techniken wie JavaScript, XML und DOM. Dadurch wird die Änderung einer Webseite möglich, ohne sie vollständig neu laden zu müssen. Das Ziel sind hier dynamische Seiten, die wie normale Anwendungen reagieren können.

Falsche Interpretation von Webdokumenten

Die verbreiteten Browser folgen bei der Auswertung von HTML nicht ganz dem Standard. Dies zwingt Webautoren dazu, ihre Dokumente in verschiedenen Browsern zu testen und gegebenenfalls anzupassen. Eine solche Anpassung an die Gegebenheiten auf der Leserseite ist zwar durchaus von Vorteil, aber häufig kommt es zu schwer umgehbaren Fehlinterpretationen. Durch die wohlüberlegte Verwendung von strukturierendem HTML kann immerhin gewährleistet werden, dass ein Webdokument in jedem Fall zumindest grundlegend zugänglich und lesbar ist.

Der am weitesten verbreitete Webbrowser, der Internet Explorer, ist relativ fehlertolerant, hat jedoch insbesondere in CSS-Belangen einige Defizite, welchen Rechnung zu tragen ist. Die Browser, die auf der Gecko-Rendering-Engine basieren (darunter Firefox, Camino und Epiphany), auf der KHTML-Engine (darunter Konqueror und Safari) oder Opera mit eigener Engine haben hier am wenigsten Probleme, tolerieren Codefehler jedoch weniger.

HTML lernen

Die Lektüre einer modernen linearen Einführung (siehe Weblinks) und die Handarbeit direkt in einem Texteditor ist empfehlenswert, um HTML richtig zu verstehen und voll auszunutzen.

Für das schnelle Erstellen von Webseiten ohne tiefere HTML-Kenntnis mag der Gebrauch eines so genannten WYSIWYG-Editors zunächst genügen. Diese Editoren produzieren einen HTML-Code, der die optischen Vorstellungen weitestgehend widerspiegelt. Allerdings wird die strukturelle und logische Auszeichnung, die dem Text erst einen echten Mehrwert gibt, dabei vernachlässigt. Diese erfordert ein gutes Verständnis von HTML, das ein WYSIWYG-Editor nicht ersetzen kann. Hinzu kommt, dass diese Editoren gelegentlich ungültiges HTML produzieren, was die Darstellung des Dokuments von der Fehlertoleranz des Webbrowsers abhängig macht. In der professionellen Webgestaltung werden solche HTML-Editoren daher häufig nur als zusätzliches Hilfsmittel benutzt, um etwa das Grundgerüst von Webseiten zu erstellen. Die Feinarbeit erfolgt dann in einem Texteditor direkt am HTML-Code.

SELFHTML ist ein deutschsprachiges und sehr umfangreiches Projekt, das für viele Themen rund um HTML Referenzmaterial bietet.

Siehe auch
Entities
MIME Encapsulation of Aggregate HTML Documents (MHTML)
Web Accessibility Initiative, Barrierefreies Internet

Literatur
Stefan Münz, Wolfgang Nefzger: HTML Handbuch. Franzis-Verlag, Poing 2005, ISBN 3-7723-6654-6
Stefan Mintert (Hrsg.): XHTML, CSS & Co. Die W3C-Spezifikationen für das Web-Publishing. Addison-Wesley, München 2003, ISBN 3-8273-1872-6
Mark Lubkowitz: Webseiten programmieren und gestalten – HTML, CSS, JavaScript, PHP, Perl, MySQL, SVG und Newsfeeds, mit CD. Galileo Press, Bonn 2004, ISBN 3-89842-557-6

 

 









In die gleiche Zeit können Sie Ihre Website in den Paaren
überprüfen Suchmaschinen

Jetz machen Sie mit 4 Suchmaschinen !

Directories
Yahoo
DMOZ
Snap

Suchmaschinen
Alta Vista
Direct Hit
Lycos
Excite

Webcrawler
Go.com
DejaNews
Google
Meta Suchen
Go2Net
Search.Com
Mamma
DogPile

Enter Keywords :

Webseiten,Optimierung,Eintrag,Suchmaschinen..... Webseiten,Optimierung,Eintrag,Suchmaschinen
English..Turkish

Webseiten,Optimierung,Eintrag,Suchmaschinen
Webseiten,Optimierung,Eintrag,Suchmaschinen

 

Webseiten,Optimierung,Eintrag,Suchmaschinen

Webseiten,Optimierung,Eintrag,Suchmaschinen

Webseiten,Optimierung,Eintrag,Suchmaschinen

Webseiten,Optimierung,Eintrag,Suchmaschinen

Webseiten,Optimierung,Eintrag,Suchmaschinen

Webseiten,Optimierung,Eintrag,Suchmaschinen
Webseiten,Optimierung,Eintrag,Suchmaschinen


 

Webseiten,Optimierung,Eintrag,Suchmaschinen

Webseiten,Optimierung,Eintrag,Suchmaschinen

Webseiten,Optimierung,Eintrag,Suchmaschinen

Webseiten,Optimierung,Eintrag,Suchmaschinen

 

128 Bit SSL Security
Webseiten,Optimierung,Eintrag,Suchmaschinen
Webseiten,Optimierung,Eintrag,Suchmaschinen

DOUBLE Security

 

Webseiten,Optimierung,Eintrag,Suchmaschinen

Webseiten,Optimierung,Eintrag,Suchmaschinen

Webseiten,Optimierung,Eintrag,Suchmaschinen

Webseiten,Optimierung,Eintrag,Suchmaschinen

Webseiten,Optimierung,Eintrag,Suchmaschinen