Das Dokumentenformat (HTML (Hypertext Markup Language) dient zur Auszeichnung von Hypertext im WWW. Es basiert dabei auf der Metasprache SGML, die zur Definition von Auszeichnungssprachen verwendet wird. Demnach ist HTML also eine Auszeichnungssprache zur Beschreibung von Informationen in Hypertexten. HTML wird vom World Wide Web Consortium (W3C) weiterentwickelt.
Die letzte Version des HTML-Standards (HTML 4.01) wurde in der Metasprache XML neu formuliert. Das daraus entstandene XHTML 1.0 genügt den im Vergleich zu SGML strengeren syntaktischen Regeln von XML, ist aber in seinen drei DTD-Varianten (Strict, Transitional und Frameset, siehe unten) semantisch mit der jeweils entsprechenden DTD-Variante von HTML 4.01 identisch. Aktuell liegt der XHTML-Standard in der Version 1.1 vor, der eine zusätzliche Modularisierung der Elemente einführt.
Dem Text wird durch Auszeichnung (engl. markup) von Textteilen mit in der Regel paarweisen (öffnenden und schließenden) HTML-Tags eine Struktur verliehen. Die jeweils zusammengehörenden Tags bilden zusammen mit dem dazwischenliegenden Text ('Inhalt') ein Element. Diese Elemente lassen sich nach Regeln, die in einer Dokumenttypdefinition (DTD) angegeben sind, verschachteln
Neben Elementen mit Start- und End-Tag gibt es auch leere Elemente, wie etwa Zeilenumbrüche oder Bilder. (In XHTML hingegen müssen leere Elemente nach den Regeln der Tag-Minimierung mit einem / am Ende notiert werden.
In HTML geht es um sogenannte logische, nicht um physische Textauszeichnung. HTML-Tags teilen dem Webbrowser nicht unmittelbar mit, wie er den Text zwischen den Tags visuell zu formatieren habe. Vielmehr sind Tags eine strukturierende Auszeichnung, mit der sich Textbereichen Bedeutung zuordnen lässt (z. B. Überschrift). Wie letztlich die Bedeutung eines Textes dem Benutzer vermittelt wird (z.B. durch vergrößerte, fette Schrift), ist zunächst dem Webbrowser überlassen und hängt von der Ausgabe-Umgebung ab. Denn obwohl HTML-Dokumente in der Regel auf Computerbildschirmen dargestellt werden, können sie auch auf anderen Medien ausgeben werden, etwa auf Papier oder mittels Sprachausgabe.