vb@rchiv · Grafik & DesignZeichensätze gemäß ISO 8859

Rubrik: Typografie15.02.04

Zeichensätze gemäß ISO 8859

Zeichensätze sind in der ISO 8859 festgelegt und in 15 Untergruppen aufgeteilt:

Zeichensätze

ISO 8859-1: (Latin-1): westeuropäische Sprachen
ISO 8859-2: (Latin-2): osteuropäische Sprachen
ISO 8859-3: (Latin-3): Esperanto, Galicisch, Maltesisch, Türkisch
ISO 8859-4: (Latin-4): baltische Sprachen
ISO 8859-5: Kyrillisch
ISO 8859-6: Arabisch
ISO 8859-7: Neugriechisch
ISO 8859-8: Hebräisch
ISO 8859-9: (Latin-5): Türkisch statt Isländisch, sonst wie Latin-1
ISO 8859-10: (Latin-6): Grönländisch, Lappisch
ISO 8859-11: Thailändisch
ISO 8859-12: Keltische Sprachen, Gälisch, Irisch, Welsch, ISO 8859-13 (Latin-7): baltische Sprachen
ISO 8859-14: (Latin-8): Sami-Sprachen, Sprache der Lappen
ISO 8859-15: (Latin-9): westeuropäische Sprachen mit Eurozeichen

Allgemeiner Aufbau der Zeichensätze

Die ersten 128 Positionen sind bei allen Teilnormen identisch und entsprechen den Zeichen des 7-Bit-Satzes US-ASCII.

0x00 bis 0x1F und 0x7F enthalten Steuerzeichen.
0x20 bis 0x7E enthalten druckbare Zeichen (Buchstaben, Ziffern, Interpunktionszeichen ...)

Es folgen 32 (unbenutzte) Steuerzeichen (0x80-9F).

Die letzten 96 Positionen (0xA0-FF) enthalten regionale Sonderzeichen und machen den Unterschied zwischen den Teilnormen aus.

Bemerkungen
Der häufig benutzte Latin-1-Zeichensatz ist identisch mit den ersten 256 Zeichen des Unicode-Zeichensatzes.

Der neuere Latin-9-Zeichensatz unterscheidet sich nur an 8 Positionen vom Latin-1-Zeichensatz,
u.a. wurde das allgemeine Währungszeichen ¤ durch das Eurozeichen € ersetzt.

Die deutschen Sonderzeichen (Umlaute und "ß") sind in allen Latin-x-Zeichensätzen unter jeweils demselben Code vorhanden.