Zeichensätze sind in der ISO 8859 festgelegt und in 15 Untergruppen aufgeteilt:
Zeichensätze
- ISO 8859-1: (Latin-1): westeuropäische Sprachen
- ISO 8859-2: (Latin-2): osteuropäische Sprachen
- ISO 8859-3: (Latin-3): Esperanto, Galicisch, Maltesisch, Türkisch
- ISO 8859-4: (Latin-4): baltische Sprachen
- ISO 8859-5: Kyrillisch
- ISO 8859-6: Arabisch
- ISO 8859-7: Neugriechisch
- ISO 8859-8: Hebräisch
- ISO 8859-9: (Latin-5): Türkisch statt Isländisch, sonst wie Latin-1
- ISO 8859-10: (Latin-6): Grönländisch, Lappisch
- ISO 8859-11: Thailändisch
- ISO 8859-12: Keltische Sprachen, Gälisch, Irisch, Welsch, ISO 8859-13 (Latin-7): baltische Sprachen
- ISO 8859-14: (Latin-8): Sami-Sprachen, Sprache der Lappen
- ISO 8859-15: (Latin-9): westeuropäische Sprachen mit Eurozeichen
Allgemeiner Aufbau der Zeichensätze
Die ersten 128 Positionen sind bei allen Teilnormen identisch und entsprechen den Zeichen des 7-Bit-Satzes US-ASCII.
0x00 bis 0x1F und 0x7F enthalten Steuerzeichen.
0x20 bis 0x7E enthalten druckbare Zeichen (Buchstaben, Ziffern, Interpunktionszeichen ...)
Es folgen 32 (unbenutzte) Steuerzeichen (0x80-9F).
Die letzten 96 Positionen (0xA0-FF) enthalten regionale Sonderzeichen und machen den Unterschied zwischen den Teilnormen aus.
Bemerkungen
Der häufig benutzte Latin-1-Zeichensatz ist identisch mit den ersten 256 Zeichen des Unicode-Zeichensatzes.
Der neuere Latin-9-Zeichensatz unterscheidet sich nur an 8 Positionen vom Latin-1-Zeichensatz,
u.a. wurde das allgemeine Währungszeichen ¤ durch das Eurozeichen € ersetzt.
Die deutschen Sonderzeichen (Umlaute und "ß") sind in allen Latin-x-Zeichensätzen unter jeweils demselben Code vorhanden.