Windows-Codepages
0874 Thai
0932 Japanisch
0936 Vereinfachtes Chinesisch
0949 Koreanisch
0950 Traditionelles Chinesisch
1200 Unicode UTF-16, little endian
1201 Unicode UTF-16, big endian
1250 Mitteleuropäisch
1251 Kyrillisch
1252 Westeuropäisch
1253 Griechisch
1254 Türkisch
1255 Hebräisch
1256 Arabisch
1257 Baltisch
1258 Vietnamesisch
12000 Unicode UTF-32, little endian
12001 Unicode UTF-32, big endian
65000 Unicode UTF-7
65001 Unicode UTF-8

Windows-1251 (auch Codepage 1251, kurz cp1251) ist eine 8-Bit-Zeichensatztabelle zur Darstellung von Sprachen im kyrillischen Alphabet wie Russisch oder Ukrainisch. Sie wird auch häufig für Bulgarisch verwendet.

Windows-1251 und KOI8-R (oder seine ukrainische Variante KOI8-U) sind viel weiter verbreitet als ISO 8859-5[1]. Zukünftig könnten sie durch UTF-8 (Unicode) verdrängt werden. Im März 2022 verwenden 0,6 % aller Websites Windows-1251, ISO-8859-5 wird von weniger als 0,05 % verwendet.[2]

Code …0 …1 …2 …3 …4 …5 …6 …7 …8 …9 …A …B …C …D …E …F
0… NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
1… DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
2… SP ! " # $ % & ' ( ) * + , - . /
3… 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4… @ A B C D E F G H I J K L M N O
5… P Q R S T U V W X Y Z [ \ ] ^ _
6… ` a b c d e f g h i j k l m n o
7… p q r s t u v w x y z { | } ~ DEL
8… Ђ Ѓ ѓ Љ Њ Ќ Ћ Џ
9… ђ љ њ ќ ћ џ
A… NBSP Ў ў Ј ¤ Ґ ¦ § Ё © Є « ¬ SHY ® Ї
B… ° ± І і ґ µ · ё є » ј Ѕ ѕ ї
C… А Б В Г Д Е Ж З И Й К Л М Н О П
D… Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
E… а б в г д е ж з и й к л м н о п
F… р с т у ф х ц ч ш щ ъ ы ь э ю я

SP (space) auf Position 2016 ist das Leerzeichen, NBSP (no-break space, auch non-breaking space) auf Position A016 ist das geschützte Leerzeichen und SHY (soft hyphen) an Position AD16 ist der bedingte Trennstrich, der normalerweise nur am Zeilenende sichtbar ist.

Einzelnachweise und Quellen

Bearbeiten
  1. Roman Czyborra: The Cyrillic Charset Soup. 1998, abgerufen am 6. März 2022 (englisch).
  2. Comparison of the usage statistics of Windows-1251 vs. ISO-8859-5 for websites. In: W3Techs. 6. März 2022, abgerufen am 6. März 2022 (englisch).
Bearbeiten
  • Microsoft Windows Codepage : 1251 (Cyrillic). Microsoft, archiviert vom Original am 7. Oktober 1999; (englisch).
  • cp1251 to Unicode table. Unicode-Konsortium, 15. April 1998; (englisch).
  • Petko Yotov: Universal Cyrillic decoder. (englisch, eine Anwendung, die helfen kann, verschieden codierte kyrillische Texte lesbar zu machen).