ISO/IEC 8859

ISO/IEC 8859 je mezinárodní norma definující 15 osmibitových znakových sad, kterou společně vydala a udržovala Mezinárodní organizace pro normalizaci (ISO) a Mezinárodní elektrotechnická komise (IEC). Každá sada je definována jednou očíslovanou částí – ISO/IEC 8859-1 až ISO/IEC 8859-16; ISO/IEC 8859-12 nebylo vydáno. Vzhledem k očekávanému přechodu na ISO/IEC 10646 se vývoj ISO/IEC 8859 považuje za ukončený, a pracovní skupina byla rozpuštěna.

Části 1, 2, 3 a 4 ISO/IEC 8859 byly původně standardem ECMA-94 organizace Ecma International.

Úvod

Nejstarší znakové kódy byly z historických důvodů a kvůli omezení některých přenosových datových protokolů omezené na 7 bitů. 95 tisknutelných znaků ASCII stačí pro vyměnu informací v moderní angličtině, většina jiných jazyků používajících latinku však potřebuje další symboly, které nejsou součástí ASCII. ISO/IEC 8859 řeší toto problém využitím osmého bitu v osmibitovém bytu, což poskytuje prostor pro dalších 96 tisknutelných znaků v oblasti G1. Kvůli tomu, že různé jazyky používají různá diakritická znaménka, je celkový počet znaků s diakritikou větší, než kolik se vejde do jednoho osmibitového znakového kódu. Proto bylo vytvořeno několik kódování, z nichž 10 je určeno pro různé varianty latinky.

Norma ISO/IEC 8859-n definuje pouze tisknutelné znaky v oblasti G1 a byla navržena tak, aby mohla být používána ve spojení s řídicí znaky mapovanými na nepřiřazené kódy. Za tímto účelem řada kódování registrovaných organizací IANA přidává sadu řídicích znaků C0 (řídicí znaky mapované na kódy 0 až 31) z ISO/IEC 646 a sadu řídicích znaků C1 (s kódy 128 až 159) z ISO 6429, což dává osmibitové kódování, ve kterém je většina nebo všechny kódy přiřazené. Upřednostňované MIME jméno nebo kanonické jméno (pokud upřednostňované MIME jméno není zadané) těchto kódování je ISO-8859-n. Mnoho lidé používá termíny ISO/IEC 8859-n a ISO-8859-n jako synonyma. Pouze kódování ISO/IEC 8859-11 nebylo přiřazeno takovéto jméno znakové sady, pravděpodobně kvůli tomu, že je téměř identické s TIS 620.

Znaky

Norma ISO/IEC 8859 byla navržena pro spolehlivou výměnu informací, nikoli pro typografii; proto neobsahuje všechny symboly potřebné pro vysoce kvalitní typografii, jako například nepovinné slitky, uvozovky, lomítka, atd. Sázecí systémy kvůli tomu často používají proprietární rozšíření ASCII (např. kódování Cork v sázecím programu TeX) nebo ISO/IEC 8859 nebo Unicode.

Základním pravidlem bylo, že do kódování nebyly zařazeny znaky nebo symboly, které nebyly částí široce používané znakové sady pro zpracování dat a nevyskytovaly se na klávesnici psacích strojů pro příslušný jazyk. Proto se do kódování dostaly uvozovky tvaru dvojitých šipek « a » používané některými evropskými jazyky, ale nikoli dvojité uvozovky „ a “ používané v angličtině a některých jiných jazycích. Do kódování nebyly zahrnuty slitky œ a Œ používané ve francouzštině, protože je lze psát jako 'oe'. Bylo také vynecháno Ÿ, potřebné pouze pro texty psané velkými písmeny. Tyto znaky však byly zahrnuty později do ISO/IEC 8859-15, které také obsahuje nový znak Eura €. Podobně nebyla zahrnuta písmena 'ĳ' a 'Ĳ' používaná v nizozemštině, protože Nizozemci si zvykli je psát jako dvě písmena. Pro rumunštinu nebyly zařazeny znaky ‹Ș›/‹ș› a ‹Ț›/‹ț› (s čárkou) pod písmenem, protože je Unicode Consortium zpočátku považovalo za varianty znaků ‹Ş›/‹ş› a ‹Ţ›/‹ţ› (s cedillou). Písmena s čárkou pod znakem byla později přidána do standardu Unicode a jsou také v ISO/IEC 8859-16.

Většina kódování ISO/IEC 8859 obsahuje znaky diakritikou potřebné pro různé evropské jazyky používající latinku. Ostatní obsahují nelatinkové abecedy: řeckou abecedu, cyrilici, hebrejskou abecedu, arabskou abecedu a thajské písmo. Většina kódování obsahuje pouze samostatné znaky, přestože thajština, hebrejština a arabština používají i kombinační znaky. Norma však neobsahuje podporu východoasijských písem (CJK), protože jejich ideografická písma vyžadují tisíce kódových bodů. Zahrnuta není ani vietnamština, která sice používá latinku, ale má tolik znaků s diakritikou, že se nevejde se do 96 pozic (bez použití kombinační diakritiky). Obě japonské hláskové abecedy (hiragana a katakana, viz Kana) by se do tohoto počtu vešly, ale zakódované v ISO/IEC 8859 také nejsou.

Části ISO/IEC 8859

Norma ISO/IEC 8859 je rozdělena na následující části:

Část	Název	Jazyky
ISO/IEC 8859-1	Latin-1 Western European	Pravděpodobně nejpoužívanější část ISO/IEC 8859, pokrývající většinu západoevropských jazyků: dánštinu (částečně)^[1], nizozemštinu (částečně)^[2], angličtinu, faerštinu, finštinu (částečně)^[3], francouzštinu (částečně)^[3], němčinu, islandštinu, irštinu, italštinu, norštinu, portugalštinu, rétorománštinu, skotskou gaelštinu, španělštinu, katalánštinu a švédštinu. Podporuje i některé jazyky mimo západní Evropu: východoevropskou albánštinu, jihovýchodoasijskou indonéštinu, africké jazyky afrikánštinu a svahilštinu. Chybějící znak Eura a velké Ÿ jsou v revidované verzi ISO/IEC 8859-15 (viz níže). Odpovídající znaková sada IANA je ISO-8859-1.
ISO/IEC 8859-2	Latin-2 Cental European	Podporuje následující středo- a východoevropské jazyky, které používají latinku, včetně bosenštiny, polštiny, chorvatštiny, češtiny, slovenštiny, slovinštiny, srbštiny a maďarštiny. Chybějící znak Eura lze nalézt ve verzi ISO/IEC 8859-16.
ISO/IEC 8859-3	Latin-3 South European	Turečtina, maltština a esperanto. Z větší části nahrazeno novější verzí ISO/IEC 8859-9 pro turečtinu a Unicodem pro esperanto.
ISO/IEC 8859-4	Latin-4 North European	Estonština, lotyština, litevština, grónština a sámské jazyky.
ISO/IEC 8859-5	Latin/Cyrillic	Pokrývá většinou slovanských jazyků, které používají cyrilici, včetně běloruštiny, bulharštiny, makedonštiny, ruštiny, srbštiny a (částečně) ukrajinštiny^[4].
ISO/IEC 8859-6	Latin/Arabic	Pokrývá nejobvyklejší arabské znaky. Nepodporuje jiné jazyky používající arabské písmo. Pro zobrazování vyžaduje podporu obousměrného textu a kurzivní spojování.
ISO/IEC 8859-7	Latin/Greek	Pokrývá moderní řečtinu (monotonní pravopis). Může být také použito pro starou řečtinu psanou bez diakritiky nebo monotonním pravopisem, ale nemá znaky s diakritikou pro polytonní pravopis, které jsou součástí Unicode.
ISO/IEC 8859-8	Latin/Hebrew	Pokrývá moderní hebrejskou abecedu, jak je používána v Izraeli. V praxi existují dvě různá kódování, logické pořadí (vyžaduje podporu obousměrného textu pro zobrazování) a vizuální (zleva doprava) pořadí (ve výsledku, po zpracování obousměrného textu a řádkovém zlomu).
ISO/IEC 8859-9	Latin-5 Turkish	Z větší části totožná s ISO/IEC 8859-1, ale nahrazuje zřídka používaná islandská písmena za turecká.
ISO/IEC 8859-10	Latin-6 Nordic	Přepracování kódu Latin-4. Považuje se za užitečnější pro severské jazyky. Pro baltské jazyky se více používá Latin-4.
ISO/IEC 8859-11	Latin/Thai	Obsahuje znaky potřebné pro thajštinu. Téměř identické s TIS 620.
~~ISO/IEC 8859-12~~	Latin/Devanagari	Práce na části 8859 pro Dévanágarí byla oficiálně ukončena v roce 1997. Dévanágarí je obsaženo v kódování ISCII a v Unicode/ISO/IEC 10646.
ISO/IEC 8859-13	Latin-7 Baltic Rim	Doplněny některé znaky pro baltské jazyky, které chyběly v Latin-4 a Latin-6.
ISO/IEC 8859-14	Latin-8 Celtic	Pokrývá keltské jazyky jako například skotskou gaelštinu a bretonštinu.
ISO/IEC 8859-15	Latin-9	Revize 8859-1, která nahradila některé málo používané symboly znakem Eura € a písmeny Š, š, Ž, ž, Œ, œ a Ÿ, které jsou potřebné pro francouzštinu, finštinu a estonštinu.
ISO/IEC 8859-16	Latin-10 South-Eastern European	Určena pro albánštinu, chorvatštinu, maďarštinu, italštinu, polštinu, rumunštinu a slovinštinu, ale také finštinu, francouzštinu, němčinu a irskou gaelštinu (nový pravopis). Klade větší důraz na písmena než na symboly. Znak měny je nahrazen znakem Eura.

↑ Chybí několik samohlásek s diakritikou včetně Ǿ a ǿ, které mohou být nahrazeny znaky bez diakritiky za cenu zvětšené nejednoznačnosti.
↑ Chybí písmeno Ĳ/ĳ, které se obvykle zapisuje jako IJ.
↑ ^a ^b Chybějící znaky jsou v ISO/IEC 8859-15.
↑ V 8859-5 chybí písmeno Ґ/ґ, které bylo vráceno do ukrajinské abecedy v roce 1990.

Jednotlivé části ISO 8859 byly navrženy tak, aby podporovaly příbuzné jazyky, které používají stejná písmena s diakritikou, takže znaky potřebné pro jeden jazyk jsou obvykle obsaženy v jedné části. Existují však některé znaky a kombinace jazyků, které vyžadují přepínání mezi znakovými sadami podle ISO/IEC 2022. Standard byl vytvářen tak, aby konverze byly co nejjednodušší. Například všech sedm speciálních znaků používaných v němčině je ve všech variantách ISO/IEC 8859 (1–4, 9, 10, 13–16) na stejných pozicích a na mnoha pozicích se znaky v různých sadách liší pouze diakritickými znaménky. Speciálně varianty 1–4 byly navrženy společně a vyznačují se tím, že pokud se určitý znak vyskytuje ve více sadách, má ve všech stejný kód.

Tabulka

Porovnání jednotlivých kódování (1–16) ISO/IEC 8859
Dvojkově	Oct	Dec	Hex	1	2	3	4	5	6	7	8	9	10	11	13	14	15	16
1010 0000	240	160	A0	nezlomitelná mezera (NBSP)
1010 0001	241	161	A1	¡	Ą	Ħ	Ą	Ё		‘		¡	Ą	ก	”	Ḃ	¡	Ą
1010 0010	242	162	A2	¢	˘		ĸ	Ђ		’	¢	¢	Ē	ข	¢	ḃ	¢	ą
1010 0011	243	163	A3	£	Ł	£	Ŗ	Ѓ		£			Ģ	ฃ	£			Ł
1010 0100	244	164	A4	¤				Є	¤	€	¤		Ī	ค	¤	Ċ	€
1010 0101	245	165	A5	¥	Ľ		Ĩ	Ѕ		₯	¥		Ĩ	ฅ	„	ċ	¥	„
1010 0110	246	166	A6	¦	Ś	Ĥ	Ļ	І		¦			Ķ	ฆ	¦	Ḋ	Š
1010 0111	247	167	A7	§				Ї		§				ง	§
1010 1000	250	168	A8	¨				Ј		¨			Ļ	จ	Ø	Ẁ	š
1010 1001	251	169	A9	©	Š	İ	Š	Љ		©			Đ	ฉ	©
1010 1010	252	170	AA	ª	Ş		Ē	Њ		ͺ	×	ª	Š	ช	Ŗ	Ẃ	ª	Ș
1010 1011	253	171	AB	«	Ť	Ğ	Ģ	Ћ		«			Ŧ	ซ	«	ḋ	«
1010 1100	254	172	AC	¬	Ź	Ĵ	Ŧ	Ќ	،	¬			Ž	ฌ	¬	Ỳ	¬	Ź
1010 1101	255	173	AD	měkké rozdělovací znaménko (SHY)										ญ	SHY
1010 1110	256	174	AE	®	Ž		Ž	Ў			®		Ū	ฎ	®			ź
1010 1111	257	175	AF	¯	Ż		¯	Џ		―	¯		Ŋ	ฏ	Æ	Ÿ	¯	Ż
1011 0000	260	176	B0	°				А		°				ฐ	°	Ḟ	°
1011 0001	261	177	B1	±	ą	ħ	ą	Б		±			ą	ฑ	±	ḟ	±
1011 0010	262	178	B2	²	˛	²	˛	В		²			ē	ฒ	²	Ġ	²	Č
1011 0011	263	179	B3	³	ł	³	ŗ	Г		³			ģ	ณ	³	ġ	³	ł
1011 0100	264	180	B4	´				Д		΄	´		ī	ด	“	Ṁ	Ž
1011 0101	265	181	B5	µ	ľ	µ	ĩ	Е		΅	µ		ĩ	ต	µ	ṁ	µ	”
1011 0110	266	182	B6	¶	ś	ĥ	ļ	Ж		Ά	¶		ķ	ถ	¶
1011 0111	267	183	B7	·	ˇ	·	ˇ	З		·				ท	·	Ṗ	·
1011 1000	270	184	B8	¸				И		Έ	¸		ļ	ธ	ø	ẁ	ž
1011 1001	271	185	B9	¹	š	ı	š	Й		Ή	¹		đ	น	¹	ṗ	¹	č
1011 1010	272	186	BA	º	ş		ē	К		Ί	÷	º	š	บ	ŗ	ẃ	º	ș
1011 1011	273	187	BB	»	ť	ğ	ģ	Л	؛	»			ŧ	ป	»	Ṡ	»
1011 1100	274	188	BC	¼	ź	ĵ	ŧ	М		Ό	¼		ž	ผ	¼	ỳ	Œ
1011 1101	275	189	BD	½	˝	½	Ŋ	Н		½			―	ฝ	½	Ẅ	œ
1011 1110	276	190	BE	¾	ž		ž	О		Ύ	¾		ū	พ	¾	ẅ	Ÿ
1011 1111	277	191	BF	¿	ż		ŋ	П	؟	Ώ		¿	ŋ	ฟ	æ	ṡ	¿	ż
1100 0000	300	192	C0	À	Ŕ	À	Ā	Р		ΐ		À	Ā	ภ	Ą	À
1100 0001	301	193	C1	Á				С	ء	Α		Á		ม	Į	Á
1100 0010	302	194	C2	Â				Т	آ	Β		Â		ย	Ā	Â
1100 0011	303	195	C3	Ã	Ă		Ã	У	أ	Γ		Ã		ร	Ć	Ã		Ă
1100 0100	304	196	C4	Ä				Ф	ؤ	Δ		Ä		ฤ	Ä
1100 0101	305	197	C5	Å	Ĺ	Ċ	Å	Х	إ	Ε		Å		ล	Å			Ć
1100 0110	306	198	C6	Æ	Ć	Ĉ	Æ	Ц	ئ	Ζ		Æ		ฦ	Ę	Æ
1100 0111	307	199	C7	Ç			Į	Ч	ا	Η		Ç	Į	ว	Ē	Ç
1100 1000	310	200	C8	È	Č	È	Č	Ш	ب	Θ		È	Č	ศ	Č	È
1100 1001	311	201	C9	É				Щ	ة	Ι		É		ษ	É
1100 1010	312	202	CA	Ê	Ę	Ê	Ę	Ъ	ت	Κ		Ê	Ę	ส	Ź	Ê
1100 1011	313	203	CB	Ë				Ы	ث	Λ		Ë		ห	Ė	Ë
1100 1100	314	204	CC	Ì	Ě	Ì	Ė	Ь	ج	Μ		Ì	Ė	ฬ	Ģ	Ì
1100 1101	315	205	CD	Í				Э	ح	Ν		Í		อ	Ķ	Í
1100 1110	316	206	CE	Î				Ю	خ	Ξ		Î		ฮ	Ī	Î
1100 1111	317	207	CF	Ï	Ď	Ï	Ī	Я	د	Ο		Ï		ฯ	Ļ	Ï
Dvojkově	Oct	Dec	Hex	1	2	3	4	5	6	7	8	9	10	11	13	14	15	16
1101 0000	320	208	D0	Ð	Đ		Đ	а	ذ	Π		Ğ	Ð	ะ	Š	Ŵ	Ð
1101 0001	321	209	D1	Ñ	Ń	Ñ	Ņ	б	ر	Ρ		Ñ	Ņ	ั	Ń	Ñ		Ń
1101 0010	322	210	D2	Ò	Ň	Ò	Ō	в	ز			Ò	Ō	า	Ņ	Ò
1101 0011	323	211	D3	Ó			Ķ	г	س	Σ		Ó		ำ	Ó
1101 0100	324	212	D4	Ô				д	ش	Τ		Ô		ิ	Ō	Ô
1101 0101	325	213	D5	Õ	Ő	Ġ	Õ	е	ص	Υ		Õ		ี	Ő
1101 0110	326	214	D6	Ö				ж	ض	Φ		Ö		ึ	Ö
1101 0111	327	215	D7	×				з	ط	Χ		×	Ũ	ื	×	Ṫ	×	Ś
1101 1000	330	216	D8	Ø	Ř	Ĝ	Ø	и	ظ	Ψ		Ø		ุ	Ų	Ø		Ű
1101 1001	331	217	D9	Ù	Ů	Ù	Ų	й	ع	Ω		Ù	Ų	ู	Ł	Ù
1101 1010	332	218	DA	Ú				к	غ	Ϊ		Ú		ฺ	Ś	Ú
1101 1011	333	219	DB	Û	Ű	Û		л		Ϋ		Û			Ū	Û
1101 1100	334	220	DC	Ü				м		ά		Ü			Ü
1101 1101	335	221	DD	Ý		Ŭ	Ũ	н		έ		İ	Ý		Ż	Ý		Ę
1101 1110	336	222	DE	Þ	Ţ	Ŝ	Ū	о		ή		Ş	Þ		Ž	Ŷ	Þ	Ț
1101 1111	337	223	DF	ß				п		ί	‗	ß		฿	ß
1110 0000	340	224	E0	à	ŕ	à	ā	р	ـ	ΰ	א	à	ā	เ	ą	à
1110 0001	341	225	E1	á				с	ف	α	ב	á		แ	į	á
1110 0010	342	226	E2	â				т	ق	β	ג	â		โ	ā	â
1110 0011	343	227	E3	ã	ă		ã	у	ك	γ	ד	ã		ใ	ć	ã		ă
1110 0100	344	228	E4	ä				ф	ل	δ	ה	ä		ไ	ä
1110 0101	345	229	E5	å	ĺ	ċ	å	х	م	ε	ו	å		ๅ	å			ć
1110 0110	346	230	E6	æ	ć	ĉ	æ	ц	ن	ζ	ז	æ		ๆ	ę	æ
1110 0111	347	231	E7	ç			į	ч	ه	η	ח	ç	į	็	ē	ç
1110 1000	350	232	E8	è	č	è	č	ш	و	θ	ט	è	č	่	č	è
1110 1001	351	233	E9	é				щ	ى	ι	י	é		้	é
1110 1010	352	234	EA	ê	ę	ê	ę	ъ	ي	κ	ך	ê	ę	๊	ź	ê
1110 1011	353	235	EB	ë				ы	ً	λ	כ	ë		๋	ė	ë
1110 1100	354	236	EC	ì	ě	ì	ė	ь	ٌ	μ	ל	ì	ė	์	ģ	ì
1110 1101	355	237	ED	í				э	ٍ	ν	ם	í		ํ	ķ	í
1110 1110	356	238	EE	î				ю	َ	ξ	מ	î		๎	ī	î
1110 1111	357	239	EF	ï	ď	ï	ī	я	ُ	ο	ן	ï		๏	ļ	ï
1111 0000	360	240	F0	ð	đ		đ	№	ِ	π	נ	ğ	ð	๐	š	ŵ	ð	đ
1111 0001	361	241	F1	ñ	ń	ñ	ņ	ё	ّ	ρ	ס	ñ	ņ	๑	ń	ñ		ń
1111 0010	362	242	F2	ò	ň	ò	ō	ђ	ْ	ς	ע	ò	ō	๒	ņ	ò
1111 0011	363	243	F3	ó			ķ	ѓ		σ	ף	ó		๓	ó
1111 0100	364	244	F4	ô				є		τ	פ	ô		๔	ō	ô
1111 0101	365	245	F5	õ	ő	ġ	õ	ѕ		υ	ץ	õ		๕	ő
1111 0110	366	246	F6	ö				і		φ	צ	ö		๖	ö
1111 0111	367	247	F7	÷				ї		χ	ק	÷	ũ	๗	÷	ṫ	÷	ś
1111 1000	370	248	F8	ø	ř	ĝ	ø	ј		ψ	ר	ø		๘	ų	ø		ű
1111 1001	371	249	F9	ù	ů	ù	ų	љ		ω	ש	ù	ų	๙	ł	ù
1111 1010	372	250	FA	ú				њ		ϊ	ת	ú		๚	ś	ú
1111 1011	373	251	FB	û	ű	û		ћ		ϋ		û		๛	ū	û
1111 1100	374	252	FC	ü				ќ		ό		ü			ü
1111 1101	375	253	FD	ý		ŭ	ũ	§		ύ	LRM	ı	ý		ż	ý		ę
1111 1110	376	254	FE	þ	ţ	ŝ	ū	ў		ώ	RLM	ş	þ		ž	ŷ	þ	ț
1111 1111	377	255	FF	ÿ	˙			џ				ÿ	ĸ		’	ÿ
Dvojkově	Oct	Dec	Hex	1	2	3	4	5	6	7	8	9	10	11	13	14	15	16

Na pozici 0xA0 je vždy nezlomitelná mezera, na pozici 0xAD je většinou měkké rozdělovací znaménko, který se zobrazuje pouze na koncích řádků.

Zeleně podbarvená pole jsou nepřiřazená.

Žlutě podbarvená pole jsou nově přidané znaky podle ISO/IEC 8859-7:2003 a ISO/IEC 8859-8:1999. LRM je značka přepínající směr psaní zleva doprava (U+200E), RLM zprava doleva (U+200F).

Vztah k Unicode a UCS

Od roku 1991 Unicode Consortium společně s ISO a IEC vyvíjí Univerzální znakovou sadu (UCS) Unicode/ISO/IEC 10646. Novější vydání ISO/IEC 8859 popisují znaky pomocí Unicode/UCS jmen a kódů tvaru U+nnnn, což umožňuje vnímat jednotlivé části ISO/IEC 8859 jako kódovací schéma pro Unicode/UCS znaky, které převádí znaky z malých částí UCS na osmibitové kódy. Prvních 256 znaků Unicode a UCS je identických s ISO/IEC-8859-1 (Latin-1).

V 90. letech 20. století byly oblíbené jednobytové znakové sady včetně kódování ISO/IEC 8859 a kódování z nich odvozených, protože byly snadno implementovatelné a dobře známé: fakt, že jeden znak je kódován jedním bytem a zabírá jednu pozici na displeji, usnadňuje programování a dostačuje pro většinu aplikací umožňujících používat jediný jazyk a existují ne kombinační znaky nebo variantní tvary. Od doby, kdy se více rozšířily operační systémy podporující Unicode, používání ISO/IEC 8859 a dalších starších kódování pokleslo. Zatímco zbytky ISO 8859 a jednobytových znakových modelů jsou hluboce zakořeněné v mnoha operačních systémech, programovacích jazycích, systémy pro ukládání dat, síťových aplikacích, videoadaptérech i aplikačním softwaru pro koncové uživatele, většina moderních aplikací používá interně Unicode a pro převody kódování mezi Unicode a jinými kódy vyžaduje konverzní tabulky.

Vývojový status

Řadu standardů ISO/IEC 8859 vyvíjela pracovní skupina ISO/IEC Joint Technical Committee 1, Subcommittee 2, Working Group 3 (ISO/IEC JTC 1/SC 2/WG 3). V červnu 2004 byla pracovní skupina WG 3 rozpuštěna a její úkoly byly přeneseny na SC 2. Vývoj standardu ISO/IEC 8859 byl ukončen, protože jediná zbývající pracovní skupina, WG 2, se soustřeďuje na vývoj univerzální kódované znakové sady – Unicode.

Odkazy

Reference

V tomto článku byl použit překlad textu z článku ISO/IEC 8859 na anglické Wikipedii.

Publikovaná verze každé části ISO/IEC 8859 je za úhradu dostupná na serveru s ISO katalogem a na IEC Webstore Archivováno 12. 1. 2015 na Wayback Machine..
PDF verze posledních pracovních verzí některých částí ISO/IEC 8859 jak byly předloženy ISO/IEC JTC 1/SC 2/WG 3 pro revizi a publikaci jsou dostupné na WWW serveru WG 3:
- ISO/IEC 8859-1:1998 – Osmibitové jednobytové kódované grafické znakové sady, Část 1: Latinská abeceda čís. 1 (pracovní verze datovaná 12. února 1998, publikováno 15. dubna 1998)
- ISO/IEC 8859-4:1998 – Osmibitové jednobytové kódované grafické znakové sady, Část 4: Latinská abeceda čís. 4 (pracovní verze datovaná 12. února 1998, publikováno 1. července 1998)
- ISO/IEC 8859-7:1999 – Osmibitové jednobytové kódované grafické znakové sady, Část 7: Latinská/řecký abeceda (pracovní verze datovaná 10. června 1999; nahrazený novější verzí ISO/IEC 8859-7:2003, publikováno 10. října 2003)
- ISO/IEC 8859-10:1998 – Osmibitové jednobytové kódované grafické znakové sady, Část 10: Latinská abeceda čís. 6 (pracovní verze datovaná 12. února 1998, publikováno 15. července 1998)
- ISO/IEC 8859-11:1999 – Osmibitové jednobytové kódované grafické znakové sady, Část 11: Latinka/thajská znaková sada (pracovní verze datovaná 22. června 1999; nahrazena novější verzí ISO/IEC 8859-11:2001 publikovanou 15. prosince 2001)
- ISO/IEC 8859-13:1998 – Osmibitové jednobytové kódované grafické znakové sady, Část 13: Latinská abeceda čís. 7 (pracovní verze datovaná 15. dubna 1998, publikováno 10. října 1998)
- ISO/IEC 8859-15:1998 – Osmibitové jednobytové kódované grafické znakové sady, Část 15: Latinská abeceda čís. 9 (pracovní verze datovaná 1. srpna 1997; nahrazený novější verzí ISO/IEC 8859-15:1999, publikováno 15. března 1999)
- ISO/IEC 8859-16:2000 – Osmibitové jednobytové kódované grafické znakové sady, Část 16: Latinská abeceda čís. 10 (pracovní verze datovaná 15. listopadu 1999; nahrazený novější verzí ISO/IEC 8859-16:2001, publikováno 15. července 2001)
Standardy Ecma International, které úmyslně přesně odpovídají standardům ISO/IEC 8859 znakových sad, jsou následující:
- Standard ECMA-94: Osmibitové jednobytové kódované znakové sady – Latinské abecedy čís. 1 až 4, 2. vydání (červen 1986)
- Standard ECMA-113: Osmibitové jednobytové kódované znakové sady – Latinka/cyrilice 3. vydání (prosinec 1999)
- Standard ECMA-114: Osmibitové jednobytové kódované znakové sady – Latinka/arabská abeceda 2. vydání (prosinec 2000)
- Standard ECMA-118: Osmibitové jednobytové kódované znakové sady – Latinka/řecká abeceda (prosinec 1986)
- Standard ECMA-121: Osmibitové jednobytové kódované znakové sady – Latinka/hebrejská abeceda, 2. vydání (prosinec 2000)
- Standard ECMA-128: Osmibitové jednobytové kódované znakové sady – Latinská abeceda čís. 5, 2. vydání (prosinec 1999)
- Standard ECMA-144: Osmibitové jednobytové kódované znakové sady – Latinská abeceda čís. 6, 3. vydání (prosinec 2000)
ISO/IEC 8859-1 na Unicode zobrazení tabulky jako prosté textové soubory jsou na Unicode FTP serveru.
Neformální popisy a tabulky kódu pro většinu kódování ISO/IEC 8859 jsou dostupné na ISO/IEC 8859 Alphabet Soup (záložní server)

[1] Chybí několik samohlásek s diakritikou včetně Ǿ a ǿ, které mohou být nahrazeny znaky bez diakritiky za cenu zvětšené nejednoznačnosti.

[2] Chybí písmeno Ĳ/ĳ, které se obvykle zapisuje jako IJ.

[dva-3] Chybějící znaky jsou v ISO/IEC 8859-15.

[4] V 8859-5 chybí písmeno Ґ/ґ, které bylo vráceno do ukrajinské abecedy v roce 1990.

[1]

[2]

[3]

[4]

Znakové sady

Kódování znaků

Nejstarší telekomunikace	ASCII ISO/IEC 646 ISO/IEC 6937 T.61 BCD MTA-2 Morseova abeceda

ISO/IEC 8859	-1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 -13 -14 -15 -16

Bibliografické použití	ANSEL ISO 5426 / 5426-2 / 5427 / 5428 / 6438 / 6861 / 6862 / 10585 / 10586 / 10754 / 11822 MARC-8

Národní normy	ArmSCII CNS 11643 GOST 10859 GB 18030 HKSCS ISCII JIS X 0201 JIS X 0208 JIS X 0212 JIS X 0213 KPS 9566 KS X 1001 PASCII SI 960 TIS-620 TSCII VISCII YUSCII

EUC	CN JP KR TW

ISO/IEC 2022	CN JP KR CCCII

Kódové stránky v systému MacOS	Arabic CE Roman ChineseSimp / EUC-CN ChineseTrad / Big5 Croatian Cyrillic Devanagari Dingbats Farsi Greek Gujarati Gurmukhi Hebrew Icelandic Japonština / Shift-JIS Korejština / EUC-KR Roman Romanian Symbol Thai / TIS-620 Turkish Ukrainian

Kódové stránky v systému DOS	111 112 113 151 161 162 163 164 165 301 437 667 668 708 709 710 711 720 737 770 771 772 773 774 775 776 777 778 790 806 808 813 819 848 849 850 851 852 853 854 855 856 857 858 859 860 861 862 863 864 865 866 867 868 869 872 874 876 877 878 881 882 883 884 885 891 895 896 897 898 899 900 901 902 903 904 906 907 909 910 911 912 913 914 915 916 919 920 921 922 923 925 926 927 928 932 934 936 938 941 942 943 944 946 947 948 949 950 951 952 953 954 955 956 957 958 959 960 961 962 963 964 965 966 991 1004 1006 1008 1009 1010 1011 1012 1013 1014 1015 1016 1017 1018 1019 1020 1021 1023 1034 1036 1040 1041 1042 1043 1044 1046 1086 1088 1089 1090 1092 1098 1111 1114 1115 1116 1117 1118 1119 1124 1125 1126 1127 1129 1131 1133 1139 1161 1162 1163 1167 1168 1169 1174 1350 1351 1361 1362 1363 1373 Kamenický Mazovia MIK Iran System

Kódové stránky ve Windows	874 / TIS-620 932 / Shift JIS 936 / GBK 949 / EUC-KR 950 / Big5 1250 1251 1252 1253 1254 1255 1256 1257 1258 54936 / GB18030

Kódové stránky EBCDIC	1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 29 30 31 32 33 34 35 36 37/1140 38 39 40 251 252 254 256 257 258 259 260 264 273/1141 274 275 276 277/1142 278/1143 280/1144 281 282 283 284/1145 285/1146 286 287 288 289 290 297/1147 298 300 320 321 322 330 361 363 382 383 384 385 386 387 388 389 390 391 392 393 394 395 410 420/16804 421 423 424/12712 425 435 500/1148 803 829 833 834 835 836 837 838/1160 839 870/1153 871/1149 875/9067 880 881 882 883 884 885 886 887 888 889 890 892 893 905 918 930/1390 931 933/1364 935/1388 937/1371 939/1399 1001 1002 1003 1005 1007 1024 1025/1154 1026/1155 1027 1028 1030 1031 1032 1033 1037 1047/924 1068 1069 1070 1071 1073 1074 1075 1076 1077 1078 1079 1080 1081 1082 1083 1084 1085 1087 1091 1097 1110 1112/1156 1113 1122/1157 1123/1158 1130/1164 1132 1136 1137 1150 1151 1152 1159 1165 1278 1303 1364 JEF KEIS

Platformně závislé	ATASCII CDC display code DEC-MCS DEC Radix-50 ELWRO-Junior Fieldata GSM 03.38 HP roman8 PETSCII Znaková sada kalkulátorů TI WISCII Znaková sada ZX80 Znaková sada ZX Spectrum

Unicode / ISO/IEC 10646	UTF-8 UTF-16/UCS-2 UTF-32/UCS-4 UTF-7 UTF-1 UTF-EBCDIC GB 18030 SCSU BOCU-1

Různé kódové stránky	APL 293 310 351 907 Cork HZ KOI8 TRON

Příbuzná témata	Řídicí znaky (C0 C1) CCSID Kódování znaků v HTML Detekce znakové sady Han unifikace ISO 6429/IEC 6429/ANSI X3.64 mojibake

Standardy Ecma International

Aplikační rozhraní	ANSI escape kód Common Language Infrastructure Office Open XML OpenXPS

Souborové systémy (magnetické pásky)	Advanced Intelligent Tape DDS DLT Super DLT Holographic Versatile Disc Linear Tape Open (Ultrium-1) VXA

Souborové systémy (disky)	CD-ROM CD File System (CDFS) FAT FAT12 FAT16 FAT16B FD UDF Ultra Density Optical Universal Media Disc

Grafika	Universal 3D

Programovací jazyky	C++/CLI C# Eiffel JavaScript (E4X, ECMAScript)

Rádiová síťová rozhraní	NFC UWB

Ostatní	TC20 Elektromagnetická kompatibilita [1] TC12 Bezpečnost výrobků [2]

Seznam Ecma standardů (1961 - současnost)