КОІ-8
КОІ-8 (код обміну інформацією, 8 бітів; рос. КОИ-8) — восьмибітова ASCII-сумісна кодова таблиця, розроблена для кодування букв кириличних алфавітів.
Існує також семибітова версія кодування, не повністю сумісна з ASCII — КОІ-7. КОІ-7 і КОІ-8 описані в ГОСТ 19768-74 (зараз нечинний).
Ідея
ред.Розробники КОІ-8 помістили символи російського алфавіту у верхній частині кодової таблиці таким чином, що позиції кириличних символів відповідають їхнім фонетичним аналогам в англійському алфавіті, в нижній частині таблиці. Це означає, що якщо в тексті, закодованому КОІ-8, прибрати восьмий біт кожного символу, то вийде прочитний текст, хоча й записаний латинськими символами. Наприклад, слова «Русский Текст» перетворяться на «rUSSKIJ tEKST». Як наслідок, символи кирилиці в таблиці виявилися розташованими не в алфавітному порядку.
Існує декілька варіантів кодування КОІ-8 для різних кириличних алфавітів. Російський алфавіт описується в кодуванні KOI8-R, український — у KOI8-U. KOI8-R став фактично стандартом для російської кирилиці в юнікс-подібних операційних системах і електронній пошті.
Андрій Чернов створив документ RFC 1489 («Registration of а Cyrillic Character Set»), який, проте, не належить до категорії RFC-стандартів. Існує RFC 2319 на KOI8-U.
RFC-2319. Стандарт кодування української мови сформований у RFC. Створено ініціативною групою - Павло Гульчук, Юрко Демченко, Євген Шерстобітов, Борис Мостовий, Ігор Романенко, Олександр Єременко, Андрій Стесін.[1]
За набором символів KOI8-R відповідає одному з варіантів альтернативного кодування. Стандарт RFC 1489 також стверджує наявність графічних символів «рамок» (псевдографіки), проте ця вимога виконується досить рідко.
Нижня частина таблиці кодування (латиниця) повністю відповідає кодуванню ASCII.
Кодування KOI8-R (російське)
ред..0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8− |
─ 2500 |
│ 2502 |
┌ 250C |
┐ 2510 |
└ 2514 |
┘ 2518 |
├ 251C |
┤ 2524 |
┬ 252C |
┴ 2534 |
┼ 253C |
▀ 2580 |
▄ 2584 |
█ 2588 |
▌ 258C |
▐ 2590 |
9− |
░ 2591 |
▒ 2592 |
▓ 2593 |
⌠ 2320 |
■ 25A0 |
∙ 2219 |
√ 221A |
≈ 2248 |
≤ 2264 |
≥ 2265 |
A0 |
⌡ 2321 |
° B0 |
² B2 |
· B7 |
÷ F7 |
A− |
═ 2550 |
║ 2551 |
╒ 2552 |
ё 451 |
╓ 2553 |
╔ 2554 |
╕ 2555 |
╖ 2556 |
╗ 2557 |
╘ 2558 |
╙ 2559 |
╚ 255A |
╛ 255B |
╜ 255C |
╝ 255D |
╞ 255E |
B− |
╟ 255F |
╠ 2560 |
╡ 2561 |
Ё 401 |
╢ 2562 |
╣ 2563 |
╤ 2564 |
╥ 2565 |
╦ 2566 |
╧ 2567 |
╨ 2568 |
╩ 2569 |
╪ 256A |
╫ 256B |
╬ 256C |
© A9 |
C− |
ю 44E |
а 430 |
б 431 |
ц 446 |
д 434 |
е 435 |
ф 444 |
г 433 |
х 445 |
и 438 |
й 439 |
к 43A |
л 43B |
м 43C |
н 43D |
о 43E |
D− |
п 43F |
я 44F |
р 440 |
с 441 |
т 442 |
у 443 |
ж 436 |
в 432 |
ь 44C |
ы 44B |
з 437 |
ш 448 |
э 44D |
щ 449 |
ч 447 |
ъ 44A |
E− |
Ю 42E |
А 410 |
Б 411 |
Ц 426 |
Д 414 |
Е 415 |
Ф 424 |
Г 413 |
Х 425 |
И 418 |
Й 419 |
К 41A |
Л 41B |
М 41C |
Н 41D |
О 41E |
F− |
П 41F |
Я 42F |
Р 420 |
С 421 |
Т 422 |
У 423 |
Ж 416 |
В 412 |
Ь 42C |
Ы 42B |
З 417 |
Ш 428 |
Э 42D |
Щ 429 |
Ч 427 |
Ъ 42A |
Інші варіанти
ред.показані лише неоднакові рядки таблиць, оскільки решта збігається
Кодування KOI8-U (українське)
ред..0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A− |
═ 2550 |
║ 2551 |
╒ 2552 |
ё 451 |
є 454 |
╔ 2554 |
і 456 |
ї 457 |
╗ 2557 |
╘ 2558 |
╙ 2559 |
╚ 255A |
╛ 255B |
ґ 491 |
╝ 255D |
╞ 255E |
B− |
╟ 255F |
╠ 2560 |
╡ 2561 |
Ё 401 |
Є 404 |
╣ 2563 |
І 406 |
Ї 407 |
╦ 2566 |
╧ 2567 |
╨ 2568 |
╩ 2569 |
╪ 256A |
Ґ 490 |
╬ 256C |
© A9 |
Кодування KOI8-RU (російсько-українсько-білоруське)
ред..0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A− |
═ 2550 |
║ 2551 |
╒ 2552 |
ё 451 |
є 454 |
╔ 2554 |
і 456 |
ї 457 |
╗ 2557 |
╘ 2558 |
╙ 2559 |
╚ 255A |
╛ 255B |
ґ 491 |
ў 45E |
╞ 255E |
B− |
╟ 255F |
╠ 2560 |
╡ 2561 |
Ё 401 |
Є 404 |
╣ 2563 |
І 406 |
Ї 407 |
╦ 2566 |
╧ 2567 |
╨ 2568 |
╩ 2569 |
╪ 256A |
Ґ 490 |
Ў 40E |
© A9 |
Кодування KOI8-C (кавказьке)
ред..0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | ғ 493 |
җ 497 |
қ 49B |
ҝ 49D |
ң 4A3 |
ү 4AF |
ұ 4B1 |
ҳ 4B3 |
ҷ 4B7 |
ҹ 4B9 |
һ 4BB |
▀ 2580 |
ҝ 49D |
ӣ 4E3 |
ө 4E9 |
ӯ 4EF |
9. | Ғ 492 |
Җ 496 |
Қ 49A |
Ҝ 49C |
Ң 4A2 |
Ү 4AE |
Ұ 4B0 |
Ҳ 4B2 |
Ҷ 4B6 |
Ҹ 4B8 |
Һ 4BA |
⌡ 2321 |
Ә 4D8 |
Ӣ 4E2 |
Ө 4E8 |
Ӯ 4EE |
A. | A0 |
ђ 452 |
ѓ 453 |
ё 451 |
є 454 |
ѕ 455 |
і 456 |
ї 457 |
ј 458 |
љ 459 |
њ 45A |
ћ 45B |
ќ 45C |
ґ 491 |
ў 45E |
џ 45F |
B. | № 2116 |
Ђ 402 |
Ѓ 403 |
Ё 401 |
Є 404 |
Ѕ 405 |
І 406 |
Ї 407 |
Ј 408 |
Љ 409 |
Њ 40A |
Ћ 40B |
Ќ 40C |
Ґ 490 |
Ў 40E |
Џ 40F |
Кодування KOI8-T (таджицьке)
ред..0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8. | қ 49B |
ғ 493 |
‚ 201A |
Ғ 492 |
„ 201E |
… 2026 |
† 2020 |
‡ 2021 |
‰ 2030 |
ҳ 4B3 |
‹ 2039 |
Ҳ 4B2 |
ҷ 4B7 |
Ҷ 4B6 |
||
9. | Қ 49A |
‘ 2018 |
’ 2019 |
“ 201C |
” 201D |
• 2022 |
– 2013 |
— 2014 |
™ 2122 |
› 203A |
||||||
A. | ӯ 4EF |
Ӯ 4EE |
ё 451 |
¤ A4 |
ӣ 4E3 |
¦ A6 |
§ A7 |
« AB |
¬ AC |
AD |
® AE |
|||||
B. | ° B0 |
± B1 |
² B2 |
Ё 401 |
Ӣ 4E2 |
¶ B6 |
· B7 |
№ 2116 |
» BB |
© A9 |
Кодування KOI8-O, KOI8-C (старослов'янська орфографія)
ред..0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8− |
Ђ 0402 |
Ѓ 0403 |
¸ 00B8 |
ѓ 0453 |
„ 201E |
… 2026 |
† 2020 |
§ 00A7 |
€ 20AC |
¨ 00A8 |
Љ 0409 |
‹ 2039 |
Њ 040A |
Ќ 040C |
Ћ 040B |
Џ 040F |
9− |
ђ 0452 |
‘ 2018 |
’ 2019 |
“ 201C |
” 201D |
• 2022 |
– 2013 |
— 2014 |
£ 00A3 |
· 00B7 |
љ 0459 |
› 203A |
њ 045A |
ќ 045C |
ћ 045B |
џ 045F |
A− |
00A0 |
ѵ 0475 |
ѣ 0463 |
ё 0451 |
є 0454 |
ѕ 0455 |
і 0456 |
ї 0457 |
ј 0458 |
® 00AE |
™ 2122 |
« 00AB |
ѳ 0473 |
ґ 0491 |
ў 045E |
´ 00B4 |
B− |
° 00B0 |
Ѵ 0474 |
Ѣ 0462 |
Ё 0401 |
Є 0404 |
Ѕ 0405 |
І 0406 |
Ї 0407 |
Ј 0408 |
№ 2116 |
¢ 00A2 |
» 00BB |
Ѳ 0472 |
Ґ 0490 |
Ў 040E |
© 00A9 |
Кодування ISO-IR-111, koi8-e
ред..0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
A− |
00A0 |
ђ 0452 |
ѓ 0453 |
ё 0451 |
є 0454 |
ѕ 0455 |
і 0456 |
ї 0457 |
ј 0458 |
љ 0459 |
њ 045A |
ћ 045B |
ќ 045C |
00AD |
ў 045E |
џ 045F |
B− |
№ 2116 |
Ђ 0402 |
Ѓ 0403 |
Ё 0401 |
Є 0404 |
Ѕ 0405 |
І 0406 |
Ї 0407 |
Ј 0408 |
Љ 0409 |
Њ 040A |
Ћ 040B |
Ќ 040C |
¤ 00A4 |
Ў 040E |
Џ 040F |
Кодування KOI8-Unified, koi8-f
ред..0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8− |
─ 2500 |
│ 2502 |
┌ 250C |
┐ 2510 |
└ 2514 |
┘ 2518 |
├ 251C |
┤ 2524 |
┬ 252C |
┴ 2534 |
┼ 253C |
▀ 2580 |
▄ 2584 |
█ 2588 |
▌ 258C |
▐ 2590 |
9− |
░ 2591 |
‘ 2018 |
’ 2019 |
“ 201C |
” 201D |
• 2022 |
– 2013 |
— 2014 |
© 00A9 |
™ 2122 |
00A0 |
» 00BB |
® 00AE |
« 00AB |
· 00B7 |
¤ 00A4 |
A− |
00A0 |
ђ 0452 |
ѓ 0453 |
ё 0451 |
є 0454 |
ѕ 0455 |
і 0456 |
ї 0457 |
ј 0458 |
љ 0459 |
њ 045A |
ћ 045B |
ќ 045C |
ґ 0491 |
ў 045E |
џ 045F |
B− |
№ 2116 |
Ђ 0402 |
Ѓ 0403 |
Ё 0401 |
Є 0404 |
Ѕ 0405 |
І 0406 |
Ї 0407 |
Ј 0408 |
Љ 0409 |
Њ 040A |
Ћ 040B |
Ќ 040C |
Ґ 0490 |
Ў 040E |
Џ 040F |
Некириличні варіанти KOI-8
ред.В деяких країнах РЕВ були створені модифікації КОІ-8 для національних варіантів латиниці. Базова ідея була та ж сама : при «зрізанні» восьмого біта текст мав лишатися більш-менш зрозумілим. Наприклад, в чеському варіанті КОІ-8 букви Čč повинні перетворюватися на cC, Žž — на zZ тощо. В наш час[коли?] ці кодування не використовуються.
Див. також
ред.Примітки
ред.- ↑ KOI8-U: Як це було. Архів оригіналу за 23 травня 2017. Процитовано 22 січня 2017.
Посилання
ред.- Офіційний сайт кодування КОІ-8 [Архівовано 18 березня 2022 у Wayback Machine.]
- RFC 1489
- RFC 2319