Кодування
Позначення в python | Назва кодування | Опис |
---|---|---|
ascii | ASCII | Латинські літери, цифри та прості символи |
CP1251 | windows-1251 | Кирилічна кодування (російська та інші мови) |
koi8-r | KOI-8 | Кодування для російської мови |
utf-8 | UTF-8 | Юнікод-кодування, всі мови (довжина символу – 8 біт) |
UTF-8 – кодування символів юнікод у двійковому вигляді. Використовує від 1 до 4 байт. Оскільки найчастіше використовувані символи займають 1 байт (зокрема, аски-символи), то UTF-8 оптимальна для англійського тексту, але з азіатського. UTF-16 використовується для кодування 2-ма або 4-ма байтами.
Номер символу береться із стандарту Юнікоду. Для символів Юнікоду з номерами від U+0000 до U+007F (що займають один байт з нулем у старшому биті) кодування UTF-8 повністю відповідає 7-бітовому кодуванню US-ASCII.