Import codecs що робить

Кодування

Позначення в pythonНазва кодуванняОпис
asciiASCIIЛатинські літери, цифри та прості символи
CP1251windows-1251Кирилічна кодування (російська та інші мови)
koi8-rKOI-8Кодування для російської мови
utf-8UTF-8Юнікод-кодування, всі мови (довжина символу – 8 біт)

UTF-8 – кодування символів юнікод у двійковому вигляді. Використовує від 1 до 4 байт. Оскільки найчастіше використовувані символи займають 1 байт (зокрема, аски-символи), то UTF-8 оптимальна для англійського тексту, але з азіатського. UTF-16 використовується для кодування 2-ма або 4-ма байтами.

Номер символу береться із стандарту Юнікоду. Для символів Юнікоду з номерами від U+0000 до U+007F (що займають один байт з нулем у старшому биті) кодування UTF-8 повністю відповідає 7-бітовому кодуванню US-ASCII.