UTF 7 и UTF 8
UTF-7 и UTF-8 являются типами формата преобразования Unicode, стандарта, используемого для кодирования 16-битных символов Unicode, таких как международные буквы и специальные символы, в формате, который может передаваться через 7-битные или 8-битные системы. UTF-8 является наиболее часто используемым форматом кодирования, популярным на веб-страницах и во многих программах электронной почты. UTF-7 обеспечивает кодировку для некоторых протоколов электронной почты, которые не будут работать с UTF-8.
Юникод
Юникод — это международный стандарт представления символов в виде целых чисел. Он использует 16 бит на символ по сравнению с семью битами, используемыми ASCII, американским стандартным кодом для обмена информацией. ASCII может воспроизводить только 128 символов по сравнению с 65 000 уникальных символов, доступных в Unicode. Этот более широкий диапазон символов делает Unicode более подходящим для языков Восточной Азии и других языков с большим набором символов, но символы Unicode должны быть закодированы, если они должны передаваться по 7-битным или 8-битным каналам.
UTF-8
UTF-8 — это наиболее распространенный универсальный формат преобразования, используемый для преобразования символов Юникода в 8-битные сегменты для передачи через Интернет по электронной почте или по другим 8-битным каналам. Этот формат кодирования изменяет каждый символ Unicode на один-четыре октета, в зависимости от целочисленного значения символа Unicode, и очень эффективен для документов, в которых в основном используются буквы, также встречающиеся в наборе символов ASCII. UTF-8 обычно занимает больше места, чем однобайтовая кодировка для незападных алфавитов.
UTF-7
UTF-7 — это особый вариант универсального формата преобразования, впервые предложенный в середине 1990-х годов. Он был разработан для представления текста Unicode строкой символов ASCII, создавая более эффективный метод кодирования для электронной почты, чем UTF-8, плюс кодирование с возможностью печати в кавычках, необходимое для передачи по 7-битному пути данных. Использование кодировки UTF-7 значительно уменьшает размер закодированных символов.
Соображения
Хотя UTF-7 более эффективна для 7-битных каналов, чем UTF-8 плюс кавычки, большинство авторитетных источников, включая Консорциум электронной почты Интернета и Microsoft Developer Network, рекомендуют использовать UTF-8 вместо UTF-7, когда это возможно. Это связано с тем, что UTF-7 создает проблемы с безопасностью и надежностью, которых нет в его 8-битном родственнике. IMC также рекомендует, чтобы все программы для отображения почты, созданные после 1 января 1999 г., могли отображать почту в кодировке UTF-8.