1. камеры
  2. Аудио & Электроника автомобиля
  3. Главная Аудио
  4. Личная Аудио
  5. телевизоры
  6. Умный дом
  >> Россия Электронный Технологии >  >> Умный дом >> Умная жизнь

UTF 7 и UTF 8

UTF-7 и UTF-8 являются типами формата преобразования Unicode, стандарта, используемого для кодирования 16-битных символов Unicode, таких как международные буквы и специальные символы, в формате, который может передаваться через 7-битные или 8-битные системы. UTF-8 является наиболее часто используемым форматом кодирования, популярным на веб-страницах и во многих программах электронной почты. UTF-7 обеспечивает кодировку для некоторых протоколов электронной почты, которые не будут работать с UTF-8.

Юникод

Юникод — это международный стандарт представления символов в виде целых чисел. Он использует 16 бит на символ по сравнению с семью битами, используемыми ASCII, американским стандартным кодом для обмена информацией. ASCII может воспроизводить только 128 символов по сравнению с 65 000 уникальных символов, доступных в Unicode. Этот более широкий диапазон символов делает Unicode более подходящим для языков Восточной Азии и других языков с большим набором символов, но символы Unicode должны быть закодированы, если они должны передаваться по 7-битным или 8-битным каналам.

UTF-8

UTF-8 — это наиболее распространенный универсальный формат преобразования, используемый для преобразования символов Юникода в 8-битные сегменты для передачи через Интернет по электронной почте или по другим 8-битным каналам. Этот формат кодирования изменяет каждый символ Unicode на один-четыре октета, в зависимости от целочисленного значения символа Unicode, и очень эффективен для документов, в которых в основном используются буквы, также встречающиеся в наборе символов ASCII. UTF-8 обычно занимает больше места, чем однобайтовая кодировка для незападных алфавитов.

UTF-7

UTF-7 — это особый вариант универсального формата преобразования, впервые предложенный в середине 1990-х годов. Он был разработан для представления текста Unicode строкой символов ASCII, создавая более эффективный метод кодирования для электронной почты, чем UTF-8, плюс кодирование с возможностью печати в кавычках, необходимое для передачи по 7-битному пути данных. Использование кодировки UTF-7 значительно уменьшает размер закодированных символов.

Соображения

Хотя UTF-7 более эффективна для 7-битных каналов, чем UTF-8 плюс кавычки, большинство авторитетных источников, включая Консорциум электронной почты Интернета и Microsoft Developer Network, рекомендуют использовать UTF-8 вместо UTF-7, когда это возможно. Это связано с тем, что UTF-7 создает проблемы с безопасностью и надежностью, которых нет в его 8-битном родственнике. IMC также рекомендует, чтобы все программы для отображения почты, созданные после 1 января 1999 г., могли отображать почту в кодировке UTF-8.


  1. Как войти в BIOS MacBook
  2. Как использовать клавиатуру Mac в качестве MIDI-устройства в Pro Tools
  3. Как устранить неполадки в системе объемного звучания Sony
  4. Как преобразовать веб-страницы в обычный текст
  5. Как вставить символы Unicode в Facebook