Разница между кодированием и декодированием
Кодирование — это процесс преобразования данных между двумя форматами в соответствии с набором правил или формулой. Например, вы можете закодировать «abc» в «ABC», используя правила преобразования нижнего регистра в верхний. Декодирование представляет собой обратный процесс. Вы можете декодировать «ABC» в «abc», используя тот же набор правил. Существует множество различных приложений для кодирования и декодирования данных. Шифрование, например, представляет собой форму кодирования, в которой используется ключ. Без ключа закодированные данные не могут быть декодированы. Видеоданные кодируются, чтобы сделать их меньше, чтобы потоки видео высокой четкости можно было просматривать через Интернет.
Кодирование мультимедиа
Кодирование обычно используется для уменьшения размера аудио- и видеоданных. Программа кодер-декодер, называемая кодеком, применяет ряд математических алгоритмов, устраняющих избыточные данные. Например, предположим, что файл содержит данные «ABCDQABC». Алгоритм кодека № 1 может заключаться в замене «ABC» на «Z». В результате получится файл ZDQZ, который на 50 процентов меньше исходного файла. Алгоритм кодека № 2 может заменить «ABC?» с "Y" и "?ABC" с "X", где "?" указывает любой символ. В результате получится файл YX, который на 75% меньше исходного файла.
Декодирование мультимедиа
Декодирование использует тот же кодек для восстановления исходного файла из закодированного файла. Например, применение кодека № 1 к «ZDQZ» в обратном порядке заменяет «Z» на «ABC», чтобы создать исходный файл «ABCDQABC». Кодек № 1, который был на 50 процентов меньше, называется кодеком без потерь, потому что при декодировании всегда воссоздается исходный файл. Кодек № 2 декодирует «YX» с помощью «ABC??ABC», а затем пытается угадать, какие пропущенные символы. Кодек может угадать «DE», что приведет к «ABCDEABC». Кодек № 2, размер которого на 75% меньше, является кодеком с потерями, поскольку в процессе декодирования может быть создан файл, близкий к оригиналу, но не идентичный ему.
URL-адреса и наборы символов
Не всякое кодирование дает результат, который меньше, чем незакодированные данные. Например, URL-адрес «example.com/Secret of Life.html» недействителен, так как содержит пробелы. Веб-программист кодирует URL-адрес, который заменяет все пробелы на «%20», чтобы создать «example.com/Secret%20of%20Life.html». Процесс декодирования выполняет обратную операцию и заменяет «%20» пробелом. Точно так же программа базы данных может кодировать все данные в Unicode, основном наборе символов для большинства языков. Когда пользователь извлекает данные, программа декодирует Unicode в соответствии с языком пользователя и настройками клавиатуры.
Кодирование, которое невозможно декодировать
Некоторые кодировки не предназначены для декодирования. Хэш — это длинная строка случайных символов, используемая алгоритмом кодирования для получения зашифрованного результата, который невозможно расшифровать, даже если вы знаете хеш. Например, пароль пользователя может быть зашифрован с помощью хэша и сохранен в базе данных. Если хакер найдет базу данных, он не сможет расшифровать пароли. Когда пользователь входит в систему, система кодирует введенный пользователем пароль с помощью хэша и сравнивает результат с тем, который хранится в базе данных. Если пользователь забывает свой пароль, он должен его сменить, потому что система не знает его первоначальный пароль, а знает только его зашифрованное значение.