Как MP3 Audio Format уменьшает размер данных?
1. Психоакустическая модель: Это ядро сжатия MP3. Это основано на том, как человеческое ухо воспринимает звук. Энкодер анализирует аудиосигнал и идентифицирует частоты и звуки, которые, вероятно, замаскируются более громкими звуками или менее воспринимаются для нашего слуха. Эти маскированные частоты затем либо сильно сжаты, либо полностью отбрасываются. Например, тихий высокочастотный звук, сыгранный одновременно с громким низкочастотным звуком, может быть совершенно неразборчивым, поэтому он удален.
2. Частотное преобразование: Аудиосигнал преобразуется из домена времени (амплитуда во времени) в частотную домен (амплитуда разных частот). Обычно это делается с использованием модифицированного дискретного косинусного преобразования (MDCT). Это представление обеспечивает более легкую идентификацию и манипулирование отдельными частотами.
3. Квантование: После частотного анализа значения амплитуды каждого частотного компонента квантованы. Это означает, что они округлены до ограниченного количества значений. Это вводит некоторую потерю информации, но, поскольку менее важные частоты были идентифицированы и потенциально удалены или сильно сжаты, звуковое воздействие сводится к минимуму.
4. Huffman Кодирование: Наконец, квантовые данные кодируются с использованием кода с переменной длиной под названием Huffman Coding. Это присваивает более короткие коды более частым данным и более длинным кодам менее частым данным, что приводит к дальнейшему снижению данных.
По сути, MP3 использует преимущества недостатков и ограничений человеческого слуха, чтобы значительно сократить объем данных, необходимых для представления звука, при этом стремясь поддерживать приемлемое качество звука. Уровень сжатия (и, следовательно, уменьшение размера) может быть скорректирован, что приводит к различным размерам файлов и различным уровням качества звука. Более высокие коэффициенты сжатия приводят к меньшим файлам, но потенциально более заметными артефактами или потерей верности.