Насколько сильно сжимается Zip-файл?
Формат файла zip был разработан Pkware. Ранняя разработка формата была завершена в 1986 году. Он позволяет сжимать и архивировать данные, экономя место на диске и упрощая резервное копирование и передачу больших файлов или файлов, состоящих из нескольких частей. На степень сжатия, которая может быть достигнута, влияет множество факторов.
Типы сжатия
Существует два типа сжатия файлов:без потерь и с потерями. Формат zip является примером сжатия без потерь, что означает, что сжатые данные могут быть возвращены в точное предыдущее состояние без дефектов. Сжатие с потерями отдает предпочтение эффективности, а не точности, позволяя заменять или полностью исключать данные. Формат без потерь не допускает методов сжатия, которые не позволяют идеально воссоздать исходные данные, даже если эти методы были бы более эффективными.
Методы
Формат zip включает спецификации для нескольких алгоритмических методов сжатия файлов. Используемый метод может иметь значительное влияние на достигаемый уровень сжатия. Некоторые из доступных методов включают сжатие, уменьшение, взрыв и сдувание. Из них наиболее широко используется дефляция. Это метод сжатия по умолчанию, используемый в Pkzip, WinZip и Info-Zip.
Изменчивость
Степень сжатия файла зависит от типа файла. Например, в текстовых файлах по умолчанию отсутствует сжатие, и каждый символ представлен отдельно в шестнадцатеричном формате. Шестнадцатеричная или шестнадцатеричная система счисления состоит из 16 уникальных односимвольных идентификаторов, способных представлять каждый байт в файле. Коэффициенты сжатия файлов такого типа, как правило, очень хорошие.
Многие мультимедийные форматы, такие как MP3, включают сжатие как часть стандарта формата. Степень сжатия таких файлов обычно низкая, что может даже привести к тому, что «сжатый» ZIP-файл будет больше исходного из-за дополнительных данных в ZIP-архиве.
Сравнение
Формат zip — не единственный используемый формат сжатия. Другие распространенные форматы сжатия включают RAR и 7-zip. По словам Игоря Павлова, разработчика 7-zip, стандартный формат zip уступает двум другим форматам на 30–40 % в зависимости от типа сжимаемых данных.
В ходе теста Павлов сжал полную установку Google Планета Земля 3.0.0616. Объем данных до сжатия составил 23,5 МБ. Стандартный формат zip обеспечивает примерно 62-процентное сжатие. Для сравнения, RAR обеспечивает степень сжатия 71%, а 7-zip — 76%.
Ограничения
Ранние воплощения формата zip были ограничены обработкой данных размером не более 4 гигабайт за раз. Это включало сжатый и несжатый размер отдельных файлов и общий размер архива после сжатия. Это ограничение снято в более поздних версиях формата с добавлением расширения zip64. Поддержка расширения zip64 по-прежнему ограничена.