Как вычислить коэффициент сжатия: Коэффициент сжатия, формула и примеры – Коэффициент сжатия

Содержание

Коэффициент сжатия, формула и примеры

Определение и формула коэффициента сжатия

Любое вещество под воздействием внешнего давления может сжиматься, то ест в той или иной степени изменят свой объем. Так, газы при увеличении давления могу очень существенно уменьшать свой объем. Жидкость подвержена изменению объема при изменении внешнего давления в меньшей степени. Еще меньше сжимаемость у твердых тел. Сжимаемость отражает зависимость физических свойств вещества от расстояний между его молекулами (атомами). Сжимаемость характеризуют при помощи коэффициента сжатия (Тоже самое: коэффициент сжимаемости, коэффициент всестороннего сжатия, коэффициент объемного упругого расширения).

Встречаются различные обозначения коэффициента сжатия, чаще всего это буквы или . В виде формулы коэффициент сжатия запишем как:

   

где знак минус отражает тот факт, что увеличение давления ведет к уменьшению объема и наоборот. В дифференциальной форме коэффициент определяют как:

   

Объем связан с плотностью вещества, поэтому для процессов изменения давления при постоянной массе, можно записать:

   

Величина коэффициента сжатия зависит от природы вещества, его температуры и давления. Помимо всего выше сказанного коэффициент сжатия зависит от вида процесса, в котором происходит изменение давления. Так, в изотермическом процессе коэффициент сжатия отличается от коэффициента сжатия в адиабатном процессе. Изотермический коэффициент сжатия определяют как:

   

где — частная производная при T=const.

Адиабатический коэффициент сжатия можно найти как:

   

где — частная производная при постоянной энтропии (S). Для твердых веществ коэффициент сжимаемости изотермический и адиабатический различается очень мало и этим различием часто пренебрегают.

Между адиабатическим и изотермическим коэффициентами сжимаемости существует связь, которая отражается уравнением:

   

где и — теплоемкости при постоянном объеме и давлении.

Единицы измерения коэффициента сжатия

Основной единицей измерения коэффициента сжимаемости в системе СИ является:

   

В СГС:

=см2/дин

Примеры решения задач

3.Сжатие файлов при архивации

Все алгоритмы сжатия оперируют входным потоком информации с целью получения более компактного выходного потока при помощи некоторого преобразования. Основными техническими характеристиками процессов сжатия и результатов их работы являются:

·степень сжатия — отношение объемов исходного и результирующего потоков;

·скорость сжатия — время, затрачиваемое на сжатие некоторого объема информации входного потока, до получения из него эквивалентного выходного потока;

·качество сжатия — величина, показывающая, на сколько сильно упакован выходной поток при применении к нему повторного сжатия по тому же или другому алгоритму.

Алгоритмы, которые устраняют избыточность записи данных, называются алгоритмами сжатия данных, или алгоритмами архивации. В настоящее время существует огромное множество программ для сжатия данных, основанных на нескольких основных способах.

Все алгоритмы сжатия данных делятся на:

) алгоритмы сжатия без потерь, при использовании которых данные на приемной восстанавливаются без малейших изменений;

)алгоритмы сжатия с потерями, которые удаляют из потока данных информацию, незначительно влияющую на суть данных, либо вообще невоспринимаемую человеком.

Существует два основных метода архивации без потерь:

алгоритм Хаффмана (англ. Huffman), ориентированный на сжатие последовательностей байт, не связанных между собой,

алгоритм Лемпеля-Зива (англ. Lempel, Ziv), ориентированный на сжатие любых видов текстов, то есть использующий факт неоднократного повторения «слов» — последовательностей байт.

Практически все популярные программы архивации без потерь (ARJ, RAR, ZIP и т.п.) используют объединение этих двух методов — алгоритм LZH.

Алгоритм Хаффмана.

Алгоритм основан на том факте, что некоторые символы из стандартного 256-символьного набора в произвольном тексте могут встречаться чаще среднего периода повтора, а другие, соответственно, — реже. Следовательно, если $+o записи распространенных символов использовать короткие последовательности бит, длиной меньше 8, а для записи редких символов — длинные, то суммарный объем файла уменьшится.

Алгоритм Лемпеля-Зива. Классический алгоритм Лемпеля-Зива -LZ77, названный так по году своего опубликования, предельно прост. Он формулируется следующим образом: если в прошедшем ранее выходном потоке уже встречалась подобная последовательность байт, причем запись о ее длине и смещении от текущей позиции короче чем сама эта последовательность, то в выходной файл записывается ссылка (смещение, длина), а не сама последовательность.

4.Показатель степени сжатия файлов

Сжатие информации в архивных файлах производится за счет устранения избыточности различными способами, например за счет упрощения кодов, исключения из них постоянных битов или представления повторяющихся символов или повторяющейся последовательности символов в виде коэффициента повторения и соответствующих символов. Алгоритмы подобного сжатия информации реализованы в специальных программах-архиваторах (наиболее известные из которых arj/arjfolder, pkzip/pkunzip/winzip, rar/winrar) применяются определенные Сжиматься могут как один, так и несколько файлов, которые в сжатом виде помещаются в так называемый архивный файл или архив.

Целью упаковки файлов обычно являются обеспечение более компактного размещения информации на диске, сокращение времени и соответственно стоимости передачи информации по каналам связи в компьютерных сетях. Поэтому основным показателем эффективности той или иной программы-архиватора является степень сжатия файлов.

Степень сжатия файлов характеризуется коэффициентом Кс, определяемым как отношение объема сжатого файла Vc к объему исходного файла Vо, выраженное в процентах (в некоторых источниках используется обратное соотношение):

Кс=(Vc/Vo)*100%

Степень сжатия зависит от используемой программы, метода сжатия и типа исходного файла.

Наиболее хорошо сжимаются файлы графических образов, текстовые файлы и файлы данных, для которых коэффициент сжатия может достигать 5 — 40%, меньше сжимаются файлы исполняемых программ и загрузочных модулей Кс = 60 — 90%. Почти не сжимаются архивные файлы. Это нетрудно объяснить, если знать, что большинство программ-архиваторов используют для сжатия варианты алгоритма LZ77 (Лемпеля-Зива), суть которого заключается в особом кодировании повторяющихся последовательностей байт (читай — символов). Частота встречаемости таких повторов наиболее высока в текстах и точечной графике и практически сведена к нулю в архивах.

Кроме того, программы для архивации все же различаются реализациями алгоритмов сжатия, что соответственно влияет на степень сжатия.

В некоторые программы-архиваторы дополнительно включаются средства, направленные на уменьшение коэффициента сжатия Кс. Так в программе WinRAR реализован механизм непрерывного (solid) архивирования, при использовании которого может быть достигнута на 10 — 50% более высокая степень сжатия, чем дают обычные методы, особенно если упаковывается значительное количество небольших файлов однотипного содержания.

Характеристики архиваторов — обратно зависимые величины. То есть, чем больше скорость сжатия, тем меньше степень сжатия, и наоборот.

На компьютерном рынке предлагается множество архиваторов — у каждого свой набор поддерживаемых форматов, свои плюсы и минусы, свой круг почитателей, свято верящих в то, что используемый ими архиватор самый лучший. Не будем никого и ни в чем разубеждать — просто попытаемся беспристрастно оценить самые популярные архиваторы в плане функциональности и эффективности. К таковым отнесем WinZip, WinRAR, WinAce, 7-Zip — они лидируют по количеству скачиваний на софтовых серверах. Рассматривать остальные архиваторы вряд ли целесообразно, поскольку процент применяющих их пользователей (судя по числу скачиваний) невелик.

Тестирование алгоритмов сжатия некоторых архиваторов (дополнено)

Введение


Архиваторами мы пользуемся постоянно. На нашем сайте имеется подробное (пусть и давно написанное) описание наиболее популярных программ-архиваторов (Архиваторы: Взгляд со стороны), которое мы здесь повторять не будем, а займемся только алгоритмами сжатия, которые применяются в этих программах. В чем здесь проблема? Современные архиваторы предоставляют нам возможность на выбор использовать несколько алгоритмов сжатия. Вот, например, характеристики некоторых программ…

Форматы, поддерживаемые архиваторами

 Архиватор Упаковка и распаковка Только распаковка
 WinZip ZIP TAR, GZIP, BH, ARJ, LZH, ARC
 WinRar RAR, ZIP CAB, ARJ, LZH,TAR, GZ, ACE, UUE, BZ2, JAR, JSO
 WinAce ACE, ZIP, LHA, MSCAB RAR, ARC, ATJ, GZIP, TAR ZOO
 7-Zip 7Z, ZIP, GZIP, TAR, BZIP2 RAR, CAB, ARJ, CPIO, RPM, DEB, SPLIT
 Power Archiver TAR, BH, CAB, LHA, ZIP RAR, ACE, ARJ, GZIP, BZIP2, ARC, ZOO

В зависимости от обстоятельств, мы применяем архиватор как компрессор, от которого требуется сжать информацию для более быстрой передачи по каналам связи (почта и Интернет). В других случаях большее значение имеет функция собственно архивации, то есть преобразование информации в компактный вид (один файл), чтобы избавиться от разукомплектации и, кроме того, сократить место, занимаемое на диске за счет файловой таблицы. Соответственно, большой интерес представляет показатель сжатия исходной информации и показатель скорости переработки исходной информации. Целью нашего исследования является определение абсолютных и относительных показателей степени сжатия и быстродействия алгоритмов (форматов), которые предоставляются в наше распоряжение архиваторами, указанными в таблице…

Содержание исследования планируется в следующем виде:

1. Создание комплексного и частных (по типам файлов) наборов информации (папок) для проведения испытаний (тестов).

2. Проведение предварительных тестов на комплексном наборе и уточнение (по результатам) плана дальнейших локальных испытаний.

3. Обработка и анализ результатов с обоснованием рекомендаций по практическому применению разных алгоритмов (форматов) архивации.

В качестве показателя степени сжатия принимается процентное отношение размера сжатой папки к ее исходному размеру, а в качестве показателя быстродействия — скорость переработки как частное от деления исходного размера в килобайтах на время переработки в секундах. Собственно, измерения выполняются только в отношении времени (секундомером). Ошибка измерения времени может исказить показатель быстродействия, когда этот показатель очень большой (более 1000 кб/сек). В других случаях ошибкой можно пренебречь.

Определение общих характеристик основных архивных форматов


Для испытаний использовался материал, имитирующий некоторую «пользовательскую корзину», составленную из файлов формата DOC, HTM, JPG, MP3, PDF, TXT. Всего корзина содержит 359 папок и 3337 файлов, и имеет суммарный размер 208893 Кбайт (около 204 Мбайт). Состав этого набора приведен в следующей таблице:

Состав набора файлов для испытаний

 Тип Количество папок Количество файлов Размер, Кбайт На диске, Кбайт
 TXT 0 2 34781 34783
 HTM 329 2869 30913 36962
 DOC 3 24 31443 31474
 PDF 0 1 33691 33694
 JPG 26 430 40493 41382
 MP3 1 11 37571 37589
     
 Итого 359 3337 208893 215884

Каждое испытание заключалось в проведении цикла архивации с фиксацией времени работы архиватора от момента нажатия кнопки Add до момента открытия окна с содержанием полученного архивного файла.

Тестировавшиеся программы:

WinZip 8.1 SR-1
WinRar 3.30
WinAce 2.5
7Zip 3.13
Power Archiver 8.70 07b


Информация о конфигурации системы

Процессор Intel Celeron 1700MHz
256 Mb (DDR SDRAM)
HDD ST360015A (60 Gb, 7200PRM)
Windows 2000 Pro, SP3

Результаты испытаний приведены в следующих таблицах:

Результаты тестирования для формата ZIP

 Архиватор / Режим Размер, Кбайт Время, мин.-сек. Сжатие Скорость, Кбайт/с
     
 WinZip    
 Без сжатия 208893 — — —
 Норма 146408 2-00 70.0% 1740
 Максимум 145884 2-45 69.8% 1266
 Быстро 147690 1-58 70.7% 1770
 Очень быстро 149450 1-50 71.5% 1899
     
 WinRar    
 Обычно 146 078 2-22 69.9% 1471
 Максимум 145881 3-07 69.8% 1117
     
 WinAce    
 Норма 146 418 2-28 70.1% 1411
 Максимум 145844 2-40 69.8% 1305
     
 7-Zip    
 Норма/Deflate 145 480 3-22 69.6% 1034
 Ультра/Deflate 145 341 5-55 69.6% 588
 Ультра/Deflate64 144924 6-10 69.4% 565
     
 Power Archiver    
 Норма 146074 3-40 69.9% 950
 Максимум 145948 3-42 69.9% 941

В целом, сжатие, получаемое форматом ZIP, примерно одного порядка, и мало зависит от архиватора — за исключением архиватора 7-ZIP, в котором с помощью изменения метода сжатия можно несколько улучшить показатель и для формата ZIP. Размер словарей (архиваторы WinRar и 7-ZIP) специально в данной серии испытаний не изменялся, а устанавливался автоматически (по умолчанию).

Результаты тестирования формата RAR

 Режим Размер, Кбайт Время, мин.-сек. Сжатие Скорость, Кбайт/с
 Без сжатия 208893 — — —
 Store 209129 0-58 100.1% 3601
 Fastest 144017 6-00 68.9% 580
 Fast 143281 6-22 68.6% 547
 Normal 142830 6-40 68.4% 522
 Good 139826 6-58 66.9% 499
 Best 140023 7-25 67.0% 469
 Best (64kb) 140685 5-40 67.3% 614

В настройке режима возможно изменение размера словаря в пределах 64 — 4096 килобайт. По умолчанию устанавливается максимальный размер (4096 Кб), с которым и получены результаты в данной таблице. Только в строке Best (64kb) был установлен минимальный размер — 64 килобайта. Очевидно, что полученное изменение сжатия и быстродействия может служить аналогом для всех других строк этой таблицы.
Строки Good и Best проверялись, и их значения полностью подтвердились, поэтому нелогичный переход между ними нельзя считать следствием ошибок при тестировании.

Результаты тестирования формата ACE

 Режим Размер, Кбайт Время, мин.-сек. Сжатие Скорость, Кбайт/с
 Без сжатия 208893 — — —
 Normal 132978 8-30 63.7% 410
 Maximum 132918 8-42 63.6% 400
 Good 132925 9-50 63.6% 354
 Fast 133216 8-53 63.8% 397
 Super Fast 133273 8-46 63.8% 397
 Store 209136 1-48 100.1% 1934

Изменения режима работы архиватора WinAce в нашем случае мало влияют на показатели сжатия — разброс находится в пределах десятых долей процента.

Результаты тестирования формата 7z

 Режим Размер, Кбайт Время, мин.-сек. Сжатие Скорость, Кбайт/с
 Без сжатия 208893 — — —
 Нормальный 130964 9-24 64.2% 362
 Максимальный 130000 13-51 63.7% 246
 Быстрый 141922 4-16 69.6% 797
 Ультра (1 Мб) 131392 8-47 64.4% 387
 Ультра (6 Мб) 130101 11-40 63.8% 291
 Ультра (12 мб) 129871 12-47 63.7% 266
 Ультра (24 мб) — — — —
 Ультра (Deflate) 141171 3-15 69.2% 1046
 Ультра (PPMd) 140171 8-45 68.7% 389
 Ультра (Bzip2) 135342 7-32 66.4% 451

Примечание: в режиме Ультра (LZMA) при задании размера Словаря в 24 мегабайт скорость снизилась настолько, что проведение теста стало невозможным.

Для формата 7z архиватор позволяет устанавливать:

— Уровень (Быстрый, Нормальный, Максимальный, Ультра),
— Метод (LZMA, PPMd, Bzip2, Deflate),
— Размер словаря (32кб — 192 мб),
— Размер слова (8 — 255).

Как видим, возможно очень большое число комбинаций настройки режима работы архиватора, что может сбить пользователя с толку. Можно руководствоваться следующими посылками:

— Чем больше размер словаря, тем больше сжатие и время упаковки. Сжатие возрастает медленно, а время упаковки — вырастает очень сильно.

— То же самое — в отношении размера слова.

— Оптимальные настройки устанавливаются сами (настройки по умолчанию), и без надобности их можно не сбивать.


Результаты тестирования формата CAB

 Режим Размер, Кбайт Время, мин.-сек. Сжатие Скорость, Кбайт/с
 Без сжатия 208893 — — —
     
 PowerArchiver    
 Medium 140444 9-55 67.2% 351
 Maximum 137152 15-55 65.6% 219
     
 WinAce    
 Норма 144374 3-24 69.1% 1024
 Максимум 138538 12-54 66.3% 270

Формат CAB (cabinet file) основан на алгоритмах MS-Zip и LZX, поддерживается и применяется фирмой Microsoft. Распаковщики формата имеются в Windows 98 и выше. Алгоритм имеет открытый код и может свободно применяться всеми программистами.

Результаты тестирования форматов BH и LHA

 Режим Размер, Кбайт Время, мин.-сек. Сжатие Скорость, Кбайт/с
 Без сжатия 208893 — — —
     
 PowerArchiver, формат LHA    
 Norma 147518 4-40 70.6% 746
 Maximum 147518 4-47 70.6% 728
     
 PowerArchiver, формат BH    
 Norma 145912 2-16 69.8% 1536
 Maximum 145718 2-34 69.8% 1356

Показатели архивных форматов LHA и BH имеют уровень показателей архивного формата ZIP, и каких-то преимуществ не просматривается.

В общем, как видно, наилучшие показатели сжатия обеспечиваются форматами ACE и 7Z. Лучшие показатели быстродействия — показали форматы ZIP и BH. Дальнейшие испытания планируется провести по такой же принципиальной схеме, но с «корзинами» однородного состава, с форматами файлов: TXT, HTML, DOC, JPG, MP3, PDF.

Определение сжимаемости файлов разных форматов


Для обеспечения этой серии испытаний были составлены совершенно однородные по форматам файлов наборы, причем, повторяющиеся файлы в наборе исключались. Файлы EXE и DLL брались из системной папки Windows без всякого отбора. Дело в том, что файлы формата EXE бывают уже сжатыми и дальнейшее их сжатие — не имеет смысла. Характеристики наборов приводятся в следующей таблице:

Форматы файлов в наборах для испытаний

 Формат Кол-во папок Кол-во файлов Суммарный размер, Кбайт
 TXT 0 27 35096
 HTM 7 1371 25076
 DOC 1 33 37211
 PDF 0 1 33691
 JPG 26 430 40493
 MP3 2 11 37571
 EXE 0 316 32446
 DLL 0 184 40323
 XLS 6 15 17228
 CHM 0 69 33940
 MPEG 0 24 46606
 WAV 0 1 30804
 BMP 0 15 31713
 AVI 0 89 9261

При испытаниях использовался только нормальный (обычный) режим работы архиватора. При этом, каждый формат архива создавался собственным архиватором (WinZip, WinRar, WinAce, 7-Zip), для упаковки в формат CAB использовался Power Archiver, который своего (фирменного) формата не имеет.

Сжимаемость файлов в зависимости от формата архива

 Формат ZIP RAR ACE 7Z CAB
 TXT 43.7% 37.8% 37.4% 34.3% 36.3%
 HTM 29.2% 28.3% 9.09% 7.75% 15.0%
 DOC 8.76% 6.39% 5.47% 5.21% 6.49%
 PDF 97.7% 97.4% 97.8% 97.5% 97.3%
 JPG 98.5% 98.5% 85.0% 85.1% 97.9%
 MP3 98.1% 97.9% 98.1% 97.9% 97.7%
 EXE 46.9% 42.1% 37.8% 32.7% 39.3%
 DLL 45.6% 39.6% 37.6% 34.3% 39.6%
 XLS 11.8% 8.27% 7.44% 5.97% 8.49%
 CHM 98.6% 98.8% 99.0% 99.6% 98.6%
 MPEG 95.3% 94.7% 94.8% 94.5% 94.4%
 AVI 86.1% 84.1% 84.5% 82.7% 83.4%
 WAV 92.2% 62.8% 62.6% 87.0% 92.1%
 BMP 63.5% 31.9% 30.6% 51.5% 56.2%
      
 Средний показатель 65.5% 59.2% 56.2% 58.3% 61.6%

В качестве комментария к таблице можно отметить следующее:

— Наилучшее сжатие по основным форматам исходных файлов обеспечивается архивным форматом 7z.

— Лучший показатель в среднем имеет архивный формат ACE за счет рекордного сжатия форматов WAV и BMP.

Если говорить о сжимаемости исходных файлов, то можно отметить следующее: показатель сжатия зависит от исходного формата файлов, иногда подразумевающего внутреннее сжатие данных. Если файл предварительно уплотнен по своим алгоритмам, то сжимаемость его архиватором — небольшая. Например, файл формата CHM является уплотненным вариантом файла формата HTML и, соответственно, сжимаемость их — разная. То же мы видим в отношении Wav и MP3, BMP и JPG и так далее.

Скорость работы архиватора, Кбайт/с

 Формат ZIP RAR ACE 7Z CAB
 TXT 2064 408 386 217 226
 HTM 2507 836 627 643 411
 DOC 7400 2862 1550 1378 886
 PDF 2246 293 370 387 370
 JPG 2670 587 337 368 287
 MP3 2348 458 368 335 332
 EXE 2318 773 601 416 433
 DLL 2016 858 672 474 434
 XLS 4300 1436 1148 507 224
 CHM 1886 556 365 357 323
 MPEG 2453 583 416 370 338
 AVI 1852 617 463 370 356
 WAV 2370 1711 1184 354 288
 BMP 2883 1269 933 401 373
      
 Средний показатель 2838 856 609 485 385

Эта таблица демонстрирует очевидное правило — за лучшее сжатие почти всегда необходимо платить скоростью упаковки.

Сжимаемость разных форматов файлов. Дополнение

 Формат ZIP RAR ACE 7Z
 VXD 55.1% 52.5% 43.3% 40.8%
 INF 14.9% 13.3% 13.2% 12.3%
 VBP 78.3% 72.6% 26.0% 18.5%
 GIF 90.0% 94.3% 87.2% 86.1%
 SCR 88.8% 88.0% 88.1% 87.9%
 DAT 23.1% 20.1% 20.5% 18.0%
 INI 35.6% 33.2% 32.5% 30.2%
     
 Средний показатель 55.1% 53.4% 44.4% 42.0%

Эта таблица содержит дополнительные данные по сжимаемости файловых форматов. Здесь тестирование проводилось без фиксации времени на наборах небольшого объема (100-200 кб). Как видно, по всем форматам наилучшее сжатие дает архивный формат 7z.

Далее, в качестве примера приведу результаты упаковки реального дистрибутива программы Norton Antivirus. Упаковка выполнялась в нормальном режиме, дополнительно получены самораспаковывающиеся варианты этих же архивов. Результат этого испытания приведен в следующей таблице (последняя колонка — примерное время загрузки упакованного дистрибутива по сети при обычном модемном соединении при скорости 2.7 Кбайт в секунду):

Пример упаковки дистрибутива Norton Antivirus

 Формат архива Размер, Кбайт Время Сжатие Время загрузки, час.-мин.
 Без сжатия 47410 — — 4-53
 ZIP 29045 0-21 61.3% 2-59
 RAR 26619 1-15 56.1% 2-44
 ACE 23838 1-30 50.3% 2-27
 7Z 22871 1-50 48.2% 2-21
 CAB 26804 2-22 56.5% 2-45
 EXE (RAR) 26671 1-15 56.3% 2-45
 EXE (ACE) 23903 1-30 50.4% 2-28
 EXE (7Z) 22941 1-52 48.4% 2-22

Результаты таблицы наглядно демонстрируют, что:

При передачи файлов по сети — упаковка практически обязательна.

Упаковка с хорошим сжатием может сократить время передачи файла, в нашем случае — на полчаса.

Применение перспективных форматов ACE и 7Z вполне оправдано уже сейчас в виде самораспаковывающихся архивов. Это обстоятельство желательно учитывать распространителям программной продукции по сети Интернет.

Архиватор 7-ZIP является хорошей программой с высокой степенью сжатия и обладает необходимым минимумом пользовательских удобств. Можно, в частности, удалять и просматривать отдельные файлы без общей распаковки архива. При этом, файлы открываются ассоциативными приложениями системы. Можно дополнять архив отдельными файлами.

Заключение


Программы-архиваторы остаются незаменимым средством упаковки и сжатия цифровой информации. Обработанная информация существенно экономит место на хранителях и время передачи по каналам связи в сети. Наиболее популярными и применяемыми являются сейчас форматы упаковки ZIP и RAR. Другие форматы, например, ARJ, ICE, PAC, ARC и некоторые еще — постепенно вытеснились и подзабылись. Но технология упаковки не стоит на месте. Архиваторы — востребованы, поэтому программисты непрерывно ведут поиск более эффективных методов сжатия. Об этом свидетельствуют и результаты нашего эксперимента. Реально существуют, по крайней мере, два архивных формата (ACE и 7z), которые по сжатию существенно превосходят привычные ZIP и RAR. Применение этих форматов позволит заметно сократить время передачи файлов по сети Интернет, что соответствует интересам многочисленных пользователей…

Дополнение от 24 мая 2004 г.


В этом разделе мы рассмотрим влияние опции Solid на показатели работы архиваторов. Напомним, что упаковка с опцией Solid приводит к тому, что в архив нельзя добавить файл и нельзя из него извлечь отдельный файл, архив упаковывается и распаковывается только целиком. В общем случае это может вызывать определенные неудобства при использовании таких архивов. Но иногда такие неудобства могут иметь второстепенное значение в сравнении с преимуществами.

Дополнительное тестирование проделано в точности так, как это описано в основном разделе на тех же самых наборах материала. С учетом дополнительного тестирования таблица «Результаты тестирования формата RAR» основного текста стала выглядеть так…

Результаты тестирования формата RAR

 Режим Размер, Кбайт Время, мин.-сек. Сжатие Скорость, Кбайт/с
 Без сжатия 208893 — — —
 Store 209129 0-58 100.1% 3601
 Fastest 144017 6-00 68.9% 580
 Fast 143281 6-22 68.6% 547
 Normal 142830 6-40 68.4% 522
 Normal (Solid) 131664 9-14 63.0% 377
 Good 139826 6-58 66.9% 499
 Good (Solid) 129314 8-24 61.9% 414
 Best 140023 7-25 67.0% 469
 Best (Solid) 129527 8-36 62.0% 405
 Best (64kb) 140685 5-40 67.3% 614

Настройка архиватора WinRar включает в себя:

1. Выбор способа сжатия (Normal, Store, Fastest, Fast, Good, Best).

2. Выбор модификации:
— Add and replace files,
— Add and update files,
— Fresh existing files only,
— Syncronize axchive contents.

3. Выбор опции:
— Deleting files after archiving,
— Create SFX archive,
— Create solid archive,
— Put autohenlicity verification,
— Put recovery record,
— Test archived files,
— Lock archive.

Нетрудно заметить, что возможно более сотни комбинаций настроек, определяющих режим работы архиватора. Соответственно и диапазон результатов для этого формата и этого архиватора получился достаточно большим — степень сжатия: 61.9 — 68.9%, скорость: 377 — 614 Кбайт/сек.

Опцию Solid имеет также архиватор WinAce. Но в этом архиваторе опция (Make solid archive) включена постоянно (по умолчанию) и поэтому вошла в результаты тестирования. Таким образом, несправедливость была допущена только для формата RAR и архиватора WinRar.

С учетом новых обстоятельств таблица лидеров по степени сжатия выглядит так:

1. RAR (Good, Solid) — 61.9%.

2. 7-Zip (Максимум) — 62.2%.

3. ACE (Good) — 63.6%.

Дополненная таблица результатов упаковки реального дистрибутива программы Norton Antivirus («Пример упаковки дистрибутива Norton Antivirus») стала выглядеть так…

Пример упаковки дистрибутива Norton Antivirus

 Формат архива Размер, Кбайт Время Сжатие Время загрузки, час.-мин.
 Без сжатия 47410 — — 4-53
 ZIP 29045 0-21 61.3% 2-59
 RAR 26619 1-15 56.1% 2-44
 RAR (Normal, Solid) 22745 1-21 48.0% 2-20
 RAR (Good, Solid) 22680 1-28 47.8% 2-20
 ACE 23838 1-30 50.3% 2-27
 7Z 22871 1-50 48.2% 2-21
 CAB 26804 2-22 56.5% 2-45
 EXE (RAR) 26671 1-15 56.3% 2-45
 EXE (RAR, Normal, Solid) 22797 1-29 48.1% 2-21
 EXE (ACE) 23903 1-30 50.4% 2-28
 EXE (7Z) 22941 1-52 48.4% 2-22

Результаты этой таблицы также подтверждают, что архиватор WinRar может обеспечить максимальное сжатие, и по этому показателю является лидером. В сравнении с форматом ZIP загрузка этого же дистрибутива в формате RAR может осуществлена на 39 минут короче…

В таблице с результатами тестирования формата 7z наш читатель Александр Рыхлов обнаружил ошибку в расчете показателя сжатия. Александру большое спасибо, а исправленная таблица «Результаты тестирования формата 7z» стала выглядеть так…

Результаты тестирования формата 7z

 Режим Размер, Кбайт Время, мин.-сек. Сжатие Скорость, Кбайт/с
 Без сжатия 208893 — — —
 Нормальный 130964 9-24 62.7% 362
 Максимальный 130000 13-51 62.2% 246
 Быстрый 141922 4-16 67.9% 797
 Ультра (1 Мб) 131392 8-47 62.9% 387
 Ультра (6 Мб) 130101 11-40 62.3% 291
 Ультра (12 мб) 129871 12-47 62.2% 266
 Ультра (24 мб) — — — —
 Ультра (Deflate) 141171 3-15 67.6% 1046
 Ультра (PPMd) 140171 8-45 67.1% 389
 Ультра (Bzip2) 135342 7-32 64.8% 451

Примечание: в режиме Ультра (LZMA) при задании размера Словаря в 24 мегабайт скорость снизилась настолько, что проведение теста стало невозможным.

Заключение


Назревавшая было сенсация о том, что архиватор WinRar не настолько хорош, как это считают многие пользователи, не состоялась. Наше тестирование подтвердило, что технические характеристики этого архиватора действительно на сегодняшний день самые высокие. Очень близкие показатели имеет архиватор 7-Zip, но по степени отработки и ползовательским качествам последний пока несколько уступает лидеру. Для получения максимального сжатия в архиваторе WinRar необходимо включать опцию Solid (по умолчанию она отключена), другие настройки (Normal, Good и т.д.) — имеют меньшее значение.

§16. Сжатие данных

Главная | Информатика и информационно-коммуникационные технологии | Планирование уроков и материалы к урокам | 8 классы | Планирование уроков на учебный год (по учебнику К.Ю. Полякова, Е.А. Еремина, базовый уровень) | §16. Сжатие данных





Содержание урока

Зачем и как сжимать данные?

Сжатие без потерь

Сжатие с потерями

Программы-архиваторы

Выводы. Интеллект-карта

Вопросы и задания

Практическая работа № 5 «Использование архиватора»


Зачем и как сжимать данные?


Ключевые слова:


• сжатие данных 
• коэффициент сжатия 
• сжатие без потерь 
• сжатие с потерями
• архивация
• самораспаковывающийся
				 архив
• программа-архиватор 
• контрольная сумма 

Для того чтобы сэкономить место на внешних носителях (жёстких дисках, «флэшках») или ускорить передачу данных по компьютерным сетям, можно сжать данные — уменьшить их информационный объём, сократить размер файла.

Как вы уже знаете, рисунки часто хранятся в сжатом виде. Кроме того, сжатие почти всегда используется при хранении и передаче звука и видео — упаковку и распаковку этих данных выполняют специальные программы-кодеки.

Покажем, как можно сжать данные, на простом примере. Есть файл, в котором в 8-битной кодировке записаны сначала 100 русских букв А, а потом — 100 букв Б (рис. 2.39).

Рис. 2.39

Каждая буква на рис. 2.39 занимает 8 бит. Определите информационный объём файла в байтах.

Теперь запишем те же самые данные иначе: сначала количество повторений первого символа, а затем — сам первый символ, потом так же для второго символа (рис. 2.40).

Рис. 2.40

Каждая ячейка на рис. 2.40 занимает 8 бит. Определите информационный объём файла в байтах.

Объём файла уменьшился, это значит, что мы сжали данные.

Рис. 2.40Коэффициент сжатия — это отношение размера исходного файла IO к размеру сжатого файла IСЖ: kсж = IO / IСЖ

Определите коэффициент сжатия файла в рассмотренном выше примере.

Почему же этот файл удалось так удачно сжать? Всё дело в том, что в нём были длинные цепочки повторяющихся символов, и мы применили алгоритм, который очень удачно их сжимает. Этот алгоритм называется кодированием цепочек одинаковых символов (по-английски — RLE 1) : Run Length Encoding).


1) Алгоритм RLE можно успешно использовать для сжатия рисунков, в которых большие области закрашены одним цветом.


В файле записаны 100 различных символов. Определите коэффициент сжатия файла с помощью алгоритма RLE. Что означает полученное число?

Данные можно сжать, если в них есть какие-то закономерности (избыточность), например одинаковые символы, стоящие рядом, или одинаковые цепочки символов («слова»). Поэтому хорошо сжимаются данные, в которых таких закономерностей много, например тексты и рисунки. Хуже всего сжимаются случайные данные, в которых нет ничего закономерного.

Программы для сжатия данных выявляют избыточность данных и устраняют её, поэтому сжимать второй раз уже сжатые данные чаще всего бесполезно.

Следующая страница Рис. 2.40Сжатие без потерь

Cкачать материалы урока
Рис. 2.40

10.2. Коэффициенты сжатия, скорости и расхода

ПРИ ИСТЕЧЕНИИ ЧЕРЕЗ НЕЗАТОПЛЕННОЕ МАЛОЕ ОТВЕРСТИЕ

Для вычисления площади, скорости и расхода струи необходимо знать коэффициенты истечения и. Значения этих коэффициентов могут зависеть от нескольких факторов: формы и кромки отверстия, режима движения жидкости, поверхностного натяжения, а также от положения отверстия относительно стенок резервуара. Значение коэффициента сжатиядля данного отверстия зависит от степени сжатия струи.

Полное сжатие характеризуется тем, что струя вытекающей жидкости испытывает сжатие по всему периметру отверстия.

Неполное сжатие происходит в тех случаях, когда струя подвергается сжатию только на некоторой части периметра. Это может наблюдаться, например, когда отверстие в вертикальной или наклонной стенке резервуара примыкает непосредственно к дну (отсутствует сжатие по одной из сторон) или отверстие примыкает к дну и расположено в углу резервуара (отсутствует сжатие по двум сторонам),

При расположении отверстия в дне сосуда также может наблюдаться неполное сжатие. И в этом случае вдоль стенки (или стенок) резервуара, вплотную к которым примыкает отверстие, траектории частиц жидкости будут прямолинейными.

В связи с этим при одинаковой площади отверстия и прочих равных условиях площадь сечения, сжатого на некоторой части периметра, больше, чем площадь сечения, сжатого по всему периметру,. Отсюда получается, что при неполном сжатии коэффициент сжатиябольше, чемпри полном сжатии (для одинаковых прочих условий истечения).

При полном сжатии различают совершенное и несовершенное сжатие.

Совершенное сжатие характеризуется наибольшей кривизной траекторий крайних струек вытекающей струи и соответственно максимальным сжатием струи. Для получения совершенного сжатия струи отверстие должно быть достаточно удалено от боковых стенок и дна сосуда, а также от свободной поверхности.

Рис.10.3

Сжатие будет совершенным, если расстояния от любой грани отверстия (рис. 10.3) до стенок и дна резервуара (сосуда) будут больше, чем утроенный соответствующий поперечный размер отверстия, т. е. при и.

Несовершенное сжатие наблюдается при болей близком, чем указано, расположении отверстия к направляющим поток стенкам резервуара.

При несовершенном сжатии кривизна траекторий частиц вблизи отверстия меньше, чем при совершенном сжатии. В связи с этим сжатие по соответствующей стороне (близко расположенной к направляющей поток стенке или дну) уменьшается. Следовательно, площадь сжатого сечения при несовершенном сжатии и прочих равных условиях (в том числе и равной площади отверстия) больше, чем при совершенном сжатии. Естественно, коэффициентпри несовершенном сжатии больше, чемпри совершенном сжатии.

Итак, неполнота или несовершенство сжатия приводит к увеличению коэффициентов сжатия.

В условиях совершенного сжатия процесс истечения происходит под действием сил тяжести, вязкости и поверхностного натяжения, которые отражены соответственно (для круглого отверстия диаметром ):

числом Фруда ;

числом Рейнольдса ;

числом Вебера .

Влияние поверхностного натяжения наглядно демонстрируют опыты, в которых вблизи вытекающей в атмосферу струи воды устанавливали открытый сосуд с эфиром. Эфир испарялся, поверхностное натяжение на поверхности струи уменьшалось, коэффициент сжатия струи заметно увеличивался, соответственно расход также увеличивался.

А. Д. Альтшулем предложены следующие выражения для чисел Fr, Re и We:

;

,

т. е. в (10.7) принято =1 и, следовательно,.

Такой вид выражений для иудобнее, так как в них входят только известные величины и не входит расход, неизвестный до выполнения расчетов (вFr, Re и We входит ). Коэффициенты расхода, скорости и сжатия в общем случае для отверстия с острой кромкой являются функциями чисел Рейнольдса, Фруда и Вебера.

Многочисленные экспериментальные исследования истечения через отверстия различных жидкостей позволили А. Д. Альтшулю установить, что коэффициенты расхода при истечении через незатопленные круглые малые отверстия практически не зависят от влияния сил тяжести и поверхностного натяжения (т. е. наступает область, практически автомодельная относительно чиселFr и We) при соблюдении условий

,

т. е. при , и

.

Полученные зависимости ипри совершенном сжатии отпредставлены на рис. 10.4. Как видно, с увеличениемдо 105 коэффициент скорости растет, при дальнейшем увеличениизначениямогут считаться постоянными и равными= 0,97.

Коэффициент сжатия с ростомуменьшается, а при>105 коэффициент также может считаться постоянным и приниматься равным для совершенного сжатия 0,61-0,64.

Зависимость отдостаточно сложная. Вначале при небольших значенияхкоэффициентрастет, достигает максимума, а затем уменьшается, приближаясь при большихк постоянному значению, приблизительно равному 0,6.

Рис.10.4

При >105 можно считать, что для круглого отверстия не зависит от(наступает автомодельная область относительно). Точнее,перестает зависеть отпри. В этих условиях.

Коэффициенты расхода для малых квадратных и прямоугольных отверстий несколько отличаются от для круглых отверстий.

Коэффициенты расхода квадратных отверстий при могут быть найдены по формуле Ю. А Скобельцына, полученной в результате обработки опытных данных,

.

При коэффициентпрактически не зависит оти равен 0,6.

Коэффициенты расхода прямоугольных отверстий при определяются также по эмпирической формуле Ю. А. Скобельцына

.

При наступает автомодельность иперестает зависеть от, в этих условиях=0,62.

Следует обратить внимание на то, что в некоторых приведенных формулах число Рейнольдса определено по гидравлическому радиусу отверстия .

Неполное и несовершенное сжатие. При неполном сжатии коэффициент расхода больше, чемпри полном сжатии. Это увеличение отражено в эмпирической формуле, по которой определяетсяпри больших значенияхRe:

,

где — коэффициент расхода при полном сжатии;— периметр всего отверстия;— длина той части периметра, на которой сжатие отсутствует;— коэффициент, равный 0,13 для круглых и 0,15 для прямоугольных отверстий.

При полном, но несовершенном сжатии коэффициент расхода также больше, чем коэффициент расхода при совершенном сжатиии определяется по эмпирической формуле

,

где и— площади соответственно отверстия и стенки, в которой выполнено отверстие.

Как посмотреть степень сжатия архива – инструкция

Инструкция: как посмотреть степень сжатия архиваПриветствую!
В этой подробной пошаговой инструкции, с фотографиями, мы покажем вам, как узнать степень сжатия файлов в архиве.
Воспользовавшись этой инструкцией, вы с легкостью справитесь с данной задачей.

Узнаём степень сжатия архива

Для определения степени сжатия на компьютере должен быть установлен архиватор WinRar. Если он у вас не установлен, то вот в этой подобной пошаговой инструкции рассказывается о том, где его бесплатно скачать и как установить.

Открытие свойств файлаВызовите контекстное меню, кликнув правой клавишей мышки на интересующем архиве, для которого требуется определить степень сжатия.

В нём выберите пункт Свойства.

Окно свойств архиваВ открывшемся окне перейдите во вкладку Архив. Там в строке Степень сжатия будет указан интересующий нас параметр.

Если у вас остались вопросы, вы можете задать их в комментариях.

ЗакрытьМы рады, что смогли помочь Вам в решении поставленной задачи или проблемы.

В свою очередь, Вы тоже можете нам очень помочь.

Просто поделитесь статьей в социальных сетях с друзьями.

Поделившись результатами труда автора, вы окажете неоценимую помощь как ему самому, так и сайту в целом. Спасибо!

Опрос: помогла ли вам эта статья?  

(cбор пожертвований осуществляется через сервис Яндекс Деньги)

На что пойдут пожертвования \ реквизиты других платёжных систем

Привет.
Не секрет, что в экономике ныне дела обстоят не лучшим образом, цены растут, а доходы падают. И данный сайт также переживает нелёгкие времена 🙁
Если у тебя есть возможность и желание помочь развитию ресурса, то ты можешь перевести любую сумму (даже самую минимальную) через форму пожертвований, или на следующие реквизиты:

Номер банковской карты: 5331 5721 0220 5546
Кошелёк Яндекс Деньги: 410015361853797
Кошелёк WebMoney: P865066858877
PayPal: [email protected]
QIWI кошелёк: +79687316794
BitCoin: 1DZUZnSdcN6F4YKhf4BcArfQK8vQaRiA93

Оказавшие помощь:
Сергей И. — 500руб
<аноним> — 468руб
<аноним> — 294руб
Мария М. — 300руб
Валерий С. — 420руб
<аноним> — 600руб
Полина В. — 240руб

Деньги пойдут на оплату хостинга, продление домена, администрирование и развитие ресурса. Спасибо.
С уважением, создатель сайта IT-Actual.ru

Коэффициент сжимаемости, формула и примеры

Определение и формула коэффициента сжимаемости

Сжимаемостью называют свойство материи к изменению объема под воздействием равномерного внешнего давления. Характеристикой сжимаемости является коэффициент сжимаемости. Его так же называют коэффициентом сжатия, коэффициентом всестороннего сжатия, коэффициентом объемного упругого расширения. Сжимаемость является важной характеристикой вещества, так как она дает возможность судить о зависимости физических свойств от расстояний между его атомами (молекулами).

Обозначения коэффициента сжимаемости могут быть различными, чаще всего встречаются: . В математической форме определение коэффициента сжимаемости запишем как:

   

где знак минус означает, что рост давления ведет к уменьшению объема и наоборот.

Перейдя к дифференциалам коэффициент сжимаемости, будет определен как:

   

Коэффициент сжимаемости можно выразить через такую характеристику вещества как плотность ():

   

В механике грунтов коэффициент сжимаемости определяют как:

   

где — коэффициент пористости. Знак минус указывает на то, что увеличение давления ведет к уменьшению пористости.

Коэффициент сжимаемости зависит от вида вещества (его природы), температуры, давления. Кроме того, процесс в котором происходит сжатие, так же влияет на величину рассматриваемого коэффициента. Поэтому часто индексом обозначают процесс, например, изотермический, коэффициент сжатия при этом называют изотермическим коэффициентом сжатия ():

   

где частная производная от объема взята при постоянной температуре.

Коэффициенты сжимаемости для твердых тел, жидкостей и газов

Эмпирически полученные результаты коэффициентов сжимаемости твердых тел отражают периодическую зависимость от атомного веса элемента. Сжимаемость твердого тела можно определять при помощи измерения линейной деформации твердого тела под гидростатическим давлением. Для изотропного тела коэффициент линейной сжимаемости находят как:

   

где L — линейный размер тела.

У жидкостей сжимаемость существенно меньше, чем у газов. Это видно из кривой уравнения Ван-дер-Ваальса. На рис.1 жидкой фракции вещества соответствует участок AB. Крутизна данного участка говорит о том, что производная является малой величиной, следовательно, мал коэффициент .

Рис. 1

Коэффициент сжимаемости жидкостей лежит в пределах интервала: . Наибольшую сжимаемость среди жидкостей имеет жидкий гелий. Коэффициент сжимаемости зависит от давления и уменьшается с ростом давления. При обычных давлениях коэффициенты сжимаемости разных жидкостей существенно различны, тогда как при высоких давлениях величины всех жидкостей почти одинаковы. Коэффициент сжимаемости жидкости зависит от температуры: коэффициент сжимаемости увеличивается при росте температуры (исключение составляет вода). Для жидкостей используют следующую эмпирическую формулу вычисления коэффициента сжимаемости:

   

где A — некоторая функция температуры, p — внешнее давление, — давление, связанное с силами Ван-дер-Ваальса при температуре T. Выражение (7) является приближенной и используется для ограниченной области давлений. Сжимаемость растворов уменьшается при росте концентрации.

При давлениях близких к атмосферному сжимаемостью жидкости в гидравлических расчетах часто пренебрегают и учитывают ее только в особенных случаях, например, рассматривая явление гидроудара.

Изотермический коэффициент сжимаемости идеального газа равен:

   

Сжимаемость газа велика, в сравнении с жидкостями и твердыми телами.

Единицы измерения

Основной единицей измерения коэффициента сжимаемости в системе СИ является:

   

В СГС:

=см2/дин

Примеры решения задач

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *