数据压缩可以分为无损压缩和有损压缩,有损,指的是压缩之后就无法完整还原原始信息,但是压缩率可以很高,主要应用于视频、话音等数据的压缩,因为损失了一点信息,人是很难察觉的,或者说,也没必要那么清晰照样可以看可以听;无损压缩则用于文件等等必须完整还原信息的场合。目前只归纳zip、rar、tar.gz、tar.bz常见的这几种,其他的以后接触了再进行补充。

注意:压缩率大小直接受源文件影响,所以不同类型源文件压缩效率差别会很大,以下数值仅可作参考,压缩率越低压缩效率越高,例如:100G压缩到10G压缩率为10%

普通文本文件压缩率对比

压缩格式 压缩率 占用cpu 耗时
7-zip 10% 50% 600s
win-zip 30% 65% 200s
WinRAR 25% 80% 240s
tar.gz 11% 55% 500s
tar.bz2 15% 65% 550s

影音文件压缩率对比

压缩格式 压缩率 占用cpu 耗时
7-zip 40% 80% 500s
win-zip 80% 80% 150s
WinRAR 45% 70% 450s
tar.gz 45% 65% 400s
tar.bz2 43% 70% 450s

参考资料

zip压缩原理分析 zip压缩原理及实现 tar压缩原理