文件压缩文件压缩是什么意思?干嘛要压缩文件?

文件压缩  时间:2021-08-20  阅读:()

压缩文件到底是怎么压缩的

压缩文件的基本原理是查找文件内的重复字节,并建立一个相同字节的"词典"文件,并用一个代码表示,比如在文件里有几处有一个相同的词"中华人民共和国"用一个代码表示并写入"词典"文件,这样就可以达到缩小文件的目的. 由于计算机处理的信息是以二进制数的形式表示的,因此压缩软件就是把二进制信息中相同的字符串以特殊字符标记来达到压缩的目的。

为了有助于理解文件压缩,请您在脑海里想象一幅蓝天白云的图片。

对于成千上万单调重复的蓝色像点而言,与其一个一个定义“蓝、蓝、蓝……”长长的一串颜色,还不如告诉电脑:“从这个位置开始存储1117个蓝色像点”来得简洁,而且还能大大节约存储空间。

这是一个非常简单的图像压缩的例子。

其实,所有的计算机文件归根结底都是以“1”和“0”的形式存储的,和蓝色像点一样,只要通过合理的数学计算公式,文件的体积都能够被大大压缩以达到“数据无损稠密”的效果。

总的来说,压缩可以分为有损和无损压缩两种。

如果丢失个别的数据不会造成太大的影响,这时忽略它们是个好主意,这就是有损压缩。

有损压缩广泛应用于动画、声音和图像文件中,典型的代表就是影碟文件格式mpeg、音乐文件格式mp3和图像文件格式jpg。

但是更多情况下压缩数据必须准确无误,人们便设计出了无损压缩格式,比如常见的zip、rar等。

压缩软件pression software)自然就是利用压缩原理压缩数据的工具,压缩后所生成的文件称为压缩包(archive),体积只有原来的几分之一甚至更小。

当然,压缩包已经是另一种文件格式了,如果你想使用其中的数据,首先得用压缩软件把数据还原,这个过程称作解压缩。

常见的压缩软件有winzip、winrar等。

有两种形式的重复存在于计算机数据中,zip就是对这两种重复进行了压缩。

  一种是短语形式的重复,即三个字节以上的重复,对于这种重复,zip用两个数字:1.重复位置距当前压缩位置的距离;2.重复的长度,来表示这个重复,假设这两个数字各占一个字节,于是数据便得到了压缩,这很容易理解。

  一个字节有 0 - 255 共 256 种可能的取值,三个字节有 256 * 256 * 256 共一千六百多万种可能的情况,更长的短语取值的可能情况以指数方式增长,出现重复的概率似乎极低,实则不然,各种类型的数据都有出现重复的倾向,一篇论文中,为数不多的术语倾向于重复出现;一篇小说,人名和地名会重复出现;一张上下渐变的背景图片,水平方向上的像素会重复出现;程序的源文件中,语法关键字会重复出现(我们写程序时,多少次前后copy、paste?),以几十 K 为单位的非压缩格式的数据中,倾向于大量出现短语式的重复。

经过上面提到的方式进行压缩后,短语式重复的倾向被完全破坏,所以在压缩的结果上进行第二次短语式压缩一般是没有效果的。

  第二种重复为单字节的重复,一个字节只有256种可能的取值,所以这种重复是必然的。

其中,某些字节出现次数可能较多,另一些则较少,在统计上有分布不均匀的倾向,这是容易理解的,比如一个 ASCII 文本文件中,某些符号可能很少用到,而字母和数字则使用较多,各字母的使用频率也是不一样的,据说字母 e 的使用概率最高;许多图片呈现深色调或浅色调,深色(或浅色)的像素使用较多(这里顺便提一下:png 图片格式是一种无损压缩,其核心算法就是 zip 算法,它和 zip 格式的文件的主要区别在于:作为一种图片格式,它在文件头处存放了图片的大小、使用的颜色数等信息);上面提到的短语式压缩的结果也有这种倾向:重复倾向于出现在离当前压缩位置较近的地方,重复长度倾向于比较短(20字节以内)。

这样,就有了压缩的可能:给 256 种字节取值重新编码,使出现较多的字节使用较短的编码,出现较少的字节使用较长的编码,这样一来,变短的字节相对于变长的字节更多,文件的总长度就会减少,并且,字节使用比例越不均匀,压缩比例就越大。

文件压缩有什么作用能节省多少磁盘空间

文件压缩,主要就是节省空间。

方便文件传输的。

节省空间要根据所压缩的文件,何所使用的软件而定。

并且还要分有损压缩和无损压缩。

我见过的最大压缩是用7-Zip压缩的。

把几个G的文件压缩成了几百M。

如果说的是windows的磁盘压缩选项,就如楼下说的一样。

省不了多少空间。

并且容易出问题。

写入速度也会减慢。

举个例子,如果在有压缩属性的硬盘下东西,软件不能提前申请硬盘空间,这样会产生大量的磁盘碎片,影响硬盘性能和寿命。

文件压缩是什么意思?干嘛要压缩文件?

一、有的文件压缩了``可以缩小容易``这样就不那么占用硬盘空间 二、还有就是为了方便,就是压缩打包,比如我们有一千个文件要用QQ传送给QQ好友或是传到网上,试想要传一千文件多累人```如果把一千个文件压缩打包后``就成了一个文件``到时候只要传送压缩包过去就行了``只要一解压``就能得到那一千个文件````` 满意请采纳

炭云188元/年,上海CN2 VPS/2核/384MB内存/8GB空间/800GB流量/77Mbps端口/共享IP

炭云怎么样?炭云(之前的碳云),国人商家,正规公司(哈尔滨桓林信息技术有限公司),主机之家测评介绍过多次。现在上海CN2共享IP的VPS有一款特价,上海cn2 vps,2核/384MB内存/8GB空间/800GB流量/77Mbps端口/共享IP/Hyper-v,188元/年,特别适合电信网络。有需要的可以关注一下。点击进入:炭云官方网站地址炭云vps套餐:套餐cpu内存硬盘流量/带宽ip价格购买上...

ParkInHost - 俄罗斯VPS主机 抗投诉 55折,月付2.75欧元起

ParkInHost主机商是首次介绍到的主机商,这个商家是2013年的印度主机商,隶属于印度DiggDigital公司,主营业务有俄罗斯、荷兰、德国等机房的抗投诉虚拟主机、VPS主机和独立服务器。也看到商家的数据中心还有中国香港和美国、法国等,不过香港机房肯定不是直连的。根据曾经对于抗投诉外贸主机的了解,虽然ParkInHost以无视DMCA的抗投诉VPS和抗投诉服务器,但是,我们还是要做好数据备...

DiyVM:香港VPS五折月付50元起,2核/2G内存/50G硬盘/2M带宽/CN2线路

diyvm怎么样?diyvm这是一家低调国人VPS主机商,成立于2009年,提供的产品包括VPS主机和独立服务器租用等,数据中心包括香港沙田、美国洛杉矶、日本大阪等,VPS主机基于XEN架构,均为国内直连线路,主机支持异地备份与自定义镜像,可提供内网IP。最近,DiyVM商家对香港机房VPS提供5折优惠码,最低2GB内存起优惠后仅需50元/月。点击进入:diyvm官方网站地址DiyVM香港机房CN...

文件压缩为你推荐
营业成本包括企业所得税季报表中的营业成本包括什么方便快捷请问普通中国人选择什么交通方式方便快捷安全文件名长度文件名 过长 很长很长 如何更改文件名?显示系统电视显示系统正在启动打不开怎么办网络接入怎样建立一个网络拨号连接?文件保护word保护文档怎么取消最好的电脑操作系统主流的电脑操作系统都有哪些?双11数据2015年天猫双11总成交额是多少亿?怎样清除历史记录清除历史记录小时代发布会完整版在《小时代》发布会上看到有主演穿COCOON(可可尼)的衣服耶,COCOON(可可尼)有赞助这部电视剧吗?
淘宝抢红包攻略 qq云存储 罗马假日广场 阿里云os 老鹰主机 Dedicated php免费空间 南昌服务器托管 cpanel空间 申请个人网站 双线主机 双11秒杀 百度云1t 免费dns解析 paypal注册教程 彩虹云 根服务器 789电视剧网 移动王卡 apachetomcat 更多