计算机文件的智能压缩和解压缩方法技术

技术编号:2878530 阅读:314 留言:0更新日期:2012-04-11 18:40
高效率压缩各种计算机文件的一种智能压缩方法。按照该方法,计算机文件中不同类型的数据信息(如文字,图象,声音等),可通过计算机自动识别,并自动采用适宜的无损或有损编码,进行高效地压缩。本发明专利技术中也包括相应的解压缩方法。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术所属的
是计算机。作为计算机文件而存放在计算机中的各种原始数据信息,如文字信息,图象信息和声音信息等,通常是未经压缩的。但当你在将它们打包带走或通过Internet及电话线进行传送时,你往往需要将它们进行适当压缩。计算机文件的压缩,目前有两种操作模式。一种是由人工识别文件的信息类型(如Text,Image,Speech等),并分别运行相应的压缩软件对其进行压缩(如用ARJ压缩文本文件、用LeadView压缩图象文件、用RealAudio压缩语音文件等)。用这种方式你可以得到所需要的压缩效果,但当一个文件中包括多个不同类型的信息单元或需要压缩多个文件时,这种压缩操作将会花费很多人工操作时间,并需购买许多种压缩软件。目前计算机文件的另一种压缩操作模式为不管什么类型的文件,均一律采用无损压缩编码。例如在modem中采用V.42bis芯片,对所传输的信息一律进行无损编码压缩,或用WinZip软件对各种文件一律进行无损编码压缩。这种压缩模式可以避免花费很多人工操作时间,但只能得到较低的压缩率。这种压缩方式更适用于字符信息,而不太适用于图象、声音等其它信息。本专利技术的目的,是为计算机文件的压缩提供一种智能的压缩方法。使用该方法,既可以通过计算机自动压缩任何一个或一组计算机文件,又可使文件中的不同信息类型(如文字信息,图象信息,声音信息等)都能得到高效的压缩。这种智能的压缩方法,可用计算机软件、计算机硬件、或计算机软件与硬件相结合的方式来实现。其流程框图如附图说明图1和图2所示。下面分别说明之。在压缩方,流程框图如图1所示。在流程的起始端,待压缩的一组文件是由用户选定的。图1中的其它步骤,是由计算机系统按照本专利技术自动执行的A.从上述待压缩的一组文件中选取任一文件,然后验证该文件的文件格式是否可识别的。为此,系统中需有已这样设定的一些文件类型第一、这些文件类型的文件格式是已知的,而且这些文件类型仅用无损编码不能得到高效的压缩;第二,这些文件类型是由两个列表来构成的一个为文件扩展名列表,该列表列出上述每个文件类型的文件扩展名;另一个为文件控制信息列表,该列表列出对应于上述每个文件扩展名的一些文件控制信息(文件头信息)。为了验证所选取文件的文件格式是否可识别的,系统将首先验证该文件的扩展名是否列在上述文件扩展名列表中。如果是,系统将接着验证该文件是否与其文件控制信息列表中的相应控制信息正好相符。上述两个验证均是肯定的,则该文件的文件格式为可识别的;有任一个验证是否定的,则该文件的文件格式不是可识别的。例如,Bitmap文件是一种图象文件类型。其约定的文件扩展名是bmp。它对应的控制信息为该文件的第1-2字节为BM,第2-5个字节标明该文件的实际图象数据长度,而第10-13个字节,表示该文件图象数据起始位置,等等。如果有一个标称为Picture.bmp的文件被选定要进行压缩时,系统将首先检查bmp是否列在文件扩展名列表中。如果是,系统将接下来验证该文件的前二个字节是否正好是BM,以及该文件的图象数据从该文件第10-13个字节标示的位置起始,其实际长度是否正好和该文件第2-5个字节所指示的长度相符。如果上述验证均是肯定的,则该Picure.bmp文件的文件格式是可识别的,否则该Picture.bmp文件的文件格式不是可识别的。B.如果该文件格式不是可识别的,则系统将自动用无损编码压缩该文件。C.如果该文件格式是可识别的,则系统将决定该文件是否为只包含一种数据信息类型的简单文件,或该文件为包含不只一种数据信息类型的复合文件。D.对于一个简单文件,根据该文件的格式,系统将可自动地识别该文件包含的数据信息类型,并自动采用一种适当的压缩编码。例如,自动地采用G 723编码压缩语音数据,自动采用JPEG编码压缩一个彩色图象数据等等。E.对于一个复合文件,例如一个RTF文件或HTML文件,根据该文件的文件格式,系统将自动地把该复合文件拆分为多个信息单元,每个单元只包含一种数据信息类型。从而系统可以采用与上述D相似的方式,自动地压缩每一信息单元中的数据信息。在本专利技术中,为减少操作的复杂性,系统也可自动采用无损编码压缩一个复合文件,而不采用将复合文件进行拆分的步骤。这种情形,未在图1中表示。F.为了保存这些文件已被压缩过的数据信息和相应的控制信息,系统需定义自身的文件包格式。该格式被定义为ICF格式(Intelligent Compression Format),具有文件扩展名icf。图1的最后一个步骤,即将每一个已压缩的文件形成为ICF文件。G.如果待压缩的文件还没有全部压缩完毕,则系统重复进行上述A到F的操作,直到待压缩的文件已全部压缩完毕。本专利技术也关系到一个已压缩文件的解压缩方法,如图2所示。在图2的起始端,具有icf扩展名的待解压文件,是由用户选定的。其余的动作均是由计算机系统自动完成的。操作如下从上述具有扩展名icf的拟解压文件中选取任一文件,然后根据该文件的控制信息,验证该文件是否确是一个ICF文件。如果该文件不是一个真正的ICF文件,便停止对该文件的解压操作,重新去选取另一个文件。如果该文件确是一个ICF文件,系统将进一步决定该文件是否为仅包含一种被压缩的数据信息类型的简单文件,或是包含多种被压缩的数据信息类型的复合文件。如果该文件是一个已被压缩的简单文件,系统将自动识别该文件中的数据信息类型,并且使用与压缩编码相应的解压编码,解压该文件中的数据信息。如果该文件是一个已被压缩的复合文件,并且该复合文件不是完全用无损编码进行压缩的,系统将自动地把该文件拆分为多个信息单元,每个单元只包含一种被压缩数据信息类型,并且按上述相似的方式分别解压每一个这样的单元。如果一个复合文件当初全是用一种无损编码进行压缩的,该复合文件将采用对应的无损编码来进行解压。这种情形未表示在图2中。图2的最后一步是形成一个已解压文件。如果上述具有icf扩展名的文件,还未被全部解压完毕,系统将自动重复上面的操作,直到上述待解压的具有icf扩展名的文件全部被解压完毕。基于本专利技术提供的方法,已开发出一种新型压缩软件,该软件使得各种计算机文件的压缩既简便又高效,远优于现有的各种计算机文件压缩工具。本专利技术提供的方法也可用于各种应用系统中,如用于e.mail,FTP,modem等系统中。权利要求1.通过计算机系统自动压缩不同类型计算机文件的方法,包含下列步骤(1)选取一个待压缩文件,并按下述操作验证该文件的文件格式是否可识别的a.系统中有这样设定的一些文件类型第一,这些文件类型的文件格式是已知的,并且这些文件类型仅用无损编码不能得到高效的压缩;第二,这些文件类型用下述两个列表来构成一个是文件扩展名列表,它列出上述每个文件类型的文件扩展名;另一个是文件控制信息列表,它列出对应于上述每个文件扩展名的一些文件控制信息(文件头信息)。b.为了验证已选文件的文件格式是否可识别的,系统将首先验证已选文件的文件扩展名是否列在上述文件扩展名列表中。如果是,系统将接着验证该文件是否与其控制信息列表中的相应控制信息正好相符。如果上述两个验证均是肯定的,则该文件的文件格式是可识别的,否则,该文件不是可识别的。(2)根据该文件文件格式之识别结果,对该文件进行压缩本文档来自技高网...

【技术保护点】
通过计算机系统自动压缩不同类型计算机文件的方法,包含下列步骤: (1) 选取一个待压缩文件,并按下述操作验证该文件的文件格式是否可识别的: a. 系统中有这样设定的一些文件类型:第一,这些文件类型的文件格式是已知的,并且这些文件类型仅用无损编码不能得到高效的压缩;第二,这些文件类型用下述两个列表来构成:一个是文件扩展名列表,它列出上述每个文件类型的文件扩展名;另一个是文件控制信息列表,它列出对应于上述每个文件扩展名的一些文件控制信息(文件头信息)。 b. 为了验证已选文件的文件格式是否可识别的,系统将首先验证已选文件的文件扩展名是否列在上述文件扩展名列表中。如果是,系统将接着验证该文件是否与其控制信息列表中的相应控制信息正好相符。如果上述两个验证均是肯定的,则该文件的文件格式是可识别的,否则,该文件不是可识别的。 (2) 根据该文件文件格式之识别结果,对该文件进行压缩,操作如下: a.如果该文件的文件格式不是可识别的,则用无损编码对之压缩。 b.如果该文件的文件格式是可识别的,而且该文件只包含一种数据信息类型,则根据该文件的信息类型,采用适宜的无损或有损编码,对之压缩。 c.如果该文件的文件格式是可识别的,并且该文件包含多种数据信息类型,则首先将该文件拆分为多个信息单元,每个信息单元只包含一种数据信息类型,然后根据各个单元的数据信息类型,分别采用适宜的无损或有损编码对之压缩。...

【技术特征摘要】

【专利技术属性】
技术研发人员:王金波
申请(专利权)人:北京九州计算机网络有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1