一种用于文件分类传输的方法和设备技术

技术编号:12203449 阅读:101 留言:0更新日期:2015-10-14 16:43
本发明专利技术公开了一种用于文件分类传输的方法和设备。该方法包括:识别待传输的多个文件的数据格式,所述数据格式分为压缩格式和非压缩格式;针对其数据格式属于所述非压缩格式的文件:按照各个文件的数据格式对文件进行分类;针对属于同一类别下的文件,根据该类别下的各个文件的大小确定针对各个文件的压缩策略,并按照各个文件的压缩策略对各个文件进行压缩,以在该类别下形成一个或多个压缩包;确定与该类别对应的数据通道,并通过所确定出的数据通道传输该类别下的所述一个或多个压缩包。由此,通过对文件进行分类压缩和传输,可以有效缩小文件大小,降低数据流量,从而可以提高传输效率。

【技术实现步骤摘要】

本专利技术涉及数据传输领域,具体地,涉及一种用于文件分类传输的方法和设备
技术介绍
在网络应用中,常常需要进行文件下载及上传。随着网络的不断发展,数据量日益激增,对文件传输的传输效率的要求越来越高。现有的用于文件传输的方法大都是将用户请求的文件集中传输给用户。例如,如果用户请求的文件中包括文本格式的文件和图片格式的文件,那么,通过现有的文件传输方法,会将文本格式的文件和图片格式的文件一起发送至客户端。如果图片格式的文件较大,那么直接将这两种文件一起发送可能会占用过多的数据通道的带宽,这就导致传输效率过低。对于移动客户端而言,还会导致移动客户端消耗过多的流量,从而用户需要付较多的费用。此外,如果由于图片格式的文件过大而导致传输失败时,用户可能也无法获得其需要的文本格式的文件(相对小的文件)。因而,用户的需求可能全部不能得到满足。在这种情况下,移动客户端可能需要频繁地进行重连和重试,进一步增加负载压力、消耗更多的流量。
技术实现思路
本专利技术的目的是提供一种用于文件分类传输的方法和设备,通过对不同数据格式的文件进行分类,以实现文件的分类压缩和传输,从而可以提高传输效率,降低数据流量。为了实现上述目的,本专利技术提供一种用于文件分类传输的方法,该方法包括:识别待传输的多个文件的数据格式,所述数据格式分为压缩格式和非压缩格式;针对其数据格式属于所述非压缩格式的文件:按照各个文件的数据格式对文件进行分类;针对属于同一类别下的文件,根据该类别下的各个文件的大小确定针对各个文件的压缩策略,并按照各个文件的压缩策略对各个文件进行压缩,以在该类别下形成一个或多个压缩包;确定与该类别对应的数据通道,并通过所确定出的数据通道传输该类别下的所述一个或多个压缩包。本专利技术还提供一种用于文件分类传输的设备,该设备包括:用于识别待传输的多个文件的数据格式的装置,所述数据格式分为压缩格式和非压缩格式;用于针对其数据格式属于所述非压缩格式的文件,按照各个文件的数据格式对文件进行分类的装置;用于针对属于同一类别下的文件,根据该类别下的各个文件的大小确定针对各个文件的压缩策略,并按照各个文件的压缩策略对各个文件进行压缩,以在该类别下形成一个或多个压缩包的装置;以及用于确定与该类别对应的数据通道,并通过所确定出的数据通道传输该类别下的所述一个或多个压缩包的装置。在上述技术方案中,通过对非压缩格式的文件进行分类,之后分类别进行文件压缩,由此可以保证同一个压缩包中的文件具有相同的数据格式。此外,根据文件类别来确定相应的数据通道,可以实现文件的分类传输,一种类别下的文件的传输可以不受其他类别下的文件的传输的影响。通过对文件进行分类压缩和传输,可以有效缩小文件大小,从而降低数据流量,减少输入/输出(I/O)负载压力。并且,通过上述方法还可以提高传输效率,在移动网络的环境下,可以有效减少移动终端的重连和重试的次数,从而满足用户需求。本专利技术的其他特征和优点将在随后的【具体实施方式】部分予以详细说明。【附图说明】附图是用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与下面的【具体实施方式】一起用于解释本专利技术,但并不构成对本专利技术的限制。在附图中:图1是根据本专利技术的实施方式的用于文件分类传输的方法的流程图。【具体实施方式】以下结合附图对本专利技术的【具体实施方式】进行详细说明。应当理解的是,此处所描述的【具体实施方式】仅用于说明和解释本专利技术,并不用于限制本专利技术。图1示出了根据本专利技术的实施方式的用于文件分类传输的方法。如图1所示,该方法可以包括:步骤S101,识别待传输的多个文件的数据格式,所述数据格式分为压缩格式和非压缩格式;针对其数据格式属于所述非压缩格式的文件:步骤S102,按照各个文件的数据格式对文件进行分类;步骤S103,针对属于同一类别下的文件,根据该类别下的各个文件的大小确定针对各个文件的压缩策略,并按照各个文件的压缩策略对各个文件进行压缩,以在该类别下形成一个或多个压缩包;步骤S104,确定与该类别对应的数据通道,并通过所确定出的数据通道传输该类别下的所述一个或多个压缩包。通过上述方法可以实现对文件的分类。首先,待传输的多个文件可首先被分为两大类,一是非压缩格式文件,一是压缩格式文件。该级分类可以被称作一级分类。在一级分类之后,可针对非压缩格式文件,再进行二级分类,如下所述。所述非压缩格式可以包括以下中的至少一者:二进制非压缩格式(例如,未压缩的图片格式、视频格式等)、普通文本格式、大文本格式。所述普通文本格式通常是指文件大小较小的文本格式,而大本文格式通常是指文件大小较大的文本格式。例如,可通过一预设大小来标定普通文本格式和大文本格式。即,在文本文件的大小大于或等于所述预设大小的情况下,该文本文件的格式为大文本格式;而在文本文件的大小小于所述预设大小的情况下,该文本文件的格式为普通文本格式。假设待传输的文件的数据格式包括所述二进制非压缩格式、所述普通文本格式和大文本格式这三种格式。那么,在进行一级分类之后,可针对非压缩格式文件再进行二级分类。例如,可以将其数据格式属于二进制非压缩格式的文件分为第一类,将其数据格式属于普通文本格式的文件分为第二类,以及将其数据格式属于大文本格式的文件分为第三类。在进行二级分类之后,可针对属于同一类别下的文件,根据该类别下的各个文件的大小确定针对各个文件的压缩策略。例如,可以通过以下方式来根据每种类别下的各个文件的大小确定针对各个文件的压缩策略:I)若文件的大小超过一阈值,则将该文件拆分成多个子文件,并对所述多个子文件分别压缩,以使每个压缩后的子文件的大小不超过所述阈值。优选地,可首先按照压缩率和所述阈值确定出每个子文件的大小上限。然后,根据要拆分的文件的大小和子文件的大小上限,来确定将文件最少拆分成多少个子文件。例如,文件大小为30M,确定出的子文件的大小上限为10M。那么,应当将文件拆分成3个子文件,例如可以将文件拆分成3个1M的子文件,而不要将文件拆分成6个5M的子文件。这样,可以在保证满足每个压缩后的子文件的大小不超过所述阈值这一条件的同时,尽可能减少子文件的个数,从而可以防止产生过多的压缩包,实现最优拆分。2)若文件的大小未超过所述阈值,则先将该文件与该类别下的其他文件打包成分组,并对所述分组进行压缩,以使压缩后的分组的大小不超过所述阈值。也就是说,在文件的大小未超过所述阈值的情况下,选取同类别下的哪些文件与该文件进行打包是根据压缩后的分组的大小不超过所述阈值这一原则进行的。优选地,可以根据压缩率和所述阈值确定一分组的大小上限。之后,在进行打包时,可根据该分组的大小上限来选择将多少个文件打包成一分组。例如,一个文件的大小为1M,另一个文件的大小为2M,又一个文件的大小为7M,以及所确定出的分组的大小上限为1M0那么,应当将这三个文件一起打包,而不是仅将其中的两个进行打包。这样,可以在保证满足压缩后的分组的大小不超过所述阈值这一条件的同时,尽可能减少分组的个数,从而可以防止产生过多的压缩包,实现最优打包。<当前第1页1 2 3 本文档来自技高网...

【技术保护点】
一种用于文件分类传输的方法,其特征在于,该方法包括:识别待传输的多个文件的数据格式,所述数据格式分为压缩格式和非压缩格式;针对其数据格式属于所述非压缩格式的文件:按照各个文件的数据格式对文件进行分类;针对属于同一类别下的文件,根据该类别下的各个文件的大小确定针对各个文件的压缩策略,并按照各个文件的压缩策略对各个文件进行压缩,以在该类别下形成一个或多个压缩包;确定与该类别对应的数据通道,并通过所确定出的数据通道传输该类别下的所述一个或多个压缩包。

【技术特征摘要】

【专利技术属性】
技术研发人员:徐江威
申请(专利权)人:东华软件股份公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1