一种PDF文档压缩方法、装置及电子设备制造方法及图纸

技术编号:22756925 阅读:31 留言:0更新日期:2019-12-07 04:46
本发明专利技术实施例提供了一种PDF文档压缩方法、装置及电子设备,涉及数据处理技术领域,所述方法包括:获得PDF文件中每个原始图像的大小;从各个原始图像中,选择满足预设清晰度条件的原始图像作为待压缩的原始图像;根据所述预设清晰度条件,确定各个待压缩的原始图像的目标大小;将每个待压缩的原始图像压缩至其对应的目标大小。采用本发明专利技术可以兼顾压缩效果和图像清晰度有效地压缩带有图片的PDF文档。

A PDF document compression method, device and electronic equipment

The embodiment of the invention provides a PDF document compression method, device and electronic equipment, relating to the technical field of data processing, the method includes: obtaining the size of each original image in the PDF file; selecting the original image satisfying the preset definition conditions as the original image to be compressed from each original image; determining each image to be compressed according to the preset definition conditions The target size of each original image to be compressed to its corresponding target size. The PDF document with picture can be effectively compressed with both compression effect and image clarity.

【技术实现步骤摘要】
一种PDF文档压缩方法、装置及电子设备
本专利技术涉及数据处理
,特别是涉及一种PDF文档压缩方法、装置及电子设备。
技术介绍
可移植文档格式(PortableDocumentFormat,PDF)是独特的跨平台文件格式,是便携文档格式的外语简称,它可把文档的文本、格式、字体、颜色、分辨率、链接及图形图像、声音、动态影像等所有的信息封装在一个特殊的整合文件中。人们想要快速传输数据,且不喜欢大量空间占用,所以人们常常需要压缩PDF文档。这是在不丢失有用信息的前提下,缩减数据量以减少存储空间,提高其传输、存储和处理效率,或按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间的一种技术方法。然而,专利技术人在实现本专利技术的过程中发现,现有技术至少存在如下问题:传统的文档压缩方法主要有以下两种:ZIP压缩非常适用于具有单一颜色或重复图案的大型区域的图像,以及包含重复图案的黑白图像。Acrobat仅支持8位ZIP压缩,它是“无损的”;它不会删除数据来减少文件大小,所以图像质量不会受到影响,但是压缩后的文件大小依然较大。JPEG压缩适合灰度或彩色图像,例如色调连续的照片。JPEG是“有损”压缩,也就是说其会删除图像数据而且可能会降低图像质量,其尝试在丢失信息最少的情况下减少文件大小。由于JPEG压缩会删除数据,因此,与ZIP压缩相比,虽然它所产生的文件大小可能会小很多,但是却会对图像的清晰度有所影响。可见,现有技术的PDF文档压缩方法不能够兼顾压缩效果和图像清晰度有效地压缩带有图片的PDF文档。
技术实现思路
本专利技术实施例的目的在于提供一种文档压缩方法及装置,以实现兼顾压缩效果和图像清晰度有效地压缩带有图片的PDF文档。具体技术方案如下:第一方面,提供了一种PDF文档压缩方法,所述方法包括:获得PDF文件中每个原始图像的大小;从各个原始图像中,选择满足预设清晰度条件的原始图像作为待压缩的原始图像;根据所述预设清晰度条件,确定各个待压缩的原始图像的目标大小;将每个待压缩的原始图像压缩至其对应的目标大小。可选的,所述方法还包括:获得PDF文件中的图像显示信息,所述图像显示信息中包括每一个图像显示大小;从各个原始图像中,选择满足预设的清晰度条件的原始图像作为待压缩的原始图像的步骤,包括:根据每个图像显示大小和所述每个原始图像大小,从各个原始图像中,确定满足所述预设的清晰度条件的待压缩的原始图像。可选的,所述根据每个图像显示大小和所述每个原始图像大小,从各个原始图像中,确定满足所述预设的清晰度条件的待压缩的原始图像的步骤,包括:计算每个原始图像大小与其图像显示大小之间的比例,作为该原始图像的分辨率;将分辨率大于预设阈值的各个原始图像,确定为满足预设的清晰度条件的待压缩的原始图像;所述根据预设的清晰度条件,确定每个待压缩的原始图像压缩后的目标大小的步骤,包括:根据所述预设阈值对各个待压缩的原始图像进行计算,获得每个待压缩的原始图像压缩后的目标大小。可选的,计算每个原始图像大小与其图像显示大小之间的比例,作为该原始图像的分辨率的步骤,包括:在文档100%显示比例下,用每个原始图像宽度除以该图像的显示图像宽度,得到每个原始图像大小与其图像显示大小之间的比例,作为该原始图像的分辨率;其中,所述宽度为水平方向的长度。可选的,所述计算获得每个待压缩的原始图像压缩后的目标大小的步骤,包括:计算原始图像宽度乘以预设阈值除以所述分辨率,得到目标宽度并取整;其中,所述宽度为水平方向的长度;根据原始图像宽度和高度的比值及目标图像宽度,等比地计算出目标高度并取整;其中,所述高度为竖直方向的长度。可选的,所述将每个待压缩的原始图像压缩至其对应的目标大小的步骤,包括:采用临近取样算法等比地将每个待压缩原始图像大小缩小至其对应的目标大小。第二方面,提供了一种PDF文档压缩装置,所述装置包括:获得模块,用于获得PDF文件中每个原始图像的大小;选择模块,用于从各个原始图像中,选择满足预设清晰度条件的原始图像作为待压缩的原始图像;确定模块,用于根据所述预设清晰度条件,确定各个待压缩的原始图像的目标大小;压缩模块,用于将每个待压缩的原始图像压缩至其对应的目标大小。可选的,所述装置还包括:图像显示获得模块,用于获得PDF文件中的图像显示信息,所述图像显示信息中包括每一个图像显示大小;所述选择模块,具体用于根据每个图像显示大小和所述每个原始图像大小,从各个原始图像中,确定满足所述预设的清晰度条件的待压缩的原始图像。可选的,所述选择模块,包括:分辨率计算单元和待压缩图像确定单元;所述分辨率计算单元,用于计算每个原始图像大小与其图像显示大小之间的比例,作为该原始图像的分辨率;所述待压缩图像确定单元,用于将分辨率大于预设阈值的各个原始图像,确定为满足预设的清晰度条件的待压缩的原始图像;所述确定模块,具体用于根据所述预设阈值对各个待压缩的原始图像进行计算,获得每个待压缩的原始图像压缩后的目标大小。可选的,所述分辨率计算单元,具体用于:在文档100%显示比例下,用每个原始图像宽度除以该图像的显示图像宽度,得到每个原始图像大小与其图像显示大小之间的比例,作为该原始图像的分辨率;其中,所述宽度为水平方向的长度。可选的,所述确定模块,包括:目标宽度计算单元和目标高度计算单元;目标宽度计算单元,用于计算原始图像宽度乘以预设阈值除以所述分辨率,得到目标宽度并取整;其中,所述宽度为水平方向的长度;目标高度计算单元,用于根据原始图像宽度和高度的比值及目标图像宽度,等比地计算出目标高度;其中,所述高度为竖直方向的长度。可选的,所述压缩模块,具体用于:采用临近取样算法等比地将每个待压缩原始图像大小缩小至其对应的目标大小。第三方面,提供了一种电子设备,所述电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。在本专利技术实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的PDF文档压缩方法。在本专利技术实施的又一方面,本专利技术实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的PDF文档压缩方法。本专利技术实施例提供的一种PDF文档压缩方法、装置及电子设备,能够针对PDF文件中满足预设清晰度条件的原始图像进行压缩。可见,应用本专利技术实施例能够只针对满足预设清晰度条件的原始图像进行压缩,既保持了图片的清晰度,又可以将PDF文档压缩至合适的大小,因此兼顾了压缩效果和图像清本文档来自技高网
...

【技术保护点】
1.一种可移植文档格式PDF文档压缩方法,其特征在于,包括:/n获得PDF文件中每个原始图像的大小;/n从各个原始图像中,选择满足预设清晰度条件的原始图像作为待压缩的原始图像;/n根据所述预设清晰度条件,确定各个待压缩的原始图像的目标大小;/n将每个待压缩的原始图像压缩至其对应的目标大小。/n

【技术特征摘要】
1.一种可移植文档格式PDF文档压缩方法,其特征在于,包括:
获得PDF文件中每个原始图像的大小;
从各个原始图像中,选择满足预设清晰度条件的原始图像作为待压缩的原始图像;
根据所述预设清晰度条件,确定各个待压缩的原始图像的目标大小;
将每个待压缩的原始图像压缩至其对应的目标大小。


2.根据权利要求1所述的方法,其特征在于:
所述方法还包括:获得PDF文件中的图像显示信息,所述图像显示信息中包括每一个图像显示大小;
从各个原始图像中,选择满足预设的清晰度条件的原始图像作为待压缩的原始图像的步骤,包括:
根据每个图像显示大小和所述每个原始图像大小,从各个原始图像中,确定满足所述预设的清晰度条件的待压缩的原始图像。


3.根据权利要求2所述的方法,其特征在于:
所述根据每个图像显示大小和所述每个原始图像大小,从各个原始图像中,确定满足所述预设的清晰度条件的待压缩的原始图像的步骤,包括:
计算每个原始图像大小与其图像显示大小之间的比例,作为该原始图像的分辨率;
将分辨率大于预设阈值的各个原始图像,确定为满足预设的清晰度条件的待压缩的原始图像;
所述根据预设的清晰度条件,确定每个待压缩的原始图像压缩后的目标大小的步骤,包括:
根据所述预设阈值对各个待压缩的原始图像进行计算,获得每个待压缩的原始图像压缩后的目标大小。


4.根据权利要求3所述的方法,其特征在于,计算每个原始图像大小与其图像显示大小之间的比例,作为该原始图像的分辨率的步骤,包括:
在文档100%显示比例下,用每个原始图像宽度除以该图像的显示图像宽度,得到每个原始图像大小与其图像显示大小之间的比例,作为该原始图像的分辨率;其中,所述宽度为水平方向的长度。


5.根据权利要求3所述的方法,其特征在于,所述计算获得每个待压缩的原始图像压缩后的目标大小的步骤,包括:
将所述原始图像的宽度乘以预设阈值并除以所述分辨率,得到目标宽度并取整;其中,所述宽度为水平方向的长度;
根据原始图像宽度和高度的比值及目标图像宽度,等比地计算出目标高度并取整;其中,所述高度为竖直方向的长度。


6.根据权利要求1所述的方法,其特征在于,所述将每个待压缩的原始图像压缩至其对应的目标大小的步骤,包括:
采用临近取样算法等比地将每个待压缩原始图像大小缩小至其对应的目标大小。


7.一种PDF文档压缩装置,其特征在于,包括:

【专利技术属性】
技术研发人员:邓斌章庆元
申请(专利权)人:北京金山办公软件股份有限公司珠海金山办公软件有限公司广州金山移动科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利