一种快速判断PDF文件中全页面电子签章的方法技术

技术编号：40406582 阅读：6 留言：0更新日期：2024-02-20 22:28

本发明专利技术提供一种快速判断PDF文件中全页面电子签章的方法，涉及电子签章判断技术领域。该快速判断的方法，包括以下步骤：S1.文件输入；S2.分析拆页；S3.碎片化文件；S4.识别清洗；S5.计算签章占比；S6.判断签章；S7.属性对比；S8.结果提示。本发明专利技术提供一种快速判断PDF文件中全页面电子签章的方法，该方法通过对大文件的分析，对文件内容进行拆页分解，使大文件变成碎片化的数据文件，再对碎片化文件进行识别清洗，按照一定的规则判断碎片数据是否有签章，识别并记录整个文件各页的签章情况，从而减少人工投入，提高工作效率，对文件签章情况进行预警，减少文件因签章遗漏被作废的风险。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及电子签章判断，具体为一种快速判断pdf文件中全页面电子签章的方法。

技术介绍

1、pdf文件中全页面电子签章是一种在整个pdf页面上应用的电子签名。与传统的电子签名只是在特定位置或页面上显示不同，全页面电子签章会将签名应用于整个pdf页面，以确保文档的完整性和真实性。全页面电子签章可以包含数字签名、时间戳和认证信息，以验证签名的有效性和可信性。它通常由数字证书和相关的私钥生成，并且具有唯一的标识符，可以通过数字验证来确认签名者的身份和签名的有效性。通过应用全页面电子签章，可以确保整个pdf文档在签名后没有被篡改或修改，从而提供更高的安全性和保障。这种签章形式适用于需要对整个pdf文档进行保护和验证的场景，比如合同、法律文件等。

2、在招投标项目业务开展时往往需要对投标文件、建设方案等文件进行签章，这些文件有文件大、页数多等特点，在签章后需要对所有的页面进行检查是否有签章，现有方法中判别全页面电子签章的方式大多都是通过人工进行翻阅，这种判别方式效率低，耗时长，非常影响工作效率。

技术实现思路

1、针对现有技术的不足，本专利技术提供了一种快速判断pdf文件中全页面电子签章的方法，解决了现有人工判别pdf文件中全页面电子签章方法效率低的问题。

2、为实现以上目的，本专利技术通过以下技术方案予以实现：一种快速判断pdf文件中全页面电子签章的方法，具有包括以下步骤：

3、s1.文件输入

4、输入需要判断的电子档签章pdf文件；p>

5、s2.分析拆页

6、在取到签章文件后，通过输入流读取文件，利用文件流技术根据文件页面树将文件进行拆页分组，有多少页即多少组，即一个pdf文件拆分成n(页数)个pdf文件；

7、s3.碎片化文件

8、将拆分后的pdf文件进行碎片化，即将pdf中的文字、图片、矢量图、缩略图、注释信息进行拆分，提取pdf中的所有图片信息，按顺序保存下来；

9、s4.识别清洗

10、将提取到的图片进行识别清洗；

11、s5.计算签章占比

12、计算图片中红色占比(q)＝m/(长*宽)，因签章中红色部分需要一定的占比，故如果q大于0.15说明为签章图片；

13、s6.判断签章

14、重复步骤s3-s5处理w组碎片数据图片，如果w组数据中有多组数据包含签章图片，且签章图片一样，即可判断该签章图片为全页面必需的签章；

15、s7.属性对比

16、重复将剩余碎片数据组图片参照步骤s6中得出的签章图片进行属性比对，如果一致则判断该组数据所在pdf包含电子签章；

17、s8.结果提示

18、所有的碎片数据组判断完成后，根据数据结果进行提示。

19、优选的，所述s2中分析拆页包括分析pdf文档，识别包括版本、页数信息，并将pdf文件按页数分拆成页数为1的多个小pdf文件，该模块主要是对pdf的每一页进行分组，方便进行判断。

20、优选的，所述s3中碎片化文件包括将分开后的单页pdf文件进行碎片化处理，一个pdf文件主要由文字、图片、矢量图、缩略图、注释元素组成，提取文件中图片元素形成碎片化文件，即图片文件，该模块主要是提取每一组pdf页中图片。

21、优选的，步骤s4中识别清洗包括对提取到的按照一定规则进行图片分类处理，保留符合条件的图片，并根据hsv模型统计颜色像素数量。该模块主要是对每一组中的图片进行筛选，初步排除一些不是签章的图片，对初步符合的图片进行分析，得到分析数据。

22、优选的，所述步骤s6包括根据清洗结果的hsv模型数据来判断是否为电子签章图片。

23、优选的，所述步骤s8中包括根据所有判断结果进行区别，如果存在没有或者疑似没有签章图片即提醒对应的pdf页面没有签章。

24、优选的，所述步骤s4中提取的图片清洗详细的为：

25、1)一般的，图片比较大(长或宽不大于200px)即不是签章先排除；

26、2)签章图片一般为正方形，|长-宽|大于50px即不是签章也排除；

27、3)通过hsv颜色模型统计签章中红色数量m，红色规则为：0<h<10或156<h<180，s>43,v>46。

28、本专利技术具备以下有益效果：

29、本专利技术提供了一种快速判断pdf文件中全页面电子签章的方法，通过对大文件的分析，对文件内容进行拆页分解，使大文件变成碎片化的数据文件，再对碎片化文件进行识别清洗，按照一定的规则判断碎片数据是否有签章，识别并记录整个文件各页的签章情况，从而减少人工投入，提高工作效率，对文件签章情况进行预警，减少文件因签章遗漏被作废的风险。

本文档来自技高网...

【技术保护点】

1.一种快速判断PDF文件中全页面电子签章的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种快速判断PDF文件中全页面电子签章的方法，其特征在于：所述S2中分析拆页包括分析PDF文档，识别包括版本、页数信息，并将PDF文件按页数分拆成页数为1的多个小PDF文件。

3.根据权利要求1所述的一种快速判断PDF文件中全页面电子签章的方法，其特征在于：所述S3中碎片化文件包括将分开后的单页PDF文件进行碎片化处理，一个PDF文件主要由文字、图片、矢量图、缩略图、注释元素组成，提取文件中图片元素形成碎片化文件，即图片文件。

4.根据权利要求1所述的一种快速判断PDF文件中全页面电子签章的方法，其特征在于：步骤S4中识别清洗包括对提取到的按照一定规则进行图片分类处理，保留符合条件的图片，并根据HSV模型统计颜色像素数量。

5.根据权利要求1所述的一种快速判断PDF文件中全页面电子签章的方法，其特征在于：所述步骤S6包括根据清洗结果的HSV模型数据来判断是否为电子签章图片。

6.根据权利要求1所述的一种快速判断PDF文件

7.根据权利要求1所述的一种快速判断PDF文件中全页面电子签章的方法，其特征在于：

...

【技术特征摘要】

1.一种快速判断pdf文件中全页面电子签章的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种快速判断pdf文件中全页面电子签章的方法，其特征在于：所述s2中分析拆页包括分析pdf文档，识别包括版本、页数信息，并将pdf文件按页数分拆成页数为1的多个小pdf文件。

3.根据权利要求1所述的一种快速判断pdf文件中全页面电子签章的方法，其特征在于：所述s3中碎片化文件包括将分开后的单页pdf文件进行碎片化处理，一个pdf文件主要由文字、图片、矢量图、缩略图、注释元素组成，提取文件中图片元素形成碎片化文件，即图片文件。

4.根据权利要求1所述的一种快速判断pdf文件中...

【专利技术属性】
技术研发人员：梁金城，张泓，金季岚，
申请(专利权)人：厦门海迈科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人