System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种快速判断PDF文件中全页面电子签章的方法技术_技高网

一种快速判断PDF文件中全页面电子签章的方法技术

技术编号:40406582 阅读:6 留言:0更新日期:2024-02-20 22:28
本发明专利技术提供一种快速判断PDF文件中全页面电子签章的方法,涉及电子签章判断技术领域。该快速判断的方法,包括以下步骤:S1.文件输入;S2.分析拆页;S3.碎片化文件;S4.识别清洗;S5.计算签章占比;S6.判断签章;S7.属性对比;S8.结果提示。本发明专利技术提供一种快速判断PDF文件中全页面电子签章的方法,该方法通过对大文件的分析,对文件内容进行拆页分解,使大文件变成碎片化的数据文件,再对碎片化文件进行识别清洗,按照一定的规则判断碎片数据是否有签章,识别并记录整个文件各页的签章情况,从而减少人工投入,提高工作效率,对文件签章情况进行预警,减少文件因签章遗漏被作废的风险。

【技术实现步骤摘要】

本专利技术涉及电子签章判断,具体为一种快速判断pdf文件中全页面电子签章的方法。


技术介绍

1、pdf文件中全页面电子签章是一种在整个pdf页面上应用的电子签名。与传统的电子签名只是在特定位置或页面上显示不同,全页面电子签章会将签名应用于整个pdf页面,以确保文档的完整性和真实性。全页面电子签章可以包含数字签名、时间戳和认证信息,以验证签名的有效性和可信性。它通常由数字证书和相关的私钥生成,并且具有唯一的标识符,可以通过数字验证来确认签名者的身份和签名的有效性。通过应用全页面电子签章,可以确保整个pdf文档在签名后没有被篡改或修改,从而提供更高的安全性和保障。这种签章形式适用于需要对整个pdf文档进行保护和验证的场景,比如合同、法律文件等。

2、在招投标项目业务开展时往往需要对投标文件、建设方案等文件进行签章,这些文件有文件大、页数多等特点,在签章后需要对所有的页面进行检查是否有签章,现有方法中判别全页面电子签章的方式大多都是通过人工进行翻阅,这种判别方式效率低,耗时长,非常影响工作效率。


技术实现思路

1、针对现有技术的不足,本专利技术提供了一种快速判断pdf文件中全页面电子签章的方法,解决了现有人工判别pdf文件中全页面电子签章方法效率低的问题。

2、为实现以上目的,本专利技术通过以下技术方案予以实现:一种快速判断pdf文件中全页面电子签章的方法,具有包括以下步骤:

3、s1.文件输入

4、输入需要判断的电子档签章pdf文件;p>

5、s2.分析拆页

6、在取到签章文件后,通过输入流读取文件,利用文件流技术根据文件页面树将文件进行拆页分组,有多少页即多少组,即一个pdf文件拆分成n(页数)个pdf文件;

7、s3.碎片化文件

8、将拆分后的pdf文件进行碎片化,即将pdf中的文字、图片、矢量图、缩略图、注释信息进行拆分,提取pdf中的所有图片信息,按顺序保存下来;

9、s4.识别清洗

10、将提取到的图片进行识别清洗;

11、s5.计算签章占比

12、计算图片中红色占比(q)=m/(长*宽),因签章中红色部分需要一定的占比,故如果q大于0.15说明为签章图片;

13、s6.判断签章

14、重复步骤s3-s5处理w组碎片数据图片,如果w组数据中有多组数据包含签章图片,且签章图片一样,即可判断该签章图片为全页面必需的签章;

15、s7.属性对比

16、重复将剩余碎片数据组图片参照步骤s6中得出的签章图片进行属性比对,如果一致则判断该组数据所在pdf包含电子签章;

17、s8.结果提示

18、所有的碎片数据组判断完成后,根据数据结果进行提示。

19、优选的,所述s2中分析拆页包括分析pdf文档,识别包括版本、页数信息,并将pdf文件按页数分拆成页数为1的多个小pdf文件,该模块主要是对pdf的每一页进行分组,方便进行判断。

20、优选的,所述s3中碎片化文件包括将分开后的单页pdf文件进行碎片化处理,一个pdf文件主要由文字、图片、矢量图、缩略图、注释元素组成,提取文件中图片元素形成碎片化文件,即图片文件,该模块主要是提取每一组pdf页中图片。

21、优选的,步骤s4中识别清洗包括对提取到的按照一定规则进行图片分类处理,保留符合条件的图片,并根据hsv模型统计颜色像素数量。该模块主要是对每一组中的图片进行筛选,初步排除一些不是签章的图片,对初步符合的图片进行分析,得到分析数据。

22、优选的,所述步骤s6包括根据清洗结果的hsv模型数据来判断是否为电子签章图片。

23、优选的,所述步骤s8中包括根据所有判断结果进行区别,如果存在没有或者疑似没有签章图片即提醒对应的pdf页面没有签章。

24、优选的,所述步骤s4中提取的图片清洗详细的为:

25、1)一般的,图片比较大(长或宽不大于200px)即不是签章先排除;

26、2)签章图片一般为正方形,|长-宽|大于50px即不是签章也排除;

27、3)通过hsv颜色模型统计签章中红色数量m,红色规则为:0<h<10或156<h<180,s>43,v>46。

28、本专利技术具备以下有益效果:

29、本专利技术提供了一种快速判断pdf文件中全页面电子签章的方法,通过对大文件的分析,对文件内容进行拆页分解,使大文件变成碎片化的数据文件,再对碎片化文件进行识别清洗,按照一定的规则判断碎片数据是否有签章,识别并记录整个文件各页的签章情况,从而减少人工投入,提高工作效率,对文件签章情况进行预警,减少文件因签章遗漏被作废的风险。

本文档来自技高网...

【技术保护点】

1.一种快速判断PDF文件中全页面电子签章的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种快速判断PDF文件中全页面电子签章的方法,其特征在于:所述S2中分析拆页包括分析PDF文档,识别包括版本、页数信息,并将PDF文件按页数分拆成页数为1的多个小PDF文件。

3.根据权利要求1所述的一种快速判断PDF文件中全页面电子签章的方法,其特征在于:所述S3中碎片化文件包括将分开后的单页PDF文件进行碎片化处理,一个PDF文件主要由文字、图片、矢量图、缩略图、注释元素组成,提取文件中图片元素形成碎片化文件,即图片文件。

4.根据权利要求1所述的一种快速判断PDF文件中全页面电子签章的方法,其特征在于:步骤S4中识别清洗包括对提取到的按照一定规则进行图片分类处理,保留符合条件的图片,并根据HSV模型统计颜色像素数量。

5.根据权利要求1所述的一种快速判断PDF文件中全页面电子签章的方法,其特征在于:所述步骤S6包括根据清洗结果的HSV模型数据来判断是否为电子签章图片。

6.根据权利要求1所述的一种快速判断PDF文件中全页面电子签章的方法,其特征在于:所述步骤S8中包括根据所有判断结果进行区别,如果存在没有或者疑似没有签章图片即提醒对应的PDF页面没有签章。

7.根据权利要求1所述的一种快速判断PDF文件中全页面电子签章的方法,其特征在于:

...

【技术特征摘要】

1.一种快速判断pdf文件中全页面电子签章的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种快速判断pdf文件中全页面电子签章的方法,其特征在于:所述s2中分析拆页包括分析pdf文档,识别包括版本、页数信息,并将pdf文件按页数分拆成页数为1的多个小pdf文件。

3.根据权利要求1所述的一种快速判断pdf文件中全页面电子签章的方法,其特征在于:所述s3中碎片化文件包括将分开后的单页pdf文件进行碎片化处理,一个pdf文件主要由文字、图片、矢量图、缩略图、注释元素组成,提取文件中图片元素形成碎片化文件,即图片文件。

4.根据权利要求1所述的一种快速判断pdf文件中...

【专利技术属性】
技术研发人员:梁金城张泓金季岚
申请(专利权)人:厦门海迈科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1