一种合同归档方法及系统技术方案

技术编号:34975484 阅读:17 留言:0更新日期:2022-09-21 14:16
本发明专利技术属于文档管理技术领域,具体涉及一种合同归档方法及系统,包括:1)获取标准合同图片集和待对比合同图片集,将待对比合同图片集中的单个合同图片记为待对比页图片,标准合同图片集中的单个合同图片记为标准页图片,标准图片集页码正确排序;2)将每个标准页图片与每个待对比页图片均进行相似度对比,得到每个标准页图片与每个待对比页图片的相似度;3)依据步骤2)中得到的相似度,按照匹配准则将各个标准页图片与各个待对比页图片进行匹配,并将待对比页图片的页码设置为与之匹配成功的标准页图片的页码,进而得到页码排序正确的待对比合同图片集;由此,本发明专利技术解决了现有技术中文档归档任务工作效率低和准确度低的问题。文档归档任务工作效率低和准确度低的问题。文档归档任务工作效率低和准确度低的问题。

【技术实现步骤摘要】
一种合同归档方法及系统


[0001]本专利技术属于文档管理
,具体涉及一种合同归档方法及系统。

技术介绍

[0002]企业中相关部门每年要对大量的文件进行线上或者线下对比,对比之后还需要将文件整理扫描归档。整理的文件包括但不限于合同和合同其他附件等纸质文件。比如在整理合同文件时,具体地,首先需要投入大量的人力对盖章纸质文件一页一页地进行手工扫描,得到扫描件;然后将扫描件与线上存储的原文件一页一页地进行对比,查看扫描件与原文件是否一致,以防被其他人篡改;最后筛选排序生成对应的PDF文件,并将PDF文档上传到对应的系统中保存。此外,在查看扫描件与原文件是否一致的任务过程中,由于员工长时间盯着屏幕,容易产生视觉疲劳,不容易发现篡改之处,导致后续存在合同纠纷。
[0003]总之,在该文件归档任务中含有大量人工处理的工作,浪费人力,工作耗时时间长,而且文件对比容易出错,该项工作自动化程度低、效率低和准确度低。

技术实现思路

[0004]本专利技术的目的在于提供一种合同归档方法及系统,用以解决现有技术中文档归档任务工作效率低和准确度低的问题。
[0005]为解决上述技术问题,本专利技术所提供的技术方案以及技术方案对应的有益效果如下:
[0006]本专利技术的一种合同归档方法,包括以下步骤:
[0007]1)获取标准合同图片集和待对比合同图片集,将待对比合同图片集中的单个合同图片记为待对比页图片,标准合同图片集中的单个合同图片记为标准页图片,该标准图片集中的各页图片已按照设定页码正确排序;
[0008]2)将每个标准页图片与每个待对比页图片均进行相似度对比,得到每个标准页图片与每个待对比页图片的相似度;
[0009]3)依据步骤2)中得到的相似度,按照如下准则将各个标准页图片与各个待对比页图片进行匹配,并将待对比页图片的页码设置为与之匹配成功的标准页图片的页码,进而依据各标准页图片的页码得到页码排序正确的待对比合同图片集:
[0010]准则1:若与某一个标准页图片相似度最高的待对比页图片仅有一个,且最高相似度大于设定阈值,则表明该待对比页图片与标准页图片匹配成功;
[0011]准则2:若与多个标准页图片相似度最高的待对比页图片为同一个,且所有的最高相似度均大于设定阈值,那么比较多个最高相似度的大小:若多个最高相似度中的最大值仅有一个,那么表明该对待比页图片与该最大值所对应的标准页图片匹配成功;若多个相似度中的最大值有多个,那么从多个最大值所对应的标准页图片中随机选择一个作为与该待对比页图片匹配成功的标准页图片;
[0012]准则3:将匹配成功的标准页图片和待对比页图片排除在外,对于其他标准页图片
和待对比页图片重新按照设置的准则进行匹配;
[0013]4)将页码排序正确的待对比合同图片集进行归档。
[0014]上述技术方案的有益效果为:本专利技术使用已排序正确的标准合同图片集与待排序的待对比合同图片集进行相似度对比,然后依据所有待对比合同页与标准合同页之间的最大相似度值和设定阈值双重判定确定待对比合同图片集中的待对比页图片的页码,从而实现待对比合同图片集的页码排序工作。双重判定准确率高,又由于无需手动对比,工作量少,归档工作效率高,而且为自动化相似度对比,进一步确保准确率。另一方面,本专利技术通过设定相似度的设定阈值,仅保留相似度高度相似的数据,避免存储一些不必要的脏数据,减轻后续数据处理的负担。
[0015]进一步地,在步骤4)中将页码排序正确的待对比合同图片集进行归档之前还需要规整待对比页图片的方向;标准合同图片集中每个标准页图片均已规整为正向;采用如下方法进行规整待对比页图片:
[0016]401)对于页码相同的一对标准页图片和待对比页图片,将该标准页图片按照设定要求进行切割处理,以切割出标准页图片正向视角下的包含识别特征的标准切割图像;
[0017]402)对0
°
、90
°
、180
°
和270
°
四个不同旋转角度下的该待对比页图片同样按照设定要求进行切割,得到四份待对比切割图像;
[0018]403)将标准切割图像分别于四份待对比切割图像进行相似度对比,计算得到各个相似度值并求取最大的相似度值;
[0019]404)将最大的相似度值对应的切割角度作为待对比页图片的旋转角度;
[0020]405)依照旋转角度旋转待对比页图片;
[0021]406)对于其余页码相同的标准页图片和待对比页图片,均按照步骤401)至405)的方法处理,以旋转其余的待对比页图片,得到旋转规整后的待对比页图片集。
[0022]上述技术方案的有益效果为:本专利技术事先在标准合同页中按照设定要求切割出包含识别特征的图像部分,然后按照与正向方向的夹角为0
°
、90
°
、180
°
和270
°
四个切割角度进行切割与标准合同页页码相同的待对比合同页,得到四份切割后的待对比合同图像,最后将包含识别特征的图像部分对四份切割后的待对比合同图像进行相似度对比,得到最大相似度值对应的切割角度,切割角度即为图片需要旋转的角度,依据切割角度旋转待对比合同页,使待对比合同页规整为正向,便于阅读。由此,本专利技术进一步提高了自动化程度,进一步提高了工作效率。
[0023]进一步地,在步骤3)中最高相似度不大于设定阈值,则给出对应的标准页图片的无配对提示信息;所述无配对提示信息包括对应的标准页图片的页码。
[0024]上述技术方案的有益效果为:得到的最高相似度不大于设定阈值的条件下,表明该标准页图片无与之匹配的待对比页图片,此时给出无匹配提示信息,查找该标准页图片对应的待对比合同页是否被篡改或者被遗漏未加入待对比合同。从而,本专利技术实现了自动判断标准合同图片集与待对比合同图片集的一致性的问题,同时由于使用自动化对比,工作效率高且经过设定阈值和最大阈值的双重筛选准确度高。
[0025]进一步地,所述设定阈值的取值范围为60%

80%。
[0026]进一步地,为了进一步提高准确率,在步骤1)之前还需要对待对比页图片集中待对比页图片进行清晰度判断;若清晰度不满足要求,则需要发出清晰度提示信息,以提示更
换清晰度高的该待对比页图片。
[0027]进一步地,为了进一步提高准确率,所述清晰度判断的评价方法包括Brenner梯度法、Tenegrad梯度法、laplacian梯度法、方差法和能量梯度法中的至少一种。
[0028]进一步地,在步骤1)之前还需要将待对比页图片集中待对比页图片进行图像增强处理,所述图像增强处理包括调整图片的对比度、亮度、色彩饱和度、色调和锐度中的至少一种参数。
[0029]进一步地,所述设定要求为按照图片四分之一的比例进行切割。
[0030]本专利技术的一种合同归档系统,该系统包括处理器、存储器和内部总线,处理器、存储器之间本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种合同归档方法,其特征在于:包括以下步骤:1)获取标准合同图片集和待对比合同图片集,将待对比合同图片集中的单个合同图片记为待对比页图片,标准合同图片集中的单个合同图片记为标准页图片,该标准图片集中的各页图片已按照设定页码正确排序;2)将每个标准页图片与每个待对比页图片均进行相似度对比,得到每个标准页图片与每个待对比页图片的相似度;3)依据步骤2)中得到的相似度,按照如下准则将各个标准页图片与各个待对比页图片进行匹配,并将待对比页图片的页码设置为与之匹配成功的标准页图片的页码,进而依据各标准页图片的页码得到页码排序正确的待对比合同图片集:准则1:若与某一个标准页图片相似度最高的待对比页图片仅有一个,且最高相似度大于设定阈值,则表明该待对比页图片与标准页图片匹配成功;准则2:若与多个标准页图片相似度最高的待对比页图片为同一个,且所有的最高相似度均大于设定阈值,那么比较多个最高相似度的大小:若多个最高相似度中的最大值仅有一个,那么表明该待对比页图片与该最大值所对应的标准页图片匹配成功;若多个相似度中的最大值有多个,那么从多个最大值所对应的标准页图片中随机选择一个作为与该待对比页图片匹配成功的标准页图片;准则3:将匹配成功的标准页图片和待对比页图片排除在外,对于其他标准页图片和待对比页图片重新按照设置的准则进行匹配;4)将页码排序正确的待对比合同图片集进行归档。2.根据权利要求1所述的合同归档方法,其特征在于:在步骤4)中将页码排序正确的待对比合同图片集进行归档之前还需要规整待对比页图片的方向;标准合同图片集中每个标准页图片均已规整为正向;采用如下方法进行规整待对比页图片:401)对于页码相同的一对标准页图片和待对比页图片,将该标准页图片按照设定要求进行切割处理,以切割出标准页图片正向视角下的包含识别特征的标准切割图像;402)对0
°
、90
°
、180
°
和270
°
四个不同旋转角度下的该待对比页图片同样按照设定要求进行切割,得...

【专利技术属性】
技术研发人员:杨家胜李鹏超申忠虎
申请(专利权)人:河南安新网络信息服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1