一种多特征融合的印章检测方法技术

技术编号:28141298 阅读:16 留言:0更新日期:2021-04-21 19:18
本发明专利技术提供了图像处理技术领域的一种多特征融合的印章检测方法,包括如下步骤:步骤S10、获取大量的合同样本文件,自动检测各所述合同样本文件中的印章;步骤S20、抽取检测到的各所述印章;步骤S30、对抽取的各所述印章进行多维特征融合,生成特征数据集;步骤S40、创建一印章检测模型,利用所述特征数据集对印章检测模型进行训练;步骤S50、利用训练后的所述印章检测模型对电子档合同进行印章检测,进而对所述电子档合同进行分类管理。本发明专利技术的优点在于:极大的提升了印章识别的精度以及效率,进而极大的降低了电子档合同管理的成本。而极大的降低了电子档合同管理的成本。而极大的降低了电子档合同管理的成本。

【技术实现步骤摘要】
一种多特征融合的印章检测方法


[0001]本专利技术涉及图像处理
,特别指一种多特征融合的印章检测方法。

技术介绍

[0002]随着信息化技术的发展,越来越多的线下工作被线上办公软件所替代;随着摄像头及智能手机的普及,信息获取越来越方便,使得越来越多的信息以图像或视频的形式存放到线上的办公环境。盖有印章的合同就从传统的纸件转换为电子档,因此产生了对电子档合同进行分类管理的需求。
[0003]针对电子档合同的分类管理,传统的做法是人工查找电子档合同中的印章,再基于印章对电子档合同进行分类管理。但是,传统的做法存在如下缺点:1、由于是人工查找,当合同页数较多时,需要逐页向下查找,费时费力,且容易出错;2、由于印章加盖时用力不均,导致只有半个印章清晰,或是红色油泥较少造成印章的内容不能很好的被人眼识别,需要重新制作合同,增加了合同管理成本。
[0004]因此,如何提供一种多特征融合的印章检测方法,实现提升印章识别的精度以及效率,进而降低电子档合同管理的成本,成为一个亟待解决的问题。

技术实现思路

[0005]本专利技术要解决的技术问题,在于提供一种多特征融合的印章检测方法,实现提升印章识别的精度以及效率,进而降低电子档合同管理的成本。
[0006]本专利技术是这样实现的:一种多特征融合的印章检测方法,包括如下步骤:
[0007]步骤S10、获取大量的合同样本文件,自动检测各所述合同样本文件中的印章;
[0008]步骤S20、抽取检测到的各所述印章;
[0009]步骤S30、对抽取的各所述印章进行多维特征融合,生成特征数据集;
[0010]步骤S40、创建一印章检测模型,利用所述特征数据集对印章检测模型进行训练;
[0011]步骤S50、利用训练后的所述印章检测模型对电子档合同进行印章检测,进而对所述电子档合同进行分类管理。
[0012]进一步地,所述步骤S10具体为:
[0013]获取大量的合同样本文件,利用DARKnet网络模型逐页检测各所述合同样本文件中的印章。
[0014]进一步地,所述DARKnet网络模型采用ELU函数作为激活函数,池化操作采用随机池化。
[0015]进一步地,所述步骤S20具体包括:
[0016]步骤S21、设定一第一阈值区间以及一第二阈值区间,利用HSV算法以及所述第一阈值区间抽取印章的红色区域,计算所述红色区域的面积为S1;
[0017]步骤S22、利用HSV算法以及所述第二阈值区间抽取印章的噪声区域,并将所述噪声区域的RGB值调整为(255,255,255),计算所述印章中剔除噪声区域的面积为S2;
[0018]步骤S23、利用所述S1和S2进行IOU判定,抽取出所述印章area:
[0019][0020]进一步地,所述步骤S30具体包括:
[0021]步骤S31、将各所述印章以30
°
为间隔进行旋转,利用hu不变矩对各状态下的所述印章进行计算得到7个计算结果,基于各所述计算结果得到不变矩特征[1*7],基于各所述不变矩特征[1*7]得到多角度不变矩特征[12*7];
[0022]步骤S32、利用SURF算法提取各所述印章的SURF特征[N*64],并降维为SURF特征[1*7];其中N为大于1的整数;
[0023]步骤S33、联合所述多角度不变矩特征[12*7]以及SURF特征[1*7],生成特征数据集[13*7]。
[0024]进一步地,所述步骤S32中,所述并降维为[1*7]具体为:
[0025]将SURF特征[N*64]中,N个子特征[1*64]的相同列值取均值得到平均特征[1*64],利用PCA降维算法将平均特征[1*64]降维为SURF特征[1*7]。
[0026]进一步地,所述步骤S40具体包括:
[0027]步骤S41、基于GBDT算法创建一印章检测模型;
[0028]步骤S42、将所述特征数据集按预设的比例划分为训练集和验证集;
[0029]步骤S43、利用所述训练集对印章检测模型进行训练;
[0030]步骤S44、利用所述验证集对训练后的所述印章检测模型进行验证。
[0031]进一步地,所述步骤S50具体为:
[0032]利用训练后的所述印章检测模型对电子档合同进行印章检测生成检测结果,人工对所述检测结果进行核验,若核验通过,则利用所述印章对电子档合同进行分类管理;若核验不通过,则人工对核验不通过的所述印章进行标注,加入所述特征数据集,并进入步骤S40。
[0033]本专利技术的优点在于:
[0034]1、通过自动检测并抽取合同样本文件中的印章,对各印章进行多维特征融合生成特征数据集,再利用特征数据集对创建的印章检测模型进行训练,最终利用训练后的印章检测模型对电子档合同进行印章检测,进而对电子档合同进行分类管理,相对于传统上通过人工查找电子档合同中的印章,再基于印章对电子档合同进行分类管理,极大的提升了印章识别的精度以及效率,极大的降低了电子档合同管理的成本。
[0035]2、通过将ELU函数作为DARKnet网络模型的激活函数,相对于传统上采用RELU函数作为激活函数,能够保留小于0的特征值,保证了印章检测的精度;通过采用随机池化作为DARKnet网络模型的池化操作,相对于传统的最大值池化和平均值池化,充分考虑了各特征值分布的区域以及重要性,进一步保证了印章检测的精度。
[0036]3、通过采用HSV算法抽取印章的红色区域以及噪声区域,再将噪声区域设为白色,最终利用IOU判定抽取最终的印章,相对于传统上对图像的RGB三维特征进行分析,尽可能避免因颜色问题导致无法抽取出较为完整印章的情况,即极大的提升了印章抽取的完整性。
[0037]4、通过融合对图像大小、方向、位置以及形状有较好支持的多角度不变矩特征以
及加强特征表示能力的SURF特征生成特征数据集,进而利用特征数据集训练印章检测模型,使得印章检测模型对各种形态的印章均能很好的识别。
[0038]5、通过GBDT算法创建印章检测模型,无需人工确定阈值,阈值通用性较强,进而极大的提升了印章检测模型的泛化能力。
[0039]6、通过人工核验印章检测模型的检测结果,对核验不通过的印章进行标注并加入特征数据集,再次对印章检测模型进行训练,极大的加强了印章检测模型的兼容性。
附图说明
[0040]下面参照附图结合实施例对本专利技术作进一步的说明。
[0041]图1是本专利技术一种多特征融合的印章检测方法的流程图。
具体实施方式
[0042]本申请实施例中的技术方案,总体思路如下:自动检测并抽取合同样本文件中的印章,对各印章进行多维特征融合生成特征数据集,再利用特征数据集对创建的印章检测模型进行训练,最终利用训练后的印章检测模型对电子档合同进行印章检测,进而对电子档合同进行分类管理,以提升印章识别的精度以及效率,降低电子档本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多特征融合的印章检测方法,其特征在于:包括如下步骤:步骤S10、获取大量的合同样本文件,自动检测各所述合同样本文件中的印章;步骤S20、抽取检测到的各所述印章;步骤S30、对抽取的各所述印章进行多维特征融合,生成特征数据集;步骤S40、创建一印章检测模型,利用所述特征数据集对印章检测模型进行训练;步骤S50、利用训练后的所述印章检测模型对电子档合同进行印章检测,进而对所述电子档合同进行分类管理。2.如权利要求1所述的一种多特征融合的印章检测方法,其特征在于:所述步骤S10具体为:获取大量的合同样本文件,利用DARKnet网络模型逐页检测各所述合同样本文件中的印章。3.如权利要求2所述的一种多特征融合的印章检测方法,其特征在于:所述DARKnet网络模型采用ELU函数作为激活函数,池化操作采用随机池化。4.如权利要求1所述的一种多特征融合的印章检测方法,其特征在于:所述步骤S20具体包括:步骤S21、设定一第一阈值区间以及一第二阈值区间,利用HSV算法以及所述第一阈值区间抽取印章的红色区域,计算所述红色区域的面积为S1;步骤S22、利用HSV算法以及所述第二阈值区间抽取印章的噪声区域,并将所述噪声区域的RGB值调整为(255,255,255),计算所述印章中剔除噪声区域的面积为S2;步骤S23、利用所述S1和S2进行IOU判定,抽取出所述印章area:5.如权利要求1所述的一种多特征融合的印章检测方法,其特征在于:所述步骤S30具体包括:步骤S31、将各所述印章以30
°
为间隔进行旋...

【专利技术属性】
技术研发人员:冯广辉王雷朱坚陆向东林俊德
申请(专利权)人:福建新大陆软件工程有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1