当前位置: 首页 > 专利查询>四川大学专利>正文

一种票据图像中印章与背景文字分离方法技术

技术编号:22945106 阅读:33 留言:0更新日期:2019-12-27 17:16
本发明专利技术公开了一种票据图像中印章与背景文字分离方法,首先,采集含有印章的票据图像建立票据印章数据集;然后利用标注数据集对基于卷积神经网络的目标检测模型进行训练;其次,训练的模型检测定位出印章图像区域;接着,将提取出的印章图像进行色彩空间变换;通过数字图像盲源分离,将图像中的印章与背景文字进行分离;最后对分离后的印章和背景文字图像进行图像分割,得到最终结果图像。本发明专利技术对光照不均、噪声干扰等复杂情况具有较好的鲁棒性,具有较好的普遍适用性,适用于任意颜色或形状的印章以及背景文字,能够准确地分离出印章和背景文字,同时保留印章中的信息和背景文字信息,提升票据字符识别的准确性和可靠性。

【技术实现步骤摘要】
一种票据图像中印章与背景文字分离方法
本专利技术属于计算机数字图像处理领域,特别是一种票据图像中印章与背景文字分离方法。
技术介绍
票据是企业或个人在商业活动中的交易凭证,随着我国经济的快速发展,票据产生的数量也在急剧上升。目前普遍应用的财务数据信息化管理系统,为票据信息的查询和管理提供了极大的便利,这些票据信息中有相当一部分是从纸质票据上采集得到的。传统的采集方式是通过财务人员手工录入完成,由于信息量巨大,需要投入大量的人工,同时由于人工录入的可靠性无法保障,还需要花费很多人力进行后期校对。随着对财务信息化管理能力的进一步提高,对票据信息录入的准确性和录入效率也有更高的要求。利用数字图像识别技术,能够快速准确地定位和提取票据字符,通过字符识别获得票据信息并自动完成录入,大大提高了信息录入的工作效率,在减少人力物力投入的同时,降低了人工操作作所造成的错误风险。票据上一般都会盖上税务或财务部门的专用印章,有些印章加盖的位置并不固定,可能会将覆盖或重叠票据上的重要信息,这对于后续的字符识别造成严重干扰。为此,票据图像识别流程中,通常需要先恢本文档来自技高网...

【技术保护点】
1.一种票据图像中印章与背景文字分离方法,其特征在于,包括以下步骤:/n步骤1:对采集的票据图像进行去噪处理,之后标注出印章在图像中的位置和尺寸,建立票据印章数据集;/n步骤2:根据标注后的数据集,对基于卷积神经网络的目标检测模型进行训练,获得印章检测模型参数;/n步骤3:利用训练好印章检测模型对待分离处理的票据图像进行检测,定位到票据图像中的印章区域,将印章区域数据提取出来;/n步骤4:将提取出的印章区域进行颜色空间变换,获得变换后图像;/n步骤5:通过数字图像的盲源分离,将变换后图像中的印章与背景文字进行分离,具体为:/n步骤51:对色调、饱和度和亮度三个通道的印章区域,分别去均值,从印章...

【技术特征摘要】
1.一种票据图像中印章与背景文字分离方法,其特征在于,包括以下步骤:
步骤1:对采集的票据图像进行去噪处理,之后标注出印章在图像中的位置和尺寸,建立票据印章数据集;
步骤2:根据标注后的数据集,对基于卷积神经网络的目标检测模型进行训练,获得印章检测模型参数;
步骤3:利用训练好印章检测模型对待分离处理的票据图像进行检测,定位到票据图像中的印章区域,将印章区域数据提取出来;
步骤4:将提取出的印章区域进行颜色空间变换,获得变换后图像;
步骤5:通过数字图像的盲源分离,将变换后图像中的印章与背景文字进行分离,具体为:
步骤51:对色调、饱和度和亮度三个通道的印章区域,分别去均值,从印章区域中减去图像均值,使得图像像素值均值为零;
步骤52:然后对去均值后的图像进行白化处理,获得白化后的图像;
步骤53:对白化后的图像,利用独立分量提取方法分离出印章和背景文字;
步骤6:对分离后的印章图像和背景文字图像进行图像分割,去除背景物的干扰,得到最终图像。


2.根据权利要求1所述的一种票据图...

【专利技术属性】
技术研发人员:王俊峰高琳唐鹏李征
申请(专利权)人:四川大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1