一种基于图像识别的金融票务数据处理方法技术

技术编号:38328066 阅读:26 留言:0更新日期:2023-07-29 09:10
本发明专利技术公开了一种基于图像识别的金融票务处理方法,其主要通过发票扫描设备扫描识别录入大批量的发票信息,方便工作人员对发票的检索、整理管理,并在发票扫描识别有误时,对扫描到的发票图像信息进行调整,使其对正于扫描窗口后对其进行扫描识别录入。窗口后对其进行扫描识别录入。窗口后对其进行扫描识别录入。

【技术实现步骤摘要】
一种基于图像识别的金融票务数据处理方法


[0001]本专利技术属于发票管理安全
,涉及到一种基于图像识别的金融票务处理方法。

技术介绍

[0002]随着经济的发展,发票作为不可缺少的一种金融票据,因此现有技术中为了对存档入库的纸质发票进行收集,常常采用了大批量扫描识别的智能处理方式(纸质发票进行大批量扫描识别的智能存档处理的目的主要有二,其一:方便存储真实扫描的票据证据数据;其二、方便随时调用检索相关的票据数据);
[0003]在大批量的金融票据扫描识别时,可以通过配套设备进行一张间隔一张的(即逐一推送扫描)发票推送后扫描。但是研究发现,在进行大批量的发票扫描时,有可能存在一次性推送多张发票导致多张发票重叠现象,这样会出现多张发票重叠导致扫描文件有误无法进行正常的图像获取,提取识别造成了影响。

技术实现思路

[0004]本专利技术提供一种基于图像识别的金融票务处理方法及可读存储介质,解决了现有技术中提出的上述技术问题。
[0005]本专利技术提供了一种基于图像识别的金融票务处理方法,包括如下操作步骤:...

【技术保护点】

【技术特征摘要】
1.一种基于图像识别的金融票务处理方法,其特征在于:该方法包括以下步骤:获得多个销售方的文本信息和购买方的文本信息,将多个销售方的文本信息形成销售方文本集合;将多个购买方的文本信息形成购买方文本集合;将基本模版发票按照其功能进行区域划分,进而得到划分的各子区域,其中功能包括表头、二维码、密码区和表格区,并将划分的子区域按照预设顺序进行编号,依次标记为1,2,...k,...v,进而获取各子区域对应的位置,并构建各子区域位置集合W(W1,W2,...Wk,...Wv),Wk表示第k个子区域所在的位置;对当前整张发票的版面执行扫描处理操作时,并获得扫描后的扫描信息:所述整张发票版面的扫描包括对该整张发票的表头、二维码、密码区和表格区进行扫描,进而获取各子区域对应的区域表征信息,进而构建各子区域信息集合H(H1,H2,...Hk,...Hv),Hk表示第k个子区域对应的区域表征信息;执行扫描信息筛选处理操作:获取进而调用当前整张发票的表格区内的购买方和销售方所在的子区域,获取购买方和销售方的子区域对应的区域表征信息,将购买方的子区域对应的区域表征信息与购买方文本集合对比,如果存在不匹配则判定子区域视为非正常子区域,如匹配则视为正常子区域,进而将该正常子区域进行过滤;将销售方的子区域对应的区域表征信息与销售方文本集合对比,如果存在不匹配则判定子区域视为非正常子区域,如匹配则视为正常子区域,进而将该正常子区域进行过滤;若子区域为非正常子区域,则将该区域记为标注区域,进而将标注区域对应的当前整张发票扫描信息中的图像信息进行处理,确认其对正于扫描窗口,则对整张发票信息进行扫描录入。2.根据权利要求1所述的一种基于图像识别的金融票务处理方法,其特征在于,所述将标注区域对应的当前整张发票扫描信息中的图像信息进行处理,具体包括如下步骤:将扫描到的当前重叠发票的图像信息进行分割,获取最上层的一张发票图像作为目标图像;并以当前扫描窗口所在的横向直线作为预设水平线,并以预设水平线作为表格长边边缘线的对照线;根据扫描识别目标图像中的表格区的表格边缘得到表格长边边缘线与表格短边边缘线,根据所述表格长边边缘线和表格长边边缘线的对照线初步判断是否符合对正位置的第一初始条件;所述第一初始条件是指当前表格长边边缘线和表格长边边缘线的对照线为平行关系;若扫描识别表格长边边缘线不平行于表格长边边缘线的对照线,则对目标图像进行调整,对其调整后且符合第二初始条件的目标图像进行扫描识别录入,包括如下步骤:通过边缘检测法确定表格区的区内的字符边界;获取表格区区内的连续两个当前字符的字符边界确定两个连续的字符间距,判断两个连续的字符间距是否等于预设字符间距值,若是,则进一步判断连续两个字符语义是否具有金融票据关联语义;若判断两个连续字符语义具有金融票据关联语义,则确定上述具有金融票据关联语义的连续两个字符依次为第一字符和第二字符,并进一步确定第一字符到第二字符的字符延伸向量方向平行的目标图像中目标表格区的表格长边边缘线为目标图像的目标表格区第一边缘;确定与目标图像的目标表格区第一边缘的垂直线为表格第二边缘,使表格第一边缘与
表格第二边缘顺时针旋转,带动目标图像顺时针旋转进行目标图像位置调整;同时实时检测旋转后的目标图像的目标表格区第一边缘是否平行于预设水平线,若是,则视为所述表格边缘处于对正位置,进而所述作为目标图像的最上一层发票调整完毕,对其进行扫描识别录入;所述第二初始条件是指同一行的任意的当前连续两个字符的间距与预设字符间距值一致且同一行的任意的当前连续两个字符的语义符合金融票据关联语义。3.根据权利要求2所述的一种基于图像识别的金融票务处理方法,其特征在于,所述判断两个连续字符语义具有金融票据关联语义,其具体包括如下步骤:预设多个金融票据相关词汇集合并由多个金融票据相关词汇集合构建的语义库;首先获取当前两个连续字符,根据当前两个连续字符与当前语义库进行匹配,如果语义匹配成功则判断当前两个连续字符具有金融票据关联语义;然后获取与当前两个连续字符匹配成功的对应的金融票据相关词汇集合。4.根据权利要求3所述的一种基于图像识别的金融票务处理方法,其特征在于,所述将标注区域对应的当前整张发票扫描信息中的图像信息进行处理,具体包括如下步骤:将扫描到的当前重叠发票的图像信息进行分割,获取最上层的一张发票图像作为目标图像;并以当前扫描窗口所在的横向直线作为预设水平线,并以预设水平线作为表格长边边缘线的对照线;根据扫描识别目标图像中的表格区的表格边缘得到表格长边边缘线与表格短边边缘线,根据所述表格长边边缘线和表格长边边缘线的对照线初步判断是否符合对正位置的第一初始条件;所述第一初始条件是指当前表格长边边缘线和表格长边边缘线的对照线为平行关系;若扫描识别表格长边边缘线不平行于表格长边边缘线的对照线,则...

【专利技术属性】
技术研发人员:王莉张硕李明亮
申请(专利权)人:北京闪猫技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1