文字识别方法、装置和可读存储介质制造方法及图纸

技术编号:30436779 阅读:24 留言:0更新日期:2021-10-24 17:38
本发明专利技术提供了一种文字识别方法、装置和可读存储介质。一种文字识别方法,包括对票据图像进行检测,获取票据图像上发票章的位置坐标,根据位置坐标,提取发票章子图;对发票章子图进行检测,获取发票章内容的类别和发票章内容的坐标,根据发票章内容的类别和发票章内容的坐标,获取发票章内容子图;对发票章内容子图进行检测,识别发票章内容子图中的文字。本发明专利技术的技术方案中,基于发票章本身的特征,对于发票章内容进行多目标检测,识别发票章内容的类别和发票章内容的坐标,而不是简单的检测图片上面的文字的位置,可以提高最终文字检测结果的准确度。结果的准确度。结果的准确度。

【技术实现步骤摘要】
文字识别方法、装置和可读存储介质


[0001]本专利技术涉及文字检测与识别
,具体而言,涉及一种文字识别方法、装置和可读存储介质。

技术介绍

[0002]发票专用章是人工加盖在增值税发票上,用以证明该发票合规有效。在财务报销环节,需要审核发票专用章。目前该部分工作由人工完成,重复性高且耗费人力财力。大多为针对发票各项字段内容的检测和识别,对于发票章而言,识别准确度低。

技术实现思路

[0003]本专利技术旨在解决或改善上述技术问题的至少之一。
[0004]为此,本专利技术的第一目的在于提供一种文字识别方法。
[0005]本专利技术的第二目的在于提供一种文字识别装置。
[0006]本专利技术的第三目的在于提供一种文字识别装置。
[0007]本专利技术的第四目的在于提供一种可读存储介质。
[0008]为实现本专利技术的第一目的,本专利技术的技术方案提供了一种文字识别方法,用于识别票据上的发票章,包括:对票据图像进行检测,获取票据图像上发票章的位置坐标,根据位置坐标,提取发票章子图;对发票本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文字识别方法,用于识别票据上的发票章,其特征在于,包括:对票据图像进行检测,获取所述票据图像上发票章的位置坐标,根据所述位置坐标,提取所述发票章子图;对所述发票章子图进行检测,获取发票章内容的类别和发票章内容的坐标,根据所述发票章内容的类别和所述发票章内容的坐标,获取发票章内容子图;对所述发票章内容子图进行检测,识别所述发票章内容子图中的文字。2.根据权利要求1所述的文字识别方法,其特征在于,所述发票章内容包括以下至少之一:公司名称、税号、发票专用章字样、发票章代码。3.根据权利要求1所述的文字识别方法,其特征在于,所述根据所述位置坐标,提取所述发票章子图,具体包括:基于目标检测方法,采用多段线的方式,根据获取的所述位置坐标进行切割,根据所述位置坐标对感兴趣区域进行原始像素填充,得到所述发票章子图。4.根据权利要求1所述的文字识别方法,其特征在于,所述对所述发票章子图进行检测,获取发票章内容的类别和发票章内容的坐标,具体包括:根据所述发票章内容包含的种类,设置所述发票章内容对应的目标区域,采用多段线的方式,对所述发票章子图中的所述目标区域进行标注;将标注后的所述发票章子图输入至训练后的多目标分类网络模型,所述多目标分类网络模型进行推理,得到所述发票章内容的类别和所述发票章内容的坐标。5.根据权利要求4所述的文字识别方法,其特征在于,所述根据所述发票章内容包含的种类,设置所述发票章内容对应的目标区域之前,还包括:建立所述多目标分类网络模型;采用标注后的历史数据,对所述多目标分类网络模型进行训练,得到所述训练后的多目标分类网络模型;其中,历史数据包括历史发票章子图、历史发票章子图中发票章内容的类别和发票章内容的坐标。6...

【专利技术属性】
技术研发人员:薛会萍
申请(专利权)人:用友网络科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1