图像文本识别方法、装置、设备、介质和产品制造方法及图纸

技术编号:37123301 阅读:13 留言:0更新日期:2023-04-01 05:19
本申请涉及一种图像文本识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:首先获取营业执照图像,并根据营业执照图像中的文本方向和营业执照图像的水平方向间的夹角,对营业执照图像中的文本框进行方向矫正,然后根据方向矫正的矫正结果和文本检测模型,确定营业执照图像中的文本框位置和文本框对应的信息项类别,接着根据文本框位置和信息项类别,对文本框中的文本内容进行识别,最后对识别结果进行校验得到目标文字。本申请提供的方法,对营业执照图像进行方向矫正之后,根据文本框位置和信息项类别对文本内容进行识别,能够简化识别过程,并提高识别结果的清晰度。的清晰度。的清晰度。

【技术实现步骤摘要】
图像文本识别方法、装置、设备、介质和产品


[0001]本申请涉及深度学习
,特别是涉及一种图像文本识别方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]营业执照是工商行政管理机关发给工商企业和个体经营者的准许从事某项生产经营活动的凭证,在某些场景下,需要对里面的关键信息进行提取、识别、录入和审核,关键信息包括:公司地址、经营范围、注册资本、营业期限、成立日期、公司名称、统一社会信用代码、组织形式、法定责任人、公司类型等。
[0003]目前,常用的识别方法是利用OCR(光学字符识别,Optical Character Recognition)技术对营业执照中的关键信息进行识别,OCR技术能够提高识别的录入和审核效率,但是,可能存在识别出来的文字比较模糊的情况。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高营业执照识别结果清晰度的图像文本识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种图像文本识别方法,所述方法包括:
[0006]获取营业执照图像;
[0007]根据所述营业执照图像中的文本方向和所述营业执照图像的水平方向间的夹角,对所述营业执照图像中的文本框进行方向矫正;
[0008]根据所述方向矫正的矫正结果和文本检测模型,确定所述营业执照图像中的文本框位置和文本框对应的信息项类别;
[0009]根据所述文本框位置和所述信息项类别,对所述文本框中的文本内容进行识别;
[0010]对识别结果进行校验得到目标文字。
[0011]在其中一个实施例中,所述根据所述营业执照图像中的文本方向和所述营业执照图像的水平方向间的夹角,对所述营业执照图像中的文本框进行方向矫正,包括:
[0012]确定所述夹角所属的预设角度区间;
[0013]根据所述预设角度区间和所述夹角对所述营业执照图像中的文本框进行方向矫正。
[0014]在其中一个实施例中,所述确定所述营业执照图像中的文本框位置,包括:
[0015]根据所述矫正结果和所述文本检测模型确定所述文本框的中心点位置;
[0016]根据所述中心点位置和所述文本检测模型确定所述文本框的尺寸;
[0017]根据所述尺寸和所述中心点位置确定所述文本框位置。
[0018]在其中一个实施例中,所述对所述文本框中的文本内容进行识别,包括:
[0019]根据所述文本框位置确定每个文本框对应的文字切片;
[0020]通过文本识别模型对所述营业执照图像进行特征提取,获得卷积特征矩阵;
[0021]根据所述文字切片、所述信息项类别以及所述文本识别模型,从所述卷积特征矩阵中确定文字序列特征;
[0022]根据所述文字序列特征对所述文本内容进行识别。
[0023]在其中一个实施例中,所述对识别结果进行校验得到目标文字,包括:
[0024]判断所述识别结果对应的信息项类别是否为经营范围;
[0025]若所述信息项类别为所述经营范围,则获取用于指示所述识别结果的识别准确程度的置信度;
[0026]判断所述置信度和预设置信度阈值的大小;
[0027]若所述置信度小于所述预设置信度阈值,则根据所述识别结果的笔画、所述识别结果的拼音以及预设字段长度,对所述识别结果进行校验。
[0028]在其中一个实施例中,所述根据所述识别结果的笔画、所述识别结果的拼音以及预设字段长度,对所述识别结果进行校验,包括:
[0029]判断所述识别结果是否大于所述预设字段长度;
[0030]若所述识别结果大于预设字段长度,则将所述识别结果拆分为多个目标字段,其中,每个目标字段的长度都不大于所述预设字段长度;
[0031]根据所述识别结果的笔画、所述识别结果的拼音以及多个目标字段,对所述识别结果进行校验。
[0032]第二方面,本申请还提供了一种图像文本识别装置,所述装置包括:
[0033]获取模块,用于获取营业执照图像;
[0034]方向矫正模块,用于根据所述营业执照图像中的文本方向和所述营业执照图像的水平方向间的夹角,对所述营业执照图像中的文本框进行方向矫正;
[0035]检测模块,用于根据所述方向矫正的矫正结果和文本检测模型,确定所述营业执照图像中的文本框位置和文本框对应的信息项类别;
[0036]识别模块,用于根据所述文本框位置和所述信息项类别,对所述文本框中的文本内容进行识别;
[0037]校验模块,用于对识别结果进行校验得到目标文字。
[0038]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的任意一个实施例中的方法的步骤。
[0039]第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的任意一个实施例中的方法的步骤。
[0040]第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的任意一个实施例中的方法的步骤。
[0041]上述图像文本识别方法、装置、计算机设备、存储介质和计算机程序产品,首先获取营业执照图像,并根据营业执照图像中的文本方向和营业执照图像的水平方向间的夹角,对营业执照图像中的文本框进行方向矫正,然后根据方向矫正的矫正结果和文本检测模型,确定营业执照图像中的文本框位置和文本框对应的信息项类别,接着根据文本框位置和信息项类别,对文本框中的文本内容进行识别,最后对识别结果进行校验得到目标文
字。本申请提供的方法,对营业执照图像进行方向矫正之后,根据文本框位置和信息项类别对文本内容进行识别,能够简化识别过程,并提高识别结果的清晰度。
附图说明
[0042]图1为一个实施例中图像文本识别方法的应用环境图;
[0043]图2为一个实施例中图像文本识别方法的流程示意图;
[0044]图3为一个实施例中方向矫正的流程示意图;
[0045]图4为另一个实施例中图像文本识别方法的流程框图;
[0046]图5为一个实施例中图像文本识别装置的结构框图;
[0047]图6为一个实施例中计算机设备的内部结构图。
具体实施方式
[0048]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0049]本申请实施例提供的图像文本识别方法,可以应用于如图1所示的应用环境中。其中,上述应用环境图包括营业执照图像102和服务端104。具体地,首先将营业执照图像102输入服务端104,然后服务端104根据营业执照图像102中的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像文本识别方法,其特征在于,所述方法包括:获取营业执照图像;根据所述营业执照图像中的文本方向和所述营业执照图像的水平方向间的夹角,对所述营业执照图像中的文本框进行方向矫正;根据所述方向矫正的矫正结果和文本检测模型,确定所述营业执照图像中的文本框位置和文本框对应的信息项类别;根据所述文本框位置和所述信息项类别,对所述文本框中的文本内容进行识别;对识别结果进行校验得到目标文字。2.根据权利要求1所述的方法,其特征在于,所述根据所述营业执照图像中的文本方向和所述营业执照图像的水平方向间的夹角,对所述营业执照图像中的文本框进行方向矫正,包括:确定所述夹角所属的预设角度区间;根据所述预设角度区间和所述夹角对所述营业执照图像中的文本框进行方向矫正。3.根据权利要求1所述的方法,其特征在于,所述确定所述营业执照图像中的文本框位置,包括:根据所述矫正结果和所述文本检测模型确定所述文本框的中心点位置;根据所述中心点位置和所述文本检测模型确定所述文本框的尺寸;根据所述尺寸和所述中心点位置确定所述文本框位置。4.根据权利要求1所述的方法,其特征在于,所述对所述文本框中的文本内容进行识别,包括:根据所述文本框位置确定每个文本框对应的文字切片;通过文本识别模型对所述营业执照图像进行特征提取,获得卷积特征矩阵;根据所述文字切片、所述信息项类别以及所述文本识别模型,从所述卷积特征矩阵中确定文字序列特征;根据所述文字序列特征对所述文本内容进行识别。5.根据权利要求1所述的方法,其特征在于,所述对识别结果进行校验得到目标文字,包括:判断所述识别结果对应的信息项类别是否为经营范围;若所述信息项类别为所述经营范围,则获取用于指示所述识别结果的识别准确程度...

【专利技术属性】
技术研发人员:赵逸如李捷张瑞雪周丹雅
申请(专利权)人:上海浦东发展银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1