【技术实现步骤摘要】
图像文本识别方法、装置、设备、介质和产品
[0001]本申请涉及深度学习
,特别是涉及一种图像文本识别方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
[0002]营业执照是工商行政管理机关发给工商企业和个体经营者的准许从事某项生产经营活动的凭证,在某些场景下,需要对里面的关键信息进行提取、识别、录入和审核,关键信息包括:公司地址、经营范围、注册资本、营业期限、成立日期、公司名称、统一社会信用代码、组织形式、法定责任人、公司类型等。
[0003]目前,常用的识别方法是利用OCR(光学字符识别,Optical Character Recognition)技术对营业执照中的关键信息进行识别,OCR技术能够提高识别的录入和审核效率,但是,可能存在识别出来的文字比较模糊的情况。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够提高营业执照识别结果清晰度的图像文本识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一 ...
【技术保护点】
【技术特征摘要】
1.一种图像文本识别方法,其特征在于,所述方法包括:获取营业执照图像;根据所述营业执照图像中的文本方向和所述营业执照图像的水平方向间的夹角,对所述营业执照图像中的文本框进行方向矫正;根据所述方向矫正的矫正结果和文本检测模型,确定所述营业执照图像中的文本框位置和文本框对应的信息项类别;根据所述文本框位置和所述信息项类别,对所述文本框中的文本内容进行识别;对识别结果进行校验得到目标文字。2.根据权利要求1所述的方法,其特征在于,所述根据所述营业执照图像中的文本方向和所述营业执照图像的水平方向间的夹角,对所述营业执照图像中的文本框进行方向矫正,包括:确定所述夹角所属的预设角度区间;根据所述预设角度区间和所述夹角对所述营业执照图像中的文本框进行方向矫正。3.根据权利要求1所述的方法,其特征在于,所述确定所述营业执照图像中的文本框位置,包括:根据所述矫正结果和所述文本检测模型确定所述文本框的中心点位置;根据所述中心点位置和所述文本检测模型确定所述文本框的尺寸;根据所述尺寸和所述中心点位置确定所述文本框位置。4.根据权利要求1所述的方法,其特征在于,所述对所述文本框中的文本内容进行识别,包括:根据所述文本框位置确定每个文本框对应的文字切片;通过文本识别模型对所述营业执照图像进行特征提取,获得卷积特征矩阵;根据所述文字切片、所述信息项类别以及所述文本识别模型,从所述卷积特征矩阵中确定文字序列特征;根据所述文字序列特征对所述文本内容进行识别。5.根据权利要求1所述的方法,其特征在于,所述对识别结果进行校验得到目标文字,包括:判断所述识别结果对应的信息项类别是否为经营范围;若所述信息项类别为所述经营范围,则获取用于指示所述识别结果的识别准确程度...
【专利技术属性】
技术研发人员:赵逸如,李捷,张瑞雪,周丹雅,
申请(专利权)人:上海浦东发展银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。