【技术实现步骤摘要】
识别文本的方法、装置和电子设备
[0001]本公开涉及人工智能
、金融领域,更具体地,涉及一种识别文本的方法、识别文本的装置和电子设备。
技术介绍
[0002]光学字符识别(Optical Character Recognition,简称OCR)包括文本检测和文字识别。相关技术中可以先做文本检测,确定文本框。然后,对文本框中图像切片进行文字识别。
[0003]如果文本检测得到的文本框的定位不准确,则会影响文字识别结果的准确度。
技术实现思路
[0004]有鉴于此,本公开提供了一种识别文本的方法、识别文本的装置和电子设备,以至少部分地解决文本框的定位不准确导致文字识别准确度低的问题。
[0005]本公开的一个方面提供了一种识别文本的方法,包括:响应于获得的待识别图像,对待识别图像进行文本定位,确定待识别图像包括的至少一个文本行中的至少部分文本行各自的文本行尺度信息;对于每个文本行尺度信息,更新文本行尺度信息的尺度取值,得到与文本行尺度信息相关联的至少一个扩展文本行尺度信息;确定待识别图像中 ...
【技术保护点】
【技术特征摘要】
1.一种识别文本的方法,包括:响应于获得的待识别图像,对所述待识别图像进行文本定位,确定所述待识别图像包括的至少一个文本行中的至少部分文本行各自的文本行尺度信息;对于每个文本行尺度信息,更新所述文本行尺度信息的尺度取值,得到与所述文本行尺度信息相关联的至少一个扩展文本行尺度信息;确定所述待识别图像中与所述文本行尺度信息对应的图像切片的第一文字识别结果,以及与所述至少一个扩展文本行尺度信息中各扩展文本行尺度信息分别对应的图像切片的第二文字识别结果;以及如果所述第一文字识别结果和所述第二文字识别结果相同,则输出所述第一文字识别结果或者所述第二文字识别结果。2.根据权利要求1所述的方法,其中,所述文本行尺度信息包括坐标信息;所述更新所述文本行尺度信息的尺度取值,得到与所述文本行尺度信息相关联的至少一个扩展文本行尺度信息包括:基于预设规则更新与所述文本行尺度信息对应的坐标信息,得到与所述文本行尺度信息相关联的至少一个扩展坐标信息,以便确定所述至少一个扩展坐标信息所对应的图像切片的第二文字识别结果。3.根据权利要求2所述的方法,其中,所述坐标信息包括基准点坐标信息,所述文本行尺度信息还包括:高度信息、宽度信息中至少一种信息;以及所述更新所述文本行尺度信息的尺度取值,得到与所述文本行尺度信息相关联的至少一个扩展文本行尺度信息包括:基于预设规则更新与所述文本行尺度信息对应的坐标信息、高度信息和宽度信息中至少一种,得到与所述文本行尺度信息相关联的至少一个扩展坐标信息、扩展高度信息和扩展宽度信息中至少一种,以便确定所述至少一个扩展坐标信息、扩展高度信息和扩展宽度信息中至少一种所对应的图像切片的第二文字识别结果。4.根据权利要求3所述的方法,其中,所述基准点坐标信息包括文本框的左下顶点的坐标值;所述基于预设规则更新与所述文本行尺度信息对应的坐标信息、高度信息和宽度信息中至少一种,得到与所述文本行尺度信息相关联的至少一个扩展坐标信息、扩展高度信息和扩展宽度信息中至少一种包括:基于扩展系数和第一预设规则更新与所述文本框的左下顶点的坐标值,得到扩展左下顶点的坐标值,并且,基于所述扩展系数和第二预设规则更新与所述高度信息和/或所述宽度信息,得到所述扩展高度信息和/或所述扩展宽度信息。5.根据权利要求2所述的方法,其中,所述坐标信息包括文本框的左下顶点的坐标值和右上顶点的坐标值;所述基于预设规则更新与所述文本行尺度信息对应的坐标信息,得到与所述文本行尺度信息...
【专利技术属性】
技术研发人员:李虎,程林鹏,胡翔,郑邦东,熊博颖,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。