文本识别方法及装置、电子设备和存储介质制造方法及图纸

技术编号：25891186 阅读：24 留言：0更新日期：2020-10-09 23:33

本公开涉及一种文本识别方法及装置、电子设备和存储介质。该方法包括：对待检测图像进行特征提取处理，获得多个语义向量，其中，所述多个语义向量与所述待检测图像中的文本序列的多个字符对应；通过卷积神经网络对多个语义向量依次进行识别处理，得到文本序列的识别结果。根据本公开的实施例的文本识别方法，可在待检测图像中提取语义向量，并通过卷积神经网络依次处理语义向量，确定文本序列的识别结果，可提高文本识别的精确度。

全部详细技术资料下载

【技术实现步骤摘要】
文本识别方法及装置、电子设备和存储介质
本公开涉及计算机
，尤其涉及一种文本识别方法及装置、电子设备和存储介质。
技术介绍
图像中的文本识别是图像识别和文本识别技术中的重要问题。精确的文本识别能够用于多个领域，例如图片理解，自动翻译，盲人引导，机器人导航等。在相关技术中，图像中的文本识别具有多种问题，图像中复杂多样背景、低分辨率、不同的字体、不同的光照条件、不同大小尺度、不同倾斜方向、模糊等因素，都使得图像中的文本识别更加复杂和困难。
技术实现思路
本公开提出了一种文本识别方法及装置、电子设备和存储介质。根据本公开的一方面，提供了一种文本识别方法，包括：对待检测图像进行特征提取处理，获得多个语义向量，其中，所述多个语义向量与所述待检测图像中的文本序列的多个字符对应；通过卷积神经网络对所述多个语义向量依次进行识别处理，得到所述文本序列的识别结果。根据本公开的实施例的文本识别方法，可在待检测图像中提取语义向量，并通过卷积神经网络依次处理语义向量，确定文本序列的识别结果，可提高文本识别的精确度。在一些实施例中，所述通过卷积神经网络对所述多个语义向量依次进行识别处理，得到所述文本序列的识别结果，包括：通过卷积神经网络对目标语义向量的先验信息进行处理，获得所述目标语义向量的权值参数，其中，所述多个语义向量包括所述目标语义向量；根据所述权值参数和所述目标语义向量，确定与所述目标语义向量对应的文本识别结果。通过这种方式，可使用根据先验信息获得...

【技术保护点】
1.一种文本识别方法，其特征在于，包括：/n对待检测图像进行特征提取处理，获得多个语义向量，其中，所述多个语义向量与所述待检测图像中的文本序列的多个字符对应；/n通过卷积神经网络对所述多个语义向量依次进行识别处理，得到所述文本序列的识别结果。/n

【技术特征摘要】
1.一种文本识别方法，其特征在于，包括：
对待检测图像进行特征提取处理，获得多个语义向量，其中，所述多个语义向量与所述待检测图像中的文本序列的多个字符对应；
通过卷积神经网络对所述多个语义向量依次进行识别处理，得到所述文本序列的识别结果。

2.根据权利要求1所述的方法，其特征在于，所述通过卷积神经网络对所述多个语义向量依次进行识别处理，得到所述文本序列的识别结果，包括：
通过卷积神经网络对目标语义向量的先验信息进行处理，获得所述目标语义向量的权值参数，其中，所述多个语义向量包括所述目标语义向量；
根据所述权值参数和所述目标语义向量，确定与所述目标语义向量对应的文本识别结果。

3.根据权利要求2所述的方法，其特征在于，所述先验信息包括所述目标语义向量的前一语义向量对应的文本识别结果和/或起始符。

4.根据权利要求2或3所述的方法，其特征在于，所述通过卷积神经网络对目标语义向量的先验信息进行处理，获得所述目标语义向量的权值参数，包括：
通过所述卷积神经网络中的至少一个第一卷积层对所述目标语义向量进行编码处理，获得所述目标语义向量的第一向量；
通过所述卷积神经网络中的至少一个第二卷积层对所述目标语义向量的先验信息进行编码处理，获得与所述先验信息对应的第二向量；
基于所述第一向量和所述第二向量，确定所述权值参数。

5.根据权利要求4所述的方法，其特征在于，所述通过所述卷积神经网络中的至少一个第二卷积层对所述目标语义向量的先验信息进行编码处理，获得与所述先验信息对应的第二向量，包括：
响应于所述先验信息包括所述目标语义向量的前一语义向量对应的文本识别结果，对所述前一语义向量对应的文本...

【专利技术属性】
技术研发人员：刘学博，
申请(专利权)人：北京市商汤科技开发有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人