【技术实现步骤摘要】
文本识别方法、存储介质及计算机终端
[0001]本申请涉及文本识别领域,具体而言,涉及一种文本识别方法、存储介质及计算机终端。
技术介绍
[0002]文本识别平台目前支持的场景越来越多,例如,可以将文本识别平台应用在教育场景中,在教育场景中,在目标文本图像中由于存在笔迹涂抹、像素质量低、书本折叠处文字变形等问题导致文本识别的准确率较低。
[0003]针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
[0004]本申请实施例提供了一种文本识别方法、存储介质及计算机终端,以至少解决相关技术中文本识别的准确率较低的技术问题。
[0005]根据本申请实施例的一个方面,提供了一种文本识别方法,包括:获取训练样本,其中,训练样本包括:训练文本图像和预设识别结果;利用识别模型对训练文本图像进行特征提取,得到样本特征;利用识别模型对样本特征进行上下文关联,生成增强特征,其中,增强特征用于表征训练样本的上下文信息;利用识别模型分别对样本特征和增强特征进行分类,得到样本特征的第一识别结果和增强特征的第二 ...
【技术保护点】
【技术特征摘要】
1.一种文本识别方法,其特征在于,包括:获取训练样本,其中,所述训练样本包括:训练文本图像和预设识别结果;利用识别模型对所述训练文本图像进行特征提取,得到样本特征;利用所述识别模型对所述样本特征进行上下文关联,生成增强特征,其中,所述增强特征用于表征所述训练样本的上下文信息;利用所述识别模型分别对所述样本特征和所述增强特征进行分类,得到所述样本特征的第一识别结果和所述增强特征的第二识别结果;基于所述第一识别结果、所述第二识别结果和所述预设识别结果,对所述识别模型进行训练。2.根据权利要求1所述的方法,其特征在于,所述识别模型包括:主干模块和上下文关联模块,所述主干模块包括:依次连接的特征提取单元和分类单元,所述上下文关联模块包括:依次连接的位置编码单元、特征对齐单元、注意力单元和上下文单元,其中,所述上下文关联模块包含的每个单元的输入均与所述特征提取单元的输出连接。3.根据权利要求2所述的方法,其特征在于,利用所述识别模型对所述样本特征进行上下文关联,生成增强特征包括:利用所述位置编码单元对所述样本特征进行位置编码,得到位置特征;利用所述特征对齐单元对所述样本特征和所述位置特征进行对齐,得到注意力特征;利用所述上下文单元对所述样本特征和所述注意力特征进行上下文关联,得到所述增强特征。4.根据权利要求3所述的方法,其特征在于,利用所述位置编码单元对所述样本特征进行位置编码,得到位置特征包括:确定所述样本特征的第一维度,所述位置特征的第二维度;基于所述第一维度、所述第二维度对所述样本特征中的每个位置进行编码,得到所述位置特征。5.根据权利要求3所述的方法,其特征在于,利用所述特征对齐单元对所述样本特征和所述位置特征进行对齐,得到注意力特征包括:将所述样本特征和所述位置特征进行拼接,得到拼接特征;对所述拼接特征进行对齐操作,得到所述注意力特征。6.根据权利要求3所述的方法,其特征在于,利用所述上下文单元对所述样本特征和所述注意力特征进行上下文关联,得到所述增强特征包括:基于所述注意力特征和所述样本特征,生成文字密集特征;利用所述上下文单元对所述文字密集特征进行上下文关联,得到所述增强特征。7.一种文本识别方法,其特征在于,包括:获取目标书本图像,其中,所述目标书本图像包含多个目标文字;利用识别模型对所述目标书本图像进行识别,得到所述目标书本图像的目标识别结果,其中,所述识别模型通过训练样本和所述训练样本的上下文信息进行训练所得到。8.一种文本识别方法,其特征在于,包括:接收客户端上传的目标文本图像,其中,所述目标文本图像包含多个目标文字;利用识别模型对所述...
【专利技术属性】
技术研发人员:黄耀雄,何梦超,姚聪,
申请(专利权)人:阿里巴巴达摩院杭州科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。