一种文本识别方法、系统、电子设备及存储介质技术方案

技术编号:34698731 阅读:38 留言:0更新日期:2022-08-27 16:34
本申请实施例公开了一种文本识别方法、系统、电子设备及存储介质;本申请实施例可以获取待识别文本图像;对待识别文本图像进行编码处理,得到待识别文本图像的特征序列;基于语义提取模型,对特征序列进行语义提取处理,得到全局语义信息;基于预训练语言表征模型,对全局语义信息进行优化处理,得到优化后的全局语义信息;对优化后的全局语义信息和特征序列进行解码处理,得到待识别文本图像的文本识别结果。由此,本方案可以提升对场景文本识别的识别效果,提高准确率。提高准确率。提高准确率。

【技术实现步骤摘要】
一种文本识别方法、系统、电子设备及存储介质


[0001]本申请涉及人工智能领域,具体涉及一种文本识别方法、系统、电子设备及存储介质。

技术介绍

[0002]场景文本识别是计算机视觉领域的一个研究热点,近年来受到了广泛的关注,其在各种场景应用广泛,比如自动驾驶、路标识别、车牌识别以及教育场景下的拍照搜题等。
[0003]然而,目前现有的文本识别方法对图像进行识别时,识别的准确率较低,无法满足用户的使用需求。

技术实现思路

[0004]本申请实施例提供一种文本识别方法、系统、电子设备及存储介质,可以提升对场景文本识别的识别效果,提高准确率。
[0005]第一方面,本申请实施例提供一种文本识别方法,包括:
[0006]获取待识别文本图像;
[0007]对待识别文本图像进行编码处理,得到待识别文本图像的特征序列;
[0008]基于语义提取模型,对特征序列进行语义提取处理,得到全局语义信息;
[0009]基于预训练语言表征模型,对全局语义信息进行优化处理,得到优化后的全局语义信息;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法,其特征在于,包括获取待识别文本图像;对所述待识别文本图像进行编码处理,得到所述待识别文本图像的特征序列;基于语义提取模型,对所述特征序列进行语义提取处理,得到全局语义信息;基于预训练语言表征模型,对所述全局语义信息进行优化处理,得到优化后的全局语义信息;对优化后的全局语义信息和所述特征序列进行解码处理,得到所述待识别文本图像的文本识别结果。2.根据权利要求1所述的文本识别方法,其特征在于,所述获取待识别文本图像,包括:获取待矫正的文本图像;对所述待矫正的文本图像进行矫正处理,得到矫正图像,将所述矫正图像记作所述待识别文本图像。3.根据权利要求1所述的文本识别方法,其特征在于,所述对所述待识别文本图像进行编码处理,得到所述待识别文本图像的特征序列,包括:对所述待识别文本图像进行特征提取处理,得到特征图像;将所述特征图像输入至少一层双向循环网络,生成两个候选特征序列;将所述两个候选特征序列进行合并处理,得到所述特征序列。4.根据权利要求1所述的文本识别方法,其特征在于,所述语义提取模型至少包括第一连接层网络和第二连接层网络;所述基于语义提取模型,对所述特征序列进行语义提取处理,得到全局语义信息,包括:获取所述第一连接层网络的第一权重和第一偏置、所述第二连接层网络的第二权重和第二偏置以及修正线性单元的激活函数;对所述特征序列进行转换处理,得到所述特征序列的一维向量;根据所述第一连接层网络的第一权重和第一偏置、所述第二连接层网络的第二权重和第二偏置、所述修正线性单元的激活函数以及所述特征序列的一维向量,得到所述全局语义信息。5.根据权利要求1所述的文本识别方法,其特征在于,所述基于预训练语言表征模型,对所述全局语义信息进行优化处理,得到优化后的全局语义信息,包括:确定所述全局语义信息;对所述全局语义信息进行信息提取,得到所述全局语义信息中的字向量、文本向量和位置向量;将所述全局语义信息中的字向量、文本向量和位置向量输入至所述预训练语言表征模型,得到词嵌入向量;根据所述词嵌入向量和所述全局语义信息,得到损...

【专利技术属性】
技术研发人员:柳阳
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1