字符识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号：29940198 阅读：32 留言：0更新日期：2021-09-04 19:23

本申请公开了字符识别方法、装置、电子设备和存储介质。字符识别方法包括：获取包含待识别字符的图像；将包含待识别字符的图像输入预设字符识别模型，得到字符识别结果；其中，预设字符识别模型依次包括：卷积神经网络CNN、循环神经网络RNN以及转录网络CTC，CNN的输出与RNN的输出之间设有短路连接，短路连接用于根据CNN的输出与RNN的输出得到中间输出结果；CTC用于对中间输出结果进行处理，输出字符识别结果。该技术方案基于对CRNN算法的改进，在原始CRNN的基础上添加CNN的输出与RNN的输出之间的短路连接，从而提升了字符识别结果的准确度。确度。确度。

全部详细技术资料下载

【技术实现步骤摘要】
字符识别方法、装置、电子设备和存储介质

[0001]本申请涉及图像识别
，尤其涉及字符识别方法、装置、电子设备和存储介质。

技术介绍

[0002]字符识别方法总的来说主要分为两大类，传统算法识别和神经网络算法识别。用传统算法识别时，在设计算法时，需要对图片的噪声，图像质量，分辨率等做出较多的设计和思考。而随着神经网络技术的不断发展，目前，基于神经网络的字符识别算法取得了很多突破，已经成为了主流。但是，识别准确度还有一定的提升空间。

技术实现思路

[0003]本申请实施例提供了字符识别方法、装置、电子设备和存储介质，以提升字符识别的准确度。
[0004]本申请实施例采用下述技术方案：第一方面，本申请实施例提供一种字符识别方法，包括：获取包含待识别字符的图像；将包含待识别字符的图像输入预设字符识别模型，得到字符识别结果；其中，预设字符识别模型依次包括：卷积神经网络CNN、循环神经网络RNN以及转录网络CTC，CNN的输出与RNN的输出之间设有短路连接，短路连接用于根据CNN的输出与RNN的输出得到中...

【技术保护点】

【技术特征摘要】
1.一种字符识别方法，其特征在于，该方法包括：获取包含待识别字符的图像；将所述包含待识别字符的图像输入预设字符识别模型，得到字符识别结果；其中，所述预设字符识别模型依次包括：卷积神经网络CNN、循环神经网络RNN以及转录网络CTC，所述CNN的输出与所述RNN的输出之间设有短路连接，所述短路连接用于根据所述CNN的输出与所述RNN的输出得到中间输出结果；所述CTC用于对所述中间输出结果进行处理，输出所述字符识别结果。2.如权利要求1所述的方法，其特征在于，所述CNN具有多感受野结构，所述CNN用于根据所述多感受野结构，对所述包含待识别字符的图像进行字符特征提取，从而能够适应不同字形的字符。3.如权利要求2所述的方法，其特征在于，所述多感受野结构基于平行多池化层实现，平行多池化层中的各池化层不同；所述平行多池化层用于接收CNN中前一层的输出，相应地得到各池化层的输出结果，对各输出结果进行第一指定运算，得到第一运算结果作为所述CNN中下一层的输入。4.如权利要求3所述的方法，其特征在于，所述平行多池化层有多组，其中，所述CNN中第一卷积层之后以及第二卷积层之后的两组平行多池化层中，每组平行多池化层中的最大池化层分别使用1
×
2的池化核和2
×
2的池化核；所述CNN的最后两组平行多池化层中，每组平行多池化层中的最大池化层分别使用1
×
2的池化核和3
×
2的池化核。5.如权利要求1所述的方法，其特征在于，所述CNN的第三个卷积层与第四个卷积层之间设置有批标准化层，所述批标准化层用于对所述第三个卷积层的卷积结果进...

【专利技术属性】
技术研发人员：孟鹏飞，朱磊，贾双成，潘冰，李成军，
申请(专利权)人：智道网联科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人