【技术实现步骤摘要】
字符识别方法、装置、电子设备和存储介质
[0001]本申请涉及图像识别
,尤其涉及字符识别方法、装置、电子设备和存储介质。
技术介绍
[0002]字符识别方法总的来说主要分为两大类,传统算法识别和神经网络算法识别。用传统算法识别时,在设计算法时,需要对图片的噪声,图像质量,分辨率等做出较多的设计和思考。而随着神经网络技术的不断发展,目前,基于神经网络的字符识别算法取得了很多突破,已经成为了主流。但是,识别准确度还有一定的提升空间。
技术实现思路
[0003]本申请实施例提供了字符识别方法、装置、电子设备和存储介质,以提升字符识别的准确度。
[0004]本申请实施例采用下述技术方案:第一方面,本申请实施例提供一种字符识别方法,包括:获取包含待识别字符的图像;将包含待识别字符的图像输入预设字符识别模型,得到字符识别结果;其中,预设字符识别模型依次包括:卷积神经网络CNN、循环神经网络RNN以及转录网络CTC,CNN的输出与RNN的输出之间设有短路连接,短路连接用于根据CNN的输出与RNN的输出得到中 ...
【技术保护点】
【技术特征摘要】
1.一种字符识别方法,其特征在于,该方法包括:获取包含待识别字符的图像;将所述包含待识别字符的图像输入预设字符识别模型,得到字符识别结果;其中,所述预设字符识别模型依次包括:卷积神经网络CNN、循环神经网络RNN以及转录网络CTC,所述CNN的输出与所述RNN的输出之间设有短路连接,所述短路连接用于根据所述CNN的输出与所述RNN的输出得到中间输出结果;所述CTC用于对所述中间输出结果进行处理,输出所述字符识别结果。2.如权利要求1所述的方法,其特征在于,所述CNN具有多感受野结构,所述CNN用于根据所述多感受野结构,对所述包含待识别字符的图像进行字符特征提取,从而能够适应不同字形的字符。3.如权利要求2所述的方法,其特征在于,所述多感受野结构基于平行多池化层实现,平行多池化层中的各池化层不同;所述平行多池化层用于接收CNN中前一层的输出,相应地得到各池化层的输出结果,对各输出结果进行第一指定运算,得到第一运算结果作为所述CNN中下一层的输入。4.如权利要求3所述的方法,其特征在于,所述平行多池化层有多组,其中,所述CNN中第一卷积层之后以及第二卷积层之后的两组平行多池化层中,每组平行多池化层中的最大池化层分别使用1
×
2的池化核和2
×
2的池化核;所述CNN的最后两组平行多池化层中,每组平行多池化层中的最大池化层分别使用1
×
2的池化核和3
×
2的池化核。5.如权利要求1所述的方法,其特征在于,所述CNN的第三个卷积层与第四个卷积层之间设置有批标准化层,所述批标准化层用于对所述第三个卷积层的卷积结果进...
【专利技术属性】
技术研发人员:孟鹏飞,朱磊,贾双成,潘冰,李成军,
申请(专利权)人:智道网联科技北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。