【技术实现步骤摘要】
基于神经网络的文字识别方法、装置及存储介质
本专利技术涉及文字识别
,特别涉及一种基于神经网络的文字识别方法、装置及存储介质。
技术介绍
随着时代的发展,对环保和资源节约方面的重视,无纸化办公成为当前数字化办公方面发展的热点。现有技术中,通过扫描、拍摄等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品中的文字转化为图像信息,或者直接获取图片、视频帧等图像信息,再采用文字识别技术将上述图像信息转化为文本。但是在日常的生产生活中,相当数量的票据、文档是手工书写的,人工归档录入需要消耗大量的物力与财力。而且手工书写的文本存在字体不规范、潦草、大小不一、不整齐等问题,常用的文字识别模型显然无法应对这种情况。因此,设计一种可识别手写体文字的方法是本领域技术人员面临的重大技术问题。
技术实现思路
本公开实施例提供了一种基于神经网络的文字识别方法、装置及存储介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一 ...
【技术保护点】
1.一种基于神经网络的文字识别方法,其特征在于,包括:/n获取待识别的文字数据集;/n将所述文字数据集输入训练好的神经网络模型,其中,所述神经网络模型包括依次连接的空洞卷积层、卷积层、池化层以及全连接层;/n根据所述神经网络模型的输出得到文字识别结果。/n
【技术特征摘要】
1.一种基于神经网络的文字识别方法,其特征在于,包括:
获取待识别的文字数据集;
将所述文字数据集输入训练好的神经网络模型,其中,所述神经网络模型包括依次连接的空洞卷积层、卷积层、池化层以及全连接层;
根据所述神经网络模型的输出得到文字识别结果。
2.根据权利要求1所述的方法,其特征在于,所述获取待识别的文字数据集之后,还包括:
将所述文字数据集处理成单通道的灰度图像。
3.根据权利要求1所述的方法,其特征在于,所述神经网络模型包含六层,其中,第一层为空洞卷积层,第二层和第三层为卷积层,第四层为最大池化层,第五层和第六层为全连接层。
4.根据权利要求3所述的方法,其特征在于,第一层、第二层以及第三层输入输出的图像尺寸遵循以下公式:
其中,WOUT为输出图像的尺寸,Win为输入图像的尺寸,padding为用于填充边缘的层数,F为卷积核的尺寸,stride为卷积步长。
5.根据权利要求1所述的方法,其特征在于,所述空洞卷积层、卷积层和所述全连接层的激活函数为Relu激活函数。
6.根据权利要求...
【专利技术属性】
技术研发人员:吴若昊,
申请(专利权)人:新华三大数据技术有限公司,
类型:发明
国别省市:河南;41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。