一种基于卷积神经网络的女书文字识别方法及系统技术方案

技术编号:38388242 阅读:13 留言:0更新日期:2023-08-05 17:42
本发明专利技术涉及文字识别技术领域,具体涉及一种基于卷积神经网络的女书文字识别方法及系统;S1、获取女书文字图像,并对所述女书文字图像进行预处理。本发明专利技术以YOLOv5目标检测算法为基础,目标卷积神经网络文字识别方法兼具高准确率和高实时性的特点,同时该识别方法具有良好的易用性和扩展性,将卷积神经网络与图像识别结合,能够大幅度地提高图像的处理速度,提取更加抽象的图像特征,女书文字识别系统可以利用深度卷积神经网络自动、快速、准确地对女书文字进行定位和识别,极大的提升了女书文字的识别精度,以更快捷、更高效的方式解决凭借人力无法解决的问题,具有重要的现实意义。具有重要的现实意义。具有重要的现实意义。

【技术实现步骤摘要】
一种基于卷积神经网络的女书文字识别方法及系统


[0001]本专利技术涉及文字识别
,具体涉及一种基于卷积神经网络的女书文字识别方法及系统。

技术介绍

[0002]神经网络技术是一种类似于动物神经网络行为特征,通过“观测”数据从而使计算机进行学习的算法模型,该技术依靠节点间连接关系的调整,达成信息处理的目的。
[0003]中国专利申请号为CN111310868A公开了一种基于卷积神经网络的水书手写文字识别方法,包括以下步骤:1)进行水书文字数据集准备:将水书影印卷本的原始图像作为样本图像,对样本图像中的文字进行标注,制作数据集;2)进行水书文字数据集增强:为提高模型的鲁棒性,进行图像裁剪以扩增数据量,并加入随机噪声、进行色彩抖动以及PCA抖动对数据进行增强,增加数据样本的多样性,以应对复杂的识别场景;3)实验实施过程:为检验深度学习方法对水书文字识别适用与否,进行实例实验。
[0004]现如今文字识别的主流方法是基于深度卷积神经网络的图像识别方法,深度卷积神经网络在语音识别、图像处理以及文本识别中得到了初步的应用,期望通过深度学习模拟人脑,以解决复杂的模式识别难题,因此,应用深度卷积神经网络来进行女书文字识别对提高作业的效率和适应性具有重大的现实意义,综上所述,提出一种基于卷积神经网络的女书文字识别方法及系统。

技术实现思路

[0005]针对现有技术所存在的缺点,本专利技术的目的在于提供一种基于卷积神经网络的女书文字识别方法及系统。
[0006]为实现上述目的,本专利技术提供了如下技术方案:
[0007]一种基于卷积神经网络的女书文字识别方法,包括以下步骤:
[0008]S1、获取女书文字图像,并对所述女书文字图像进行预处理;
[0009]S2、通过卷积神经网络对预处理后的所述女书文字图像进行分割,得到女书文字的确切位置;
[0010]S3、结合卷积神经网络提取所述女书文字的特征;
[0011]S4、定位图像中的女书文字并输出中文文字,完成女书文字的识别。
[0012]本专利技术进一步设置为:在步骤S1中,所述获取女书文字图像,并对所述女书文字图像进行预处理,包括以下步骤:
[0013]S11、将输入图像的宽高像素统一缩放为相同默认高度608
×
608像素,完成对输入图像的缩放处理;
[0014]S12、并通过卷积神经网络提取特征,分别生成304
×
304、152
×
152、76
×
76、38
×
38、19
×
19像素的特征图;
[0015]S13、在最后三层特征图中使用PAFPN对特征图进行融合,以生成包含丰富信息的
特征图金字塔结构用于下一步处理。
[0016]本专利技术进一步设置为:在步骤S2中,所述结合卷积神经网络提取所述女书文字的特征,包括以下内容:对多层特征金字塔分别进行分类处理,在目标图像上定位文本块并绘制边界框,以获取文字的位置信息,根据文字定位结果,对目标图像中的字符进行切割,获得所述目标图像包含的各个字符图像。
[0017]本专利技术进一步设置为:在步骤S3中,所述结合卷积神经网络提取所述女书文字的特征,包括以下步骤:
[0018]S31、对特征图字符图像进行归一化处理,即所有维度将被归属到相同范围,并对文字图像进行白化处理,文字图像白化处理后,可降低图像在卷积神经网络中传输占用的空间;
[0019]S32、卷积神经网络对图像进行计算,计算的内容包括文字图像深度、文字步长、图像填充值;
[0020]S33、对图像输入结构进行非映射处理,权重值被映射得到图像权重系数;
[0021]S34、在处理文字图像时,进行数据集合与文字图像的压缩,降低权重系数;
[0022]S35、需要在输出端将不同类型的数据进行全接连处理,将对接的过程使用矩阵进行表示,输出数据的每一个维度均来自不同神经元;
[0023]S36、使用逻辑函数或归一化指数函数,将输出的特征向量通过内部的分类器进行处理后,输出分类标签,提取出目标图像的文字特征。
[0024]本专利技术进一步设置为:在步骤S4中,所述定位图像中的女书文字并输出中文文字,完成女书文字的识别,将每个单字符输入到预先训练得到的目标卷积神经网络中,进行前向传播,获得每个单字符的文字识别结果,所述目标卷积神经网络通过大量单字图样本训练得到。
[0025]本专利技术进一步设置为:所述目标卷积神经网络的训练步骤为:
[0026]获得训练数据集和测试数据集,训练数据集中包含设定第一数量的字符样本,测试数据集中包含设定第二数量的字符样本,且每个样本的尺寸大小相同;
[0027]初始化卷积神经网络,利用训练数据集对卷积神经网络进行训练,确定训练过程中的误差;
[0028]在卷积神经网络设定迭代次数时,将测试数据集输入到卷积神经网络中进行测试,获得测试准确率;
[0029]重复执行利用训练数据集对卷积神经网络进行训练,直至卷积神经网络的误差低于预设第一阈值,且测试准确率高于预设第二阈值时,获得所述目标卷积神经网络。
[0030]本专利技术进一步设置为:所述目标卷积神经网络还包含有循环网络层,其中循环网络层是一个深层双向LSTM网络,在卷积特征的基础上继续提取文字序列特征。
[0031]本专利技术还提供了一种基于卷积神经网络的女书文字识别系统,包括:
[0032]目标图像确定模块,所述目标图像确定模块用于确定待进行文字识别的目标图像,并对所述女书文字目标图像进行预处理;
[0033]图像分割模块,所述图像分割模块用于对女书文字目标图像进行分割,在目标图像中定位字符信息并且提取各个字符;
[0034]特征提取模块,所述特征提取用于对字符进行正则化处理,获得该字符对应的汉
字形状;
[0035]文字识别模块,所述文字识别模块用于将每个图像输入到预先训练得到的目标卷积神经网络中,获得文字识别结果。
[0036]有益效果
[0037]采用本专利技术提供的技术方案,与已知的公有技术相比,具有如下有益效果:
[0038](1)、本专利技术以YOLOv5目标检测算法为基础,根据图像数据特征对采集得到的数据进行有效地扩充,并进行多次训练和验证测试,最终获得了88.7%的平均精度、93.3%的准确率和94.8%的召回率,同时达到45张/s的识别速度;目标卷积神经网络文字识别方法兼具高准确率和高实时性的特点,同时该识别方法具有良好的易用性和扩展性,将卷积神经网络与图像识别结合,能够大幅度地提高图像的处理速度,提取更加抽象的图像特征,达到更优越的效果,以获得更准确和更具鲁棒性的模型,女书文字识别系统可以利用深度卷积神经网络自动、快速、准确地对女书文字进行定位和识别,极大的提升了女书文字的识别精度,以更快捷、更高效的方式解决凭借人力无法解决的问题,具有重要的现实意义。...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络的女书文字识别方法,其特征在于,包括以下步骤:S1、获取女书文字图像,并对所述女书文字图像进行预处理;S2、通过卷积神经网络对预处理后的所述女书文字图像进行分割,得到女书文字的确切位置;S3、结合卷积神经网络提取所述女书文字的特征;S4、定位图像中的女书文字并输出中文文字,完成女书文字的识别。2.根据权利要求1所述的一种基于卷积神经网络的女书文字识别方法,其特征在于,在步骤S1中,所述获取女书文字图像,并对所述女书文字图像进行预处理,包括以下步骤:S11、将输入图像的宽高像素统一缩放为相同默认高度608
×
608像素,完成对输入图像的缩放处理;S12、通过卷积神经网络提取特征,分别生成304
×
304、152
×
152、76
×
76、38
×
38、19
×
19像素的特征图;S13、在最后三层特征图中使用PAFPN对特征图进行融合,以生成包含丰富信息的特征图金字塔结构用于下一步处理。3.根据权利要求2所述的一种基于卷积神经网络的女书文字识别方法,其特征在于,在步骤S2中,所述结合卷积神经网络提取所述女书文字的特征,包括以下内容:对所述多层特征金字塔分别进行分类处理,在目标图像上定位文本块并绘制边界框,以获取文字的位置信息,根据文字定位结果,对目标图像中的字符进行切割,获得所述目标图像包含的各个字符图像。4.根据权利要求3所述的一种基于卷积神经网络的女书文字识别方法,其特征在于,在步骤S3中,所述结合卷积神经网络提取所述女书文字的特征,包括以下步骤:S31、对特征图字符图像进行归一化处理,即所有维度被归属到相同范围,并对文字图像进行白化处理,文字图像白化处理后,可降低图像在卷积神经网络中传输占用的空间;S32、卷积神经网络对图像进行计算,计算的内容包括文字图像深度、文字步长、图像填充值;S33、对图像输入结构进行非映射处理,权重值被映射得到图像权重系数;S34、在处理文字图像时,进行数据集合与文字图像的压缩,降低权重参数量;S35、需要在输出端将不同类型的数据...

【专利技术属性】
技术研发人员:张岩张留美
申请(专利权)人:西安石油大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1