System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于深度神经网络的手写机务工卡字符识别方法技术_技高网

一种基于深度神经网络的手写机务工卡字符识别方法技术

技术编号:40033729 阅读:5 留言:0更新日期:2024-01-16 18:38
一种基于深度神经网络的手写机务工卡字符识别方法。其包括选取训练集和测试集;归一化处理;构建原始手写机务工卡字符识别模型;模型训练和测试,获得手写机务工卡字符识别模型;将待识别手写机务工卡输入手写机务工卡字符识别模型,输出类别等步骤。本发明专利技术通过重参数化的特征提取器,能将多分支卷积在形式上等价为一个普通卷积,减少了内存消耗和模型运算量,保留多分支卷积的特征提取性能,再通过对不同复杂度的汉字进行自适应特征分类,可进一步提高简单字符的特征提取识别效率。对于复杂字符和相似字符,全卷积分类器结构设计能够最大程度保留汉字具有区分度的空间和边缘信息,经过多级卷积的特征提取和分类器处理,能较好地完成高精度分类。

【技术实现步骤摘要】

本专利技术属于深度学习图像分类,具体涉及一种基于深度神经网络的手写机务工卡字符识别方法


技术介绍

1、机务工卡是指根据飞机维修手册或维修方案编写的具有法律效力的作业单,是指导机务人员进行飞机维修的重要依据,也是记录飞机维修过程和结果的重要文件,是民用航空器持续安全适航的重要保证。随着民航业的不断发展,地面保障压力日益增大。维修工程师在日常养护、维修、放行等工作结束后,需要填写飞行记录、放行工卡等作为工作日志。虽然互联网和移动终端智能设备的流行使无纸化办公逐渐成为主流,但出于行业安全性考虑,且受航空公司规模、经济效益等限制,业内仍需分步完成人工手写、数字化存档工作。因此智能化识别有利于降本增效,具有现实意义。

2、书写者的用笔习惯不同、手写字风格多样、常用汉字类别众多、笔画多寡均会导致图像的复杂程度差异大。另外,存在大量的相似字符,导致识别效果不佳。传统的基于统计学习和人工设计特征的识别方式(如:gabor,hog等)存在特征提取能力不足和泛化性较弱的问题,最高精度仅为90%。随着深度学习的发展,基于传统卷积网络的识别方式因识别效果更好成为主流,但卷积网络运算量相对较大,实际识别效率受模型规模影响显著,因此在提高手写字符识别精度的同时提高模型识别效率,具有较高的实际应用价值。但目前尚缺少有效的手写工卡字符识别方法。


技术实现思路

1、为了解决上述问题,本专利技术的目的在于提供一种基于深度神经网络的手写机务工卡字符识别方法。

2、为了达到上述目的,本专利技术提供的基于深度神经网络的手写机务工卡字符识别方法包括按顺序进行的下列步骤:

3、1)分别选取中国科学院自动化研究所公开的手写汉字数据集hwdb1.0-1.1和icdar2013数据集作为训练集和测试集;

4、所述手写汉字数据集hwdb1.0-1.1中共有267万余张含中文手写字符的原始图像,涵盖了3755类国标一级汉字;icdar2013数据集中共有22.4万张含中文手写字符的原始图像,涵盖了地面维修工单中出现的高频汉字。

5、2)将上述训练集和测试集中的原始图像尺寸进行统一,并进行归一化处理,获得归一化后的训练集和测试集;

6、处理过程如式(1)—(3)所示:

7、

8、

9、

10、其中,n表示原始图像的数量;xi表示第i张原始图像,xi′表示归一化处理后的图像,mean表示原始图像的均值;std表示原始图像的标准差;

11、3)构建原始手写机务工卡字符识别模型;

12、所述手写机务工卡字符识别模型由重参数化的特征提取器和全卷积分类器两部分组成;

13、所述特征提取器由五个卷积块构成,每个卷积块含有三个重参数化卷积层,呈递进关系;特征提取器的第一个卷积块中含有三个重参数化卷积层,每层含有4个分支,分别为1×1卷积分支,1×1卷积-7×7卷积分支,1×1卷积-平均池化分支和7×7卷积分支;在第四分支之后接入一个leakyrelu层用以完成非线性化,以提高模型的泛化性能。而特征提取器的第二至第五卷积块中则均含有三个重参数化卷积层,每层含有3个分支,分别为3×3卷积分支、1×1卷积分支和批归一化分支;

14、全卷积分类器由两组融合下采样卷积块及一个1×1卷积层组成:每组融合下采样卷积块由3×3卷积层、非线性化函数层、1×1卷积和平均池化层交替构成。融合下采样模块的卷积核大小均为3×3,池化卷积核大小为1×1;

15、设特征提取器的第四个卷积层输出的特征矩阵为x4,将其复制一次,得到两个相等的特征矩阵分支x4,1和x4,2,然后进行两特征矩阵分支的传播;对于特征矩阵分支x4,1,从特征提取器的第四个卷积块引出一个短接分支连接到1×1卷积层,构建一个特征自适应分类模块cl,使用短接分支连接到全卷积分类器最后的1×1卷积层,将简单字符的特征矩阵跳过特征提取器的第五个卷积块,通过特征自适应分类模块cl直接进入全卷积分类器的1×1卷积层,利用该层进行降采样后,得到输出矩阵如式(4)所示,其中pool表示池化操作,r表示leakyrelu层,*表示卷积操作,w(3),w(1)分别表示卷积核尺寸为3、卷积核尺寸为1的参数矩阵;对于特征矩阵分支x4,2,使其串行至特征提取器的第五卷积块中进行降采样,如式(5)所示,其中s5(·)表示第五卷积块,得到输出的特征矩阵,并使用融合比例k控制1×1卷积层和第五卷积块的特征比例;

16、x4,1′=cl(x4,1)=pool(r(x4,1*w(3))*w(1))   (4)

17、x4,2'=r(r(s5(x4,2)*w(3)))*w(1)   (5)

18、x'=conct([x4,1',x4,2'])*w(3)   (6)

19、最终在1×1卷积层中,将特征提取器的第四个卷积块经特征自适应分类模块输出的特征矩阵和第二组融合下采样卷积块输出的特征矩阵利用式(6)进行融合,其中conct([...])表示特征矩阵融合操作,得到融合特征其中d表示按融合比例k1,k2融合后的总神经元数量;

20、融合下采样卷积块的表达式如式(7)-(8)所示:

21、x4,1′=cl(x4,1)=pool(r(x4,1*w(3))*w(1))   (7)

22、x4,2'=r(r(s5(x4,2)*w(3)))*w(1)   (8)

23、其中,x4表示第四卷积层输出的特征矩阵,s5(·)表示特征提取器的第五卷积块的特征提取过程,cl表示融合下采样卷积块,pool表示池化操作,r表示leakyrelu层;最后利用softmax函数选取出类别概率最大的结果作为模型输出,获得原始手写机务工卡字符识别模型。

24、4)将上述步骤2)获得的归一化后的训练集输入步骤3)获得的原始手写机务工卡字符识别模型中进行模型训练,然后输入归一化后的测试集进行模型测试,获得手写机务工卡字符识别模型;

25、模型训练时采用多分支结构,模型测试时将多分支结构转化为单分支结构,以提高模型运行效率。

26、5)将待识别的手写机务工卡图像尺寸调整成64*64,之后输入到步骤4)获得的手写机务工卡字符识别模型中,手写机务工卡字符识别模型的输出即为该手写机务工卡的类别。

27、本专利技术提供的基于深度神经网络的手写机务工卡字符识别方法具有如下有益效果:

28、通过重参数化的特征提取器,能够将多分支卷积在形式上等价为一个普通卷积,减少了内存消耗和模型运算量,保留多分支卷积的特征提取性能,再通过对不同复杂度的汉字进行自适应特征分类,可进一步提高简单字符的特征提取识别效率。对于复杂字符和相似字符,全卷积分类器结构设计能够最大程度保留汉字具有区分度的空间和边缘信息,经过多级卷积的特征提取和分类器处理,能较好地完成高精度分类。

本文档来自技高网...

【技术保护点】

1.一种基于深度神经网络的手写机务工卡字符识别方法,其特征在于:所述基于深度神经网络的手写机务工卡字符识别方法包括按顺序进行的下列步骤:

2.根据权利要求1所述的基于深度神经网络的手写机务工卡字符识别方法,其特征在于:在步骤1)中,所述手写汉字数据集HWDB1.0-1.1中共有267万余张含中文手写字符的原始图像,涵盖了3755类国标一级汉字;ICDAR2013数据集中共有22.4万张含中文手写字符的原始图像,涵盖了地面维修工单中出现的高频汉字。

3.根据权利要求1所述的基于深度神经网络的手写机务工卡字符识别方法,其特征在于:在步骤2)中,所述将上述训练集和测试集中的原始图像尺寸进行统一,并进行归一化处理的过程如式(1)—(3)所示:

4.根据权利要求1所述的基于深度神经网络的手写机务工卡字符识别方法,其特征在于:在步骤3)中,所述构建原始手写机务工卡字符识别模型的方法是:

5.根据权利要求1所述的基于深度神经网络的手写机务工卡字符识别方法,其特征在于:在步骤4)中,所述模型训练时采用多分支结构,模型测试时将多分支结构转化为单分支结构。

...

【技术特征摘要】

1.一种基于深度神经网络的手写机务工卡字符识别方法,其特征在于:所述基于深度神经网络的手写机务工卡字符识别方法包括按顺序进行的下列步骤:

2.根据权利要求1所述的基于深度神经网络的手写机务工卡字符识别方法,其特征在于:在步骤1)中,所述手写汉字数据集hwdb1.0-1.1中共有267万余张含中文手写字符的原始图像,涵盖了3755类国标一级汉字;icdar2013数据集中共有22.4万张含中文手写字符的原始图像,涵盖了地面维修工单中出现的高频汉字。

3.根据权利要求1所述的...

【专利技术属性】
技术研发人员:郭晓静赵小源徐文君邹松林徐晓慧郭佳豪
申请(专利权)人:中国民航大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1