【技术实现步骤摘要】
一种手写英文单词识别方法及系统
本专利技术涉及图像识别
,具体涉及一种手写英文单词识别方法及系统。
技术介绍
为了提高考试公平性以及生活便利性,对手写文字进行识别是一种新兴趋势。然而英文单词与汉字的特点不同,英文单词更注重字母排列顺序。因此现有的文字识别方法用于识别英文单词时,往往准确率不高,导致识别错误。
技术实现思路
针对现有技术的上述不足,本专利技术提供一种手写英文单词识别方法及系统,以解决上述技术问题。第一方面,本专利技术提供一种手写英文单词识别方法,包括:将待识别图像进行长度预处理,得到标准图像数据;将所述标准图像数据输入预先训练好的卷积神经网络模型,得到空间特征向量;将所述空间特征向量输入预先训练好的编码器,得到编码信息;将所述编码信息输入预先训练好的解码器,得到识别结果。进一步的,所述将待识别图像进行长度预处理,得到标准图像数据,包括:设置图像的宽度标准值和长宽比;将所述待识别图像转换为灰度图;将所述待识别图像的宽度调整为所述标准值,并根据所述长宽比调整所述待识别图像的长度;若所述长度达不到预设长度值,则用白色进行填充;对经灰度转换和长宽调整的待识别图像的图像数据进行去均值和归一化处理,得到标准图像数据。进一步的,所述方法还包括:构建卷积神经网络模型、含双隐藏层的双向长短期记忆网络和注意力机制的双向长短期记忆网络,其中,含双隐藏层的双向长短期记忆网络为编码器,注意力机制的双向 ...
【技术保护点】
1.一种手写英文单词识别方法,其特征在于,包括:/n将待识别图像进行长度预处理,得到标准图像数据;/n将所述标准图像数据输入预先训练好的卷积神经网络模型,得到空间特征向量;/n将所述空间特征向量输入预先训练好的编码器,得到编码信息;/n将所述编码信息输入预先训练好的解码器,得到识别结果。/n
【技术特征摘要】
1.一种手写英文单词识别方法,其特征在于,包括:
将待识别图像进行长度预处理,得到标准图像数据;
将所述标准图像数据输入预先训练好的卷积神经网络模型,得到空间特征向量;
将所述空间特征向量输入预先训练好的编码器,得到编码信息;
将所述编码信息输入预先训练好的解码器,得到识别结果。
2.根据权利要求1所述的方法,其特征在于,所述将待识别图像进行长度预处理,得到标准图像数据,包括:
设置图像的宽度标准值和长宽比;
将所述待识别图像转换为灰度图;
将所述待识别图像的宽度调整为所述标准值,并根据所述长宽比调整所述待识别图像的长度;
若所述长度达不到预设长度值,则用白色进行填充;
对经灰度转换和长宽调整的待识别图像的图像数据进行去均值和归一化处理,得到标准图像数据。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
构建卷积神经网络模型、含双隐藏层的双向长短期记忆网络和注意力机制的双向长短期记忆网络,其中,含双隐藏层的双向长短期记忆网络为编码器,注意力机制的双向长短期记忆网络为解码器;
准备多张带有手写英文单词的图像,生成训练集、验证集和测试集;
利用所述训练集和验证集对构建卷积神经网络模型、编码器和解码器进行训练;
利用测试集对训练好的卷积神经网络模型、编码器和解码器进行测试,根据测试结果筛选最优的卷积神经网络模型、编码器和解码器。
4.根据权利要求3所述的方法,其特征在于,所述构建卷积神经网络模型包括:
设置卷积神经网络模型的Conv卷积层的初始化策略为每层输出的方差相差不超过预设阈值;
设置卷积核的尺寸为3*3;
将Relu设置为所述卷积神经网络模型的激活函数;
选用MaxPooling池化层,并设置所述MaxPooling池化层采用VALID填充方式,池化窗口尺寸包括2*2和2*1;
在部分卷积层后增加BatchNormalization层和dropout操作。
5.根据权利要求1所述的方法,其特征在于,所述将所述空间特征向量输入预先训练好的编码器,得到编码信息,包括:
编码器接收所述空间特征向量之后更新自身隐藏状态,将所述空间特征向量依次按照时间步进行双向传递;
编码器的两层隐藏层执行同样的状态更新和双向传递操作后,连结最后一层隐藏层的双向隐藏状态,作为输出层的输入,得到编码器的编码信息。
6.根据权利要求1所述的方法,其特征在于,所述将所述编码信息输入预先训练好的解码器,得到识别结果,包括:
所述解码器接收所述编码信息后,初始化自身隐藏状态,并计算当前时间步各个编码信息的注意力...
【专利技术属性】
技术研发人员:马磊,侯庆,许信顺,谭玉慧,初宛晴,
申请(专利权)人:山东山大鸥玛软件股份有限公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。