【技术实现步骤摘要】
手写模型训练方法、手写字识别方法、装置、设备及介质
本专利技术涉及中文字识别领域,尤其涉及一种手写模型训练方法、手写字识别方法、装置、设备及介质。
技术介绍
传统手写字识别方法大多包括二值化处理、字符分割、特征提取和支持向量机等步骤进行识别,采用传统手写字识别方法在识别较为潦草的非规范字(手写中文字)时,识别的精确度不高,使得其识别效果不理想。传统手写字识别方法很大程度上只能识别规范字,对实际生活中各种各样的手写字进行识别时,准确率较低。
技术实现思路
本专利技术实施例提供一种手写模型训练方法、装置、设备及介质,以解决当前手写字识别准确率不高的问题。一种手写模型训练方法,包括:获取规范中文字训练样本,采用所述规范中文字训练样本训练双向长短时记忆神经网络,获取双向长短时记忆神经网络的前向输出,根据双向长短时记忆神经网络的前向输出,采用基于随机梯度下降的时间相关反向传播算法更新双向长短时记忆神经网络的网络参数,获取规范中文字识别模型;获取非规范中文字训练样本,采用所述非规范中文字训练样本训练所述规范中文字识别模型,获取规范中文字识别模型的前向输出,根据规范中文字识别模型的 ...
【技术保护点】
1.一种手写模型训练方法,其特征在于,包括:获取规范中文字训练样本,采用所述规范中文字训练样本训练双向长短时记忆神经网络,获取双向长短时记忆神经网络的前向输出,根据双向长短时记忆神经网络的前向输出,采用基于随机梯度下降的时间相关反向传播算法更新双向长短时记忆神经网络的网络参数,获取规范中文字识别模型;获取非规范中文字训练样本,采用所述非规范中文字训练样本训练所述规范中文字识别模型,获取规范中文字识别模型的前向输出,根据规范中文字识别模型的前向输出,采用基于随机梯度下降的时间相关反向传播算法更新所述规范中文字识别模型的网络参数,获取调整中文手写字识别模型;获取待测试中文字样本 ...
【技术特征摘要】
1.一种手写模型训练方法,其特征在于,包括:获取规范中文字训练样本,采用所述规范中文字训练样本训练双向长短时记忆神经网络,获取双向长短时记忆神经网络的前向输出,根据双向长短时记忆神经网络的前向输出,采用基于随机梯度下降的时间相关反向传播算法更新双向长短时记忆神经网络的网络参数,获取规范中文字识别模型;获取非规范中文字训练样本,采用所述非规范中文字训练样本训练所述规范中文字识别模型,获取规范中文字识别模型的前向输出,根据规范中文字识别模型的前向输出,采用基于随机梯度下降的时间相关反向传播算法更新所述规范中文字识别模型的网络参数,获取调整中文手写字识别模型;获取待测试中文字样本,采用所述调整中文手写字识别模型识别所述待测试中文字样本,获取识别结果与真实结果不符的出错字,把所有所述出错字作为出错字训练样本;采用所述出错字训练样本训练所述调整中文手写字识别模型,获取调整中文手写字识别模型的前向输出,根据调整中文手写字识别模型的前向输出,采用基于批量梯度下降的时间相关反向传播算法更新调整中文手写字识别模型的网络参数,获取目标中文手写字识别模型。2.根据权利要求1所述的手写模型训练方法,其特征在于,所述获取规范中文字训练样本,包括:获取待处理中文字训练样本中每个中文字的像素值特征矩阵,将所述像素值特征矩阵中每个像素值进行归一化处理,获取每个中文字的归一化像素值特征矩阵,其中,归一化处理的公式为MaxValue为每个中文字的像素值特征矩阵中像素值的最大值,MinValue为每个中文字的像素值特征矩阵中像素值的最小值,x为归一化前的像素值,y为归一化后的像素值;将每个中文字的归一化像素值特征矩阵中的像素值划分为两类像素值,基于所述两类像素值建立每个中文字的二值化像素值特征矩阵,将每个中文字的二值化像素特征矩阵组合作为规范中文字训练样本。3.根据权利要求1所述的手写模型训练方法,其特征在于,所述采用所述规范中文字训练样本训练双向长短时记忆神经网络,获取双向长短时记忆神经网络的前向输出,根据双向长短时记忆神经网络的前向输出,采用基于随机梯度下降的时间相关反向传播算法更新双向长短时记忆神经网络的网络参数,获取规范中文字识别模型,包括:将所述规范中文字训练样本按序列正向输入到双向长短时记忆神经网络中,获取正向输出Fo,将所述规范中文字训练样本按序列反向输入到双向长短时记忆神经网络中,获取反向输出Bo,将所述正向输出和所述反向输出相加,获取前向输出To,公式表示为To=Fo+Bo;根据所述前向输出和真实结果构建误差函数,所述误差函数的表达式为其中,N表示训练样本总数,xi表示第i个训练样本的前向输出,yi表示与xi相对应的第i个训练样本的真实结果;根据所述误差函数,采用基于随机梯度下降的时间相关反向传播算法更新双向长短时记忆神经网络的网络参数,获取规范中文字识别模型,其中,隐藏层输出的梯度为神经元状态的梯度为输入门的梯度为遗忘门的梯度为输出门的梯度为隐藏层状态的梯度为4.根据权利要求1所述的手写模型训练方法,其特征在于,所述采用调整中文手写字识别模型识别待测试中文字样本,获取识别结果与真实结果不符的出错字,把所有所述出错字作为出错字训练样本,包括:将待测试中文字样本输入到调整中文手写字识别模型,获取所述待测试中...
【专利技术属性】
技术研发人员:黄春岑,周罡,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。