中文模型训练、中文图像识别方法、装置、设备及介质制造方法及图纸

技术编号:19935180 阅读:22 留言:0更新日期:2018-12-29 04:53
本发明专利技术公开一种中文模型训练、中文图像识别方法、装置、设备及介质,该中文模型训练方法包括:获取训练手写中文图像;将训练手写中文图像按预设比例划分成训练集和测试集;对训练集中的训练手写中文图像进行顺序标注,并将标注好的训练手写中文图像输入到卷积神经网络‑长短时记忆神经网络中进行训练,采用时序分类算法对卷积神经网络‑长短时记忆神经网络的网络参数进行更新,获取原始手写字识别模型;采用测试集中的训练手写中文图像对原始手写字识别模型进行测试,在测试准确率大于预设准确率时,获取目标手写字识别模型。该中文模型训练方法具有训练效率高且识别精度高的优点。

【技术实现步骤摘要】
中文模型训练、中文图像识别方法、装置、设备及介质
本专利技术涉及图像识别领域,尤其涉及一种中文模型训练、中文图像识别方法、装置、设备及介质。
技术介绍
随着信息时代的发展,人工智能技术作为核心技术越来越多的被用来解决人们生活中的具体问题。目前,在对手写汉字图像进行识别时,由于传统的卷积神经网络或者循环神经网络的输出是固定长度的,并不能满足端到端的手写字识别,需要预先对训练图片中的文字进行定位分割,获取单个字体图像,再对单个字体图像进行训练,训练效率低。
技术实现思路
基于此,有必要针对上述技术问题,提供一种解决目前手写字识别模型的训练效率低的中文模型训练方法、装置、设备及介质。一种中文模型训练方法,包括:获取训练手写中文图像;将所述训练手写中文图像按预设比例划分成训练集和测试集;对所述训练集中的训练手写中文图像进行顺序标注,并将标注好的训练手写中文图像输入到卷积神经网络-长短时记忆神经网络中进行训练,采用时序分类算法对所述卷积神经网络-长短时记忆神经网络的网络参数进行更新,获取原始手写字识别模型;采用所述测试集中的训练手写中文图像对所述原始手写字识别模型进行测试,在测试准确率大于预设准确率时,获取目标手写字识别模型。一种中文模型训练装置,包括:训练手写中文图像获取模块,用于获取训练手写中文图像;训练手写中文图像划分模块,用于将所述训练手写中文图像按预设比例划分成训练集和测试集;原始手写字识别模型获取模块,用于对所述训练集中的训练手写中文图像进行顺序标注,并将标注好的训练手写中文图像输入到卷积神经网络-长短时记忆神经网络中进行训练,采用时序分类算法对所述卷积神经网络-长短时记忆神经网络的网络参数进行更新,获取原始手写字识别模型;目标手写字识别模型获取模块,用于采用所述测试集中的训练手写中文图像对所述原始手写字识别模型进行测试,在测试准确率大于预设准确率时,获取目标手写字识别模型。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述中文模型训练方法的步骤。一种非易失性存储介质,所述非易失性存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述中文模型训练方法的步骤。基于此,有必要针对上述技术问题,提供一种解决目前手写字识别不能端到端输出的中文图像识别方法、装置、设备及介质。一种中文图像识别方法,包括:获取待识别中文图像,所述待识别中文图像包括手写汉字和背景图片;对所述待识别中文图像进行预处理,获取原始图像;采用核密度估计算法对所述原始图像进行处理,去除所述背景图片,获取包括所述手写汉字的目标图像;采用文字定位技术对所述目标图像进行文字定位,获取待识别文字区域;将待识别文字区域输入到目标手写字识别模型中进行识别,获取每一所述待识别文字区域对应的手写汉字;其中,目标手写字识别模型是采用所述中文模型训练方法获取的。一种中文图像识别装置,包括:待识别中文图像获取模块,用于获取待识别中文图像,所述待识别中文图像包括手写汉字和背景图片;原始图像获取模块,用于对所述待识别中文图像进行预处理,获取原始图像;目标图像获取模块,用于采用核密度估计算法对所述原始图像进行处理,去除背景图片,获取包括所述手写汉字的目标图像;待识别文字区域获取模块,用于采用文字定位技术对所述目标图像进行文字定位,获取待识别文字区域;手写汉字获取模块,用于将待识别文字区域输入到目标手写字识别模型中进行识别,获取每一所述待识别文字区域对应的手写汉字;其中,目标手写字识别模型是采用所述中文模型训练方法获取的。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述中文图像识别方法的步骤。一种非易失性存储介质,所述非易失性存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述中文图像识别方法的步骤。上述中文模型训练方法、装置、设备及介质,先获取训练手写中文图像并按预设比例将训练手写中文图像划分成训练集和测试集,以便对训练集中的训练手写中文图像进行顺序标注,以使训练手写中文图像具备时序性。将标注好的训练手写中文图像输入到卷积神经网络-长短时记忆神经网络中进行训练,采用时序分类算法对卷积神经网络-长短时记忆神经网络的网络参数进行更新,获取原始手写字识别模型,以使模型的输出更加准确。最后,采用测试集中的训练手写中文图像对原始手写字识别模型进行测试,在测试准确率大于预设准确率时,获取目标手写字识别模型,进一步提高了目标手写字识别模型的准确率。上述中文图像识别方法、装置、设备及介质,服务器获取待识别中文图像,并对待识别中文图像进行预处理,以获取排除干扰因素的原始图像。采用核密度估计算法对原始图像进行处理,去除背景图片,获取只包含手写汉字的目标图像,进一步排除干扰。采用文字定位技术对所述目标图像进行文字定位,获取待识别文字区域,排除干扰。服务器将待识别文字区域输入到目标手写字识别模型中进行识别,使得目标手写字识别模型能够联系上下文进行识别,获取每一待识别文字区域对应的手写汉字,实现端到端的输出,提高识别的准确率。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例中中文模型训练方法或中文图像识别方法的一应用场景图;图2是本专利技术一实施例中中文模型训练方法的一流程图;图3是图2中步骤S13的一具体流程图;图4是本专利技术一实施例中中文模型训练装置的一示意图;图5是本专利技术一实施例中中文图像识别方法的一流程图;图6是图5中步骤S22的一具体流程图;图7是图5中步骤S23的一具体流程图;图8是图7中步骤S234的一具体流程图;图9是本专利技术一实施例中中文图像识别装置的一示意图;图10是本专利技术一实施例中计算机设备的一示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供的中文模型训练方法,可应用在如图1的应用环境中。该中文模型训练方法的应用环境包括服务器和计算机设备,其中,计算机设备通过网络与服务器进行通信,计算机设备是可与用户进行人机交互的设备,包括但不限于电脑、智能手机和平板等设备。本专利技术实施例提供的中文模型训练方法应用于服务器。在一实施例中,如图2所示,提供一种中文模型训练方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:S11:获取训练手写中文图像。其中,训练手写中文图像是预先从开源库中采集的用于进行模型训练的样本图像。该训练手写中文图像包括中文二级字库中每一中文对应的N(N为正整数)张手写字样本。中文二级字库是按汉字的部首笔划顺序编码的非常用汉字库。具体地,采集开源库中的不同人手写的N张手写字样本,以使服务器获取训练手写中文图像,由于不同用户的本文档来自技高网...

【技术保护点】
1.一种中文模型训练方法,其特征在于,包括:获取训练手写中文图像;将所述训练手写中文图像按预设比例划分成训练集和测试集;对所述训练集中的训练手写中文图像进行顺序标注,并将标注好的训练手写中文图像输入到卷积神经网络‑长短时记忆神经网络中进行训练,采用时序分类算法对所述卷积神经网络‑长短时记忆神经网络的网络参数进行更新,获取原始手写字识别模型;采用所述测试集中的训练手写中文图像对所述原始手写字识别模型进行测试,在测试准确率大于预设准确率时,获取目标手写字识别模型。

【技术特征摘要】
1.一种中文模型训练方法,其特征在于,包括:获取训练手写中文图像;将所述训练手写中文图像按预设比例划分成训练集和测试集;对所述训练集中的训练手写中文图像进行顺序标注,并将标注好的训练手写中文图像输入到卷积神经网络-长短时记忆神经网络中进行训练,采用时序分类算法对所述卷积神经网络-长短时记忆神经网络的网络参数进行更新,获取原始手写字识别模型;采用所述测试集中的训练手写中文图像对所述原始手写字识别模型进行测试,在测试准确率大于预设准确率时,获取目标手写字识别模型。2.如权利要求1所述的中文模型训练方法,其特征在于,所述将标注好的训练手写中文图像输入到卷积神经网络-长短时记忆神经网络中进行训练,采用时序分类算法对所述卷积神经网络-长短时记忆神经网络的网络参数进行更新,获取原始手写字识别模型,包括:在卷积神经网络中对所述训练手写中文图像进行特征提取,获取中文图像特征;在长短时记忆神经网络的隐藏层采用第一激活函数对所述中文图像特征进行处理,获取携带激活状态标识的神经元;在所述长短时记忆神经网络的隐藏层采用第二激活函数对所述携带激活状态标识的神经元进行处理,获取长短时记忆神经网络输出层的输出;根据所述长短时记忆神经网络输出层的输出,采用时序分类算法对所述卷积神经网络-长短时记忆神经网络的网络参数进行更新,获取所述目标手写字识别模型。3.如权利要求2所述的中文模型训练方法,其特征在于,所述时序分类算法的公式具体为:Eloss=-ln∏(x,z)∈Sp(z|x),p(z|x)=a(t,u)b(t,u),其中,p(z|x)表示输入所述中文图像特征x,在所述长短时记忆神经网络输出层的输出为z的概率,a(t,u)表示第t时刻第u个顺序标签对应的所述中文图像特征在长短时记忆神经网络隐藏层的前向输出,b(t,u)表示第t时刻第u个顺序标签对应的所述中文图像特征在长短时记忆神经网络隐藏层的后向输出。4.一种中文图像识别方法,其特征在于,包括获取待识别中文图像,所述待识别中文图像包括手写汉字和背景图片;对所述待识别中文图像进行预处理,获取原始图像;采用核密度估计算法对所述原始图像进行处理,去除所述背景图片,获取包括所述手写汉字的目标图像;采用文字定位技术对所述目标图像进行文字定位,获取待识别文字区域;将待识别文字区域输入到目标手写字识别模型中进行识别,获取每一所述待识别文字区域对应的手写汉字;其中,目标手写字识别模型是采用权利要求1-3任意一项所述中文模型训练方法获取的。5.如权利要求4所述的中文图像识别方法,其特征在于,采用核密度估计算法对所述原始图像进行处理,获取保留所述手写汉字的目标图像,包括:对所述原始图像中的像...

【专利技术属性】
技术研发人员:高梁梁周罡
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1