手写汉字图像识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:19778960 阅读:17 留言:0更新日期:2018-12-15 11:32
本发明专利技术公开一种手写汉字图像识别方法、装置、计算机设备及存储介质,该手写汉字图像识别方法包括:获取原始图像,所述原始图像包括手写汉字和背景图片;对所述原始图像进行预处理,获取有效图像;采用核密度估计算法对所述有效图像进行处理,去除背景图片,获取包括所述手写汉字的目标图像;采用垂直投影法对所述目标图像进行单字体切割,获取待识别单字体图像;对所述待识别单字体图像进行顺序标注,并将标注好的待识别单字体图像输入到基于长短时记忆神经网络的目标手写字识别模型中进行识别,获取待识别单字体图像对应的手写汉字。该手写字图像识别过程可有效识别相似以及结构复杂的汉字,提高手写字图像的识别准确率。

【技术实现步骤摘要】
手写汉字图像识别方法、装置、计算机设备及存储介质
本专利技术涉及图像识别领域,尤其涉及一种手写汉字图像识别方法、装置、计算机设备及存储介质。
技术介绍
由于汉字的类别繁多,比如“宋体、楷体、姚体和仿宋”。其中,一些汉字的结构比较复杂,比如“魑、魅”,并且汉字中存在着较多的结构相似的字,比如“受和爱”。对标准的、书写简单且规范的句子,采用OCR(光学字符识别)技术可以识别,但是对于手写的字组成的句子,由于每个人的书写习惯不相同且不是标准的横竖撇捺组成的汉字,采用OCR技术识别时,会存在识别不准确的情况,对于一些相似的且不是由简单的笔画组成的汉字,会出现识别准确率降低的情况,影响手写汉字的识别效果。
技术实现思路
基于此,有必要针对上述技术问题,提供一种手写汉字图像识别方法、装置、计算机设备及存储介质。一种手写汉字图像识别方法,包括:获取原始图像,所述原始图像包括手写汉字和背景图片;对所述原始图像进行预处理,获取有效图像;采用核密度估计算法和对所述有效图像进行处理,去除所述背景图片,获取包括所述手写汉字的目标图像;采用垂直投影法对所述目标图像进行单字体切割,获取待识别单字体图像;将所述待识别单字体图像输入到基于长短时记忆神经网络的目标手写字识别模型中进行识别,获取待识别单字体图像对应的手写汉字。一种手写汉字图像识别装置,包括:原始图像获取模块,用于获取原始图像,所述原始图像包括手写汉字和背景图片;有效图像获取模块,用于对所述原始图像进行预处理,获取有效图像;目标图像获取模块,用于采用核密度估计算法对所述有效图像进行处理,获取保留所述手写汉字的目标图像;待识别单字体图像获取模块,用于采用核密度估计算法和对所述有效图像进行处理,去除所述背景图片,获取包括所述手写汉字的目标图像;手写汉字获取模块,用于将所述待识别单字体图像输入到基于长短时记忆神经网络的目标手写字识别模型中进行识别,获取待识别单字体图像对应的手写汉字。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述手写汉字图像识别方法的步骤。一种非易失性存储介质,所述非易失性存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述手写汉字图像识别方法的步骤。上述手写汉字图像识别方法、装置、计算机设备及存储介质,先获取原始图像,以便对原始图像进行预处理,获取有效图像。采用核密度估计算法对有效图像进行处理,去除背景图片,获取只包含手写汉字的图像,进一步排除干扰。采用垂直投影法对目标图像进行单字体切割,获取待识别单字体图像,容易实现。然后,将待识别单字体图像输入到基于长短时记忆神经网络的目标手写字识别模型中进行识别,以使单字体图像具备时序性,使得目标手写字识别模型能够联系上下文进行识别,获取待识别单字体图像对应的手写汉字,提高了手写字图像的识别准确。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例中手写汉字图像识别方法的一应用场景图;图2是本专利技术一实施例中手写汉字图像识别方法的一流程图;图3是图2中步骤S20的一具体流程图;图4是图2中步骤S30的一具体流程图;图5是图4中步骤S34的一具体流程图;图6是本专利技术一实施例中手写汉字图像识别方法的另一流程图;图7是图6中步骤S63的一具体流程图;图8是本专利技术一实施例中手写汉字图像识别装置的一示意图;图9是本专利技术一实施例中计算机设备的一示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供的手写汉字图像识别方法,可应用在如图1的应用环境中。该手写汉字图像识别方法的应用环境包括服务器和计算机设备,其中,计算机设备通过网络与服务器进行通信,计算机设备是可与用户进行人机交互的设备,包括但不限于电脑、智能手机和平板等设备。本专利技术实施例提供的手写汉字图像识别方法应用于服务器。在一实施例中,如图2所示,提供一种手写汉字图像识别方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:S10:获取原始图像,原始图像包括手写汉字和背景图片。其中,原始图像是由计算机设备上的采集模块采集到的未经处理的包含手写汉字的图像。该原始图像包括手写汉字和背景图片。背景图片是原始图像中除手写汉字之外的噪声图片。噪声图片是对手写汉字造成干扰的图片。本实施例中,用户可通过计算机设备上的采集模块采集包含手写汉字的原始图像上传到服务器,以使服务器获取原始图像。该采集模块包括但不限于相机拍摄和本地上传。S20:对原始图像进行预处理,获取有效图像。其中,有效图像是对原始图像进行预处理后得到的排除干扰因素的图像。具体地,由于原始图像中可能包含多种干扰因素,如色彩繁多,不利于后续的识别。因此需要对原始图像进行预处理,以获取排除干扰因素的有效图像,该有效图像可以理解为原始图像排除背景图片后获取的图片。在一实施例中,如图3所示,步骤S20中,即对原始图像进行预处理,获取有效图像,具体包括如下步骤:S21:对原始图像进行放大和灰度化处理,获取灰度化图像。其中,灰度化图像是对原始图像进行放大和灰度化处理后获取的灰度化图像。该灰度化图像包括一像素值矩阵。像素值矩阵是指包含原始图像中每个像素对应的像素值的矩阵。本实施例中,服务器采用imread函数读取原始图像中每个像素的像素值,并对原始图像进行放大和灰度化处理,获取灰度化图像。imread函数是计算机语言中的一个函数,用于读取图像文件中的像素值。像素值是原始图像被数字化时由计算机赋予的值。由于原始图像中可能包含多种颜色,而颜色本身,非常容易受到光照等因素的影响,同类的物体颜色有很多变化,所以颜色本身难以提供关键信息,因此需要对原始图像进行灰度化处理,以排除干扰,减少图像的复杂度和信息处理量。但由于原始图像中的手写汉字的尺寸较小时,若直接进行灰度化处理,会导致手写汉字的笔画的厚度过小,会被当成干扰项排除,因此为了增加文字笔画的厚度,需先将原始图像进行放大处理,再进行灰度化处理,以避免直接进行灰度化处理,导致手写汉字的笔画的厚度过小被当成干扰项排除的问题。具体地,服务器按照如下公式对原始图像进行放大处理:x→xr,其中,x代表矩阵M中的元素,r为次数,将变化后的元素xr替换像素值矩阵M中x。灰度化处理是将原始图像呈现出明显的黑白效果的处理。具体地,对放大后的图像进行灰度化处理包括:原始图像中的每个像素的颜色都是通过R(红)、G(绿)和B(蓝)三个分量决定的,而每个分量有0-255这256种值可取(0最暗表示黑色,255最亮表示白色)。而灰度化图像是R、G和B三个分量相同的一种特殊的彩色图像。本实施例中,服务器可直接采用imread函数读取原始图像,即可获取灰度化图像中每个像素对应的R、G本文档来自技高网...

【技术保护点】
1.一种手写汉字图像识别方法,其特征在于,包括:获取原始图像,所述原始图像包括手写汉字和背景图片;对所述原始图像进行预处理,获取有效图像;采用核密度估计算法和对所述有效图像进行处理,去除所述背景图片,获取包括所述手写汉字的目标图像;采用垂直投影法对所述目标图像进行单字体切割,获取待识别单字体图像;将所述待识别单字体图像输入到基于长短时记忆神经网络的目标手写字识别模型中进行识别,获取待识别单字体图像对应的手写汉字。

【技术特征摘要】
1.一种手写汉字图像识别方法,其特征在于,包括:获取原始图像,所述原始图像包括手写汉字和背景图片;对所述原始图像进行预处理,获取有效图像;采用核密度估计算法和对所述有效图像进行处理,去除所述背景图片,获取包括所述手写汉字的目标图像;采用垂直投影法对所述目标图像进行单字体切割,获取待识别单字体图像;将所述待识别单字体图像输入到基于长短时记忆神经网络的目标手写字识别模型中进行识别,获取待识别单字体图像对应的手写汉字。2.如权利要求1所述的手写汉字图像识别方法,其特征在于,对所述原始图像进行预处理,获取有效图像,包括:对所述原始图像进行放大和灰度化处理,获取灰度化图像;对所述灰度化图像进行标准化处理,获取所述有效图像,其中,所述标准化处理的公式为X是所述灰度化图像M的像素值,X′是所述有效图像的像素值,Mmin是灰度化图像M中最小的像素值,Mmax是灰度化图像M中最大的像素值。3.如权利要求1所述的手写汉字图像识别方法,其特征在于,所述采用核密度估计算法和对所述有效图像进行处理,去除所述背景图片,获取包括所述手写汉字的目标图像,包括:对所述有效图像中的像素值进行统计,获取有效图像直方图;采用高斯核密度估算方法对所述有效图像直方图进行处理,获取与有效图像直方图对应的至少一个频率极大值和至少一个频率极小值;基于所述频率极大值和频率极小值对所述有效图像进行分层切分处理,获取分层图像;基于所述分层图像,获取包括所述手写汉字的目标图像。4.如权利要求3所述的手写汉字图像识别方法,其特征在于,所述基于所述分层图像,获取包括所述手写汉字的目标图像,包括:对所述分层图像进行二值化处理,获取二值化图像;对所述二值化图像中的像素进行检测标记,获取所述二值化图像对应的连通区域;对所述二值化图像对应的连通区域进行腐蚀和叠加处理,获取所述包括手写汉字的目标图像。5.如权利要求1所述的手写汉字图像识别方法,其特征在于,所述手写字样本获取方法还包括:预先训练所述目标手写字识别模型;所述预先训练目标手写字识别模型,包括:获取训练手写汉字图像;采用垂直投影法对所述训练手写汉字图像进行单字体切割,获取训练单字体图像;对所述训练单字体图像进行顺序标注,并将标注好的训练单字体图像输入到长短时记忆神经网络中进行训练,采用随机梯度下降算法对所述长短时记忆神经网络的网络参数进行更新,获取所述目标手写字识别模型。6.如权利要求5所述的手写汉字图像识别方法,其特征在于,所述将标注好的训练单字体图像输入到长短时记忆...

【专利技术属性】
技术研发人员:高梁梁周罡
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1