手写汉字图像识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：19778960 阅读：17 留言：0更新日期：2018-12-15 11:32

本发明专利技术公开一种手写汉字图像识别方法、装置、计算机设备及存储介质，该手写汉字图像识别方法包括：获取原始图像，所述原始图像包括手写汉字和背景图片；对所述原始图像进行预处理，获取有效图像；采用核密度估计算法对所述有效图像进行处理，去除背景图片，获取包括所述手写汉字的目标图像；采用垂直投影法对所述目标图像进行单字体切割，获取待识别单字体图像；对所述待识别单字体图像进行顺序标注，并将标注好的待识别单字体图像输入到基于长短时记忆神经网络的目标手写字识别模型中进行识别，获取待识别单字体图像对应的手写汉字。该手写字图像识别过程可有效识别相似以及结构复杂的汉字，提高手写字图像的识别准确率。

全部详细技术资料下载

【技术实现步骤摘要】
手写汉字图像识别方法、装置、计算机设备及存储介质
本专利技术涉及图像识别领域，尤其涉及一种手写汉字图像识别方法、装置、计算机设备及存储介质。
技术介绍
由于汉字的类别繁多，比如“宋体、楷体、姚体和仿宋”。其中，一些汉字的结构比较复杂，比如“魑、魅”，并且汉字中存在着较多的结构相似的字，比如“受和爱”。对标准的、书写简单且规范的句子，采用OCR(光学字符识别)技术可以识别，但是对于手写的字组成的句子，由于每个人的书写习惯不相同且不是标准的横竖撇捺组成的汉字，采用OCR技术识别时，会存在识别不准确的情况，对于一些相似的且不是由简单的笔画组成的汉字，会出现识别准确率降低的情况，影响手写汉字的识别效果。
技术实现思路
基于此，有必要针对上述技术问题，提供一种手写汉字图像识别方法、装置、计算机设备及存储介质。一种手写汉字图像识别方法，包括：获取原始图像，所述原始图像包括手写汉字和背景图片；对所述原始图像进行预处理，获取有效图像；采用核密度估计算法和对所述有效图像进行处理，去除所述背景图片，获取包括所述手写汉字的目标图像；采用垂直投影法对所述目标图像进行单字体切割，获取待识别单字体图像；将所述待识别单字体图像输入到基于长短时记忆神经网络的目标手写字识别模型中进行识别，获取待识别单字体图像对应的手写汉字。一种手写汉字图像识别装置，包括：原始图像获取模块，用于获取原始图像，所述原始图像包括手写汉字和背景图片；有效图像获取模块，用于对所述原始图像进行预处理，获取有效图像；目标图像获取模块，用于采用核密度估计算法对所述有效图像进行处理，获取保留所述手写汉字的目标图像；待识别单字体...

【技术保护点】
1.一种手写汉字图像识别方法，其特征在于，包括：获取原始图像，所述原始图像包括手写汉字和背景图片；对所述原始图像进行预处理，获取有效图像；采用核密度估计算法和对所述有效图像进行处理，去除所述背景图片，获取包括所述手写汉字的目标图像；采用垂直投影法对所述目标图像进行单字体切割，获取待识别单字体图像；将所述待识别单字体图像输入到基于长短时记忆神经网络的目标手写字识别模型中进行识别，获取待识别单字体图像对应的手写汉字。

【技术特征摘要】
1.一种手写汉字图像识别方法，其特征在于，包括：获取原始图像，所述原始图像包括手写汉字和背景图片；对所述原始图像进行预处理，获取有效图像；采用核密度估计算法和对所述有效图像进行处理，去除所述背景图片，获取包括所述手写汉字的目标图像；采用垂直投影法对所述目标图像进行单字体切割，获取待识别单字体图像；将所述待识别单字体图像输入到基于长短时记忆神经网络的目标手写字识别模型中进行识别，获取待识别单字体图像对应的手写汉字。2.如权利要求1所述的手写汉字图像识别方法，其特征在于，对所述原始图像进行预处理，获取有效图像，包括：对所述原始图像进行放大和灰度化处理，获取灰度化图像；对所述灰度化图像进行标准化处理，获取所述有效图像，其中，所述标准化处理的公式为X是所述灰度化图像M的像素值，X′是所述有效图像的像素值，Mmin是灰度化图像M中最小的像素值，Mmax是灰度化图像M中最大的像素值。3.如权利要求1所述的手写汉字图像识别方法，其特征在于，所述采用核密度估计算法和对所述有效图像进行处理，去除所述背景图片，获取包括所述手写汉字的目标图像，包括：对所述有效图像中的像素值进行统计，获取有效图像直方图；采用高斯核密度估算方法对所述有效图像直方图进行处理，获取与有效图像直方图对应的至少一个频率极大值和至少一个频率极小值；基于所述频率极大值和频率极小值对所述有效图像进行分层切分处理，获取分层图像；基于所述分层图像，获取包括所述手写汉字的目标图像。4.如权利要求3所述的手写汉字图像识别方法，其特征在于，所述基于所述分层图像，获取包括所述手写汉字的目标图像，包括：对所述分层图像进行二值化处理，获取二值化图像；对所述二值化图像中的像素进行检测标记，获取所述二值化图像对应的连通区域；对所述二值化图像对应的连通区域进行腐蚀和叠加处理，获取所述包括手写汉字的目标图像。5.如权利要求1所述的手写汉字图像识别方法，其特征在于，所述手写字样本获取方法还包括：预先训练所述目标手写字识别模型；所述预先训练目标手写字识别模型，包括：获取训练手写汉字图像；采用垂直投影法对所述训练手写汉字图像进行单字体切割，获取训练单字体图像；对所述训练单字体图像进行顺序标注，并将标注好的训练单字体图像输入到长短时记忆神经网络中进行训练，采用随机梯度下降算法对所述长短时记忆神经网络的网络参数进行更新，获取所述目标手写字识别模型。6.如权利要求5所述的手写汉字图像识别方法，其特征在于，所述将标注好的训练单字体图像输入到长短时记忆...

【专利技术属性】
技术研发人员：高梁梁，周罡，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人