【技术实现步骤摘要】
基于深度学习的手写中文字体识别方法
[0001]本申请涉及图像识别
,特别涉及基于深度学习的手写中文字体识别方法。
技术介绍
[0002]手写汉字是大多数国内人员每天都会接触到的,很多相关行业的从业人员需要通过手写汉字的方式进行文件签署、信息记录等,而在手写完成后通常还需要通过扫描的方式将纸质的文件转换为电子文件,以方便保存和查阅。
[0003]一般地,电子文件需要对其内容进行识别,以方便复制,例如采用手写的方式记录会议内容后需要尽快将其转换为电子文件,且对电子文件中的手写汉字进行识别以转换为正确的打印文字,以方便更多的人阅读和理解,因此需要采用到手写汉字的识别技术。目前,很多手写汉字的识别技术都采用神经网络,通过具有大量手写文字的训练集对神经网络进行训练后,采用训练完成的神经网络对待识别的手写汉字进行识别,确定手写汉字对应的打印文字,例如CN114581922A和CN111652332A。然而,这些现有的识别技术都是对手写汉字进行整体的识别,并根据识别的相似概率进行结果的推送,由于手写汉字在不同人书写时差异极 ...
【技术保护点】
【技术特征摘要】
1.基于深度学习的手写中文字体识别方法,其特征在于,包括:建立笔画识别模型;采用训练集对所述笔画识别模型进行训练;利用训练完成的笔画识别模型对待识别的手写中文进行笔画识别,获得相应的笔画以及笔画顺序;将识别得到的笔画与对比库中的打印文字的笔画进行对比,确定匹配的候选打印文字;将识别得到的笔画顺序和所述候选打印文字的笔画顺序进行对比,确定最终的识别结果。2.根据权利要求1所述的基于深度学习的手写中文字体识别方法,其特征在于,所述笔画识别模型采用卷积神经网络,所述采用训练集对所述笔画识别模型进行训练包括:获取手写中文训练图像;对所述手写中文训练图像对应的打印文字进行标注;将带有标注的所述手写中文训练图像输入所述卷积神经网络,输出相应的训练识别结果;根据所述标注和训练识别结果的误差对所述卷积神经网络的参数进行调整,并再次将带有标注的所述手写中文训练图像输入调整后的所述卷积神经网络,直到达到设定的训练次数,获得训练完成的笔画识别模型。3.根据权利要求2所述的基于深度学习的手写中文字体识别方法,其特征在于,所述手写中文训练图像包括背景图像和叠加在所述背景图像上的前景手写文字,所述获取手写中文训练图像包括:获取多组手写中文图像和多个背景图像;提取所述手写中文图像中的手写中文,获得所述前景手写文字;将所述前景手写文字和背景图像进行组合,并将组合中的所述前景手写文字叠加在所述背景图像中,获得所述手写中文训练图像。4.根据权利要求1所述的基于深度学习的手写中文字体识别方法,其特征在于,所述利用训练完成的笔画识别模型对待识别的手写中文进行笔画识别,获得相应的笔画以及笔画顺序,包括:将所述手写中文中独立的区域进行拆分,获得多个笔画区域;对每个所述笔画区域按照笔画趋势进行拆分,获得多个笔画;记录各个笔画的位置关系;按照设定的方向以及各个笔画的位置关系对所述笔画进行排序,获得所述笔画顺序。5.根据权利要求4所述的基于深...
【专利技术属性】
技术研发人员:孙世芳,
申请(专利权)人:宁波极科信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。