手写文字识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号:33554148 阅读:14 留言:0更新日期:2022-05-26 22:50
本公开涉及一种手写文字识别方法、装置、存储介质及电子设备,包括:获取待识别手写文字;将所述待识别手写文字输入到文字识别模型,得到所述文字识别模型对所述待识别书写文字进行连笔书写预测的识别结果,其中,所述文字识别模型是根据样本文字的笔点特征以及所述样本文字中每两个笔画之间的连笔概率训练得到的;将所述识别结果进行展示。文字识别模型是根据样本文字的笔点特征以及样本文字中每两个笔画之间的连笔概率训练得到的,进而通过对待识别书写文字进行连笔书写预测可以提高手写文字识别的准确性。高手写文字识别的准确性。高手写文字识别的准确性。

【技术实现步骤摘要】
手写文字识别方法、装置、存储介质及电子设备


[0001]本公开涉及文字识别
,具体地,涉及一种手写文字识别方法、装置、存储介质及电子设备。

技术介绍

[0002]在线识别手写文字时,不仅需要快速识别还需要准确识别,然而由于每个人书写习惯的不同,手写的连笔情况以及手写笔画顺序存在差异,仅仅依赖训练样本训练得到识别模型,进而根据识别模型识别文字导致准确性较低。并且,通常在手写完成后对手写文字进行识别,导致手写文字识别速度较慢。

技术实现思路

[0003]本公开的目的是提供一种手写文字识别方法、装置、存储介质及电子设备,以至少部分地解决上述技术问题。
[0004]为了实现上述目的,本公开第一方面,提供一种手写文字识别方法,所述方法包括:
[0005]获取待识别手写文字;
[0006]将所述待识别手写文字输入到文字识别模型,得到所述文字识别模型对所述待识别书写文字进行连笔书写预测的识别结果,其中,所述文字识别模型是根据样本文字的笔点特征以及所述样本文字中每两个笔画之间的连笔概率训练得到的;
[0007]将所述识别结果进行展示。
[0008]可选地,所述笔点特征是通过以下方式确定的:
[0009]对降采样后的样本文字进行坐标归一化,得到备用样本文字;
[0010]根据所述备用样本文字中每一笔点的采集时间戳、笔点类型以及笔点坐标,确定各所述笔点的笔点特征;
[0011]其中,所述笔点类型包括起笔点、行笔点和收笔点。
[0012]可选地,所述连笔概率是通过以下方式确定的:
[0013]从所述备用样本文字的每一笔画的笔点中确定对应该笔画的目标笔点;
[0014]根据各所述笔画的目标笔点的笔点特征确定所述备用样本文字中每两个笔画的连笔概率。
[0015]可选地,所述根据各所述笔画的目标笔点的笔点特征确定所述备用样本文字中每两个笔画的连笔概率,包括:
[0016]根据每一笔点的采集时间戳确定所述备用样本文字中每两个笔画中的先写笔画以及后写笔画;
[0017]根据所述先写笔画的收笔点的笔点坐标以及所述后写笔画的起笔点的笔点坐标,确定所述每两个笔画的起收笔点距离,所述目标笔点包括所述收笔点以及所述起笔点;
[0018]基于最小二乘法,根据所述先写笔画的收笔点的笔点特征以及所述收笔点之前的
多个行笔点的笔点特征拟合得到第一直线,并根据所述后写笔画的起笔点的笔点特征以及所述起笔点之后的多个行笔点的笔点特征拟合得到第二直线,所述目标笔点包括所述收笔点之前的多个行笔点以及所述起笔点之后的多个行笔点;
[0019]根据所述第一直线以及所述第二直线得到所述每两个笔画的直线夹角;
[0020]根据所述每两个笔画的起收笔点距离与距离阈值之间的大小关系,以及所述每两个笔画的直线夹角与预设角度阈值的大小关系,确定所述备用样本文字中所述每两个笔画的连笔概率;
[0021]其中,所述距离阈值是根据所述样本文字的文字宽度确定的。
[0022]可选地,所述根据所述每两个笔画的起收笔点距离与距离阈值之间的大小关系,以及所述每两个笔画的直线夹角与预设角度阈值的大小关系,确定所述备用样本文字中所述每两个笔画的连笔概率,包括:
[0023]在所述起收笔点距离小于所述距离阈值,和/或,所述直线夹角小于所述预设角度阈值的情况下,将预设连笔概率作为所述两个笔画的连笔概率;
[0024]在所述起收笔点距离大于等于所述距离阈值,且所述直线夹角大于等于所述预设角度阈值的情况下,确定所述两个笔画的连笔概率为0。
[0025]可选地,所述样本文字的降采样包括:
[0026]针对所述样本文字中的每一笔画,确定相邻行笔点坐标的欧式距离;
[0027]将欧式距离小于距离阈值的行笔点剔除,得到有效行笔点;
[0028]根据所述有效行笔点、该笔画的起笔点以及收笔点,得到降采样后的样本文字。
[0029]可选地,所述对降采样后的样本文字进行坐标归一化,得到备用样本文字,包括:
[0030]根据降采样后的样本文字中各笔点的笔点坐标,计算所述笔点坐标的均值和方差;
[0031]根据所述均值以及所述方差,对降采样后的样本文字进行坐标归一化,得到所述备用样本文字。
[0032]可选地,所述文字识别模型是通过如下方式训练得到的:
[0033]将所述样本文字的笔点特征输入到双向神经网络层中,所述双向神经网络层的第1层神经网络层中的隐含层的维度为96维,第2层神经网络层中的隐含层的维度为64维;
[0034]将所述双向神经网络层的输出作为均值池化层的输入,得到维度降低的笔点特征;
[0035]按照预设随机概率将所述每两个笔画之间的连接概率置0;
[0036]根据所述维度降低的笔点特征以及随机置0后的连接概率,通过全连接层中26维的编码层进行编码;
[0037]将编码后的笔点特征输入到分类模型中进行分类,得到所述全连接层输出的文字参数量,直到所述文字参数量满足预设文字分类的参数量,训练得到所述文字识别模型。
[0038]本公开第二方面,提供一种手写文字识别装置,所述装置包括:
[0039]获取模块,被配置为用于获取待识别手写文字;
[0040]输入模块,被配置为用于将所述待识别手写文字输入到文字识别模型,得到所述文字识别模型对所述待识别书写文字进行连笔书写预测的识别结果,其中,所述文字识别模型是根据样本文字的笔点特征以及所述样本文字中每两个笔画之间的连笔概率训练得
到的;
[0041]展示模块,被配置为用于将所述识别结果进行展示。
[0042]可选地,所述装置还包括:
[0043]降采样模块,被配置为用于对降采样后的样本文字进行坐标归一化,得到备用样本文字;
[0044]第一确定模块,被配置为用于根据所述备用样本文字中每一笔点的采集时间戳、笔点类型以及笔点坐标,确定各所述笔点的笔点特征;
[0045]其中,所述笔点类型包括起笔点、行笔点和收笔点。
[0046]可选地,所述装置还包括:
[0047]第二确定模块,被配置为用于从所述备用样本文字的每一笔画的笔点中确定对应该笔画的目标笔点;
[0048]概率确定模块,被配置为用于根据各所述笔画的目标笔点的笔点特征确定所述备用样本文字中每两个笔画的连笔概率。
[0049]可选地,所述概率确定模块,包括:
[0050]第一确定子模块,被配置为用于根据每一笔点的采集时间戳确定所述备用样本文字中每两个笔画中的先写笔画以及后写笔画;
[0051]距离确定子模块,被配置为用于根据所述先写笔画的收笔点的笔点坐标以及所述后写笔画的起笔点的笔点坐标,确定所述每两个笔画的起收笔点距离,所述目标笔点包括所述收笔点以及所述起笔点;
[0052]直线拟合子模块,被配置为用于基于最小二乘法,根据所述先写笔画的收笔本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种手写文字识别方法,其特征在于,包括:获取待识别手写文字;将所述待识别手写文字输入到文字识别模型,得到所述文字识别模型对所述待识别书写文字进行连笔书写预测的识别结果,其中,所述文字识别模型是根据样本文字的笔点特征以及所述样本文字中每两个笔画之间的连笔概率训练得到的;将所述识别结果进行展示。2.根据权利要求1所述的方法,其特征在于,所述笔点特征是通过以下方式确定的:对降采样后的样本文字进行坐标归一化,得到备用样本文字;根据所述备用样本文字中每一笔点的采集时间戳、笔点类型以及笔点坐标,确定各所述笔点的笔点特征;其中,所述笔点类型包括起笔点、行笔点和收笔点。3.根据权利要求2所述的方法,其特征在于,所述连笔概率是通过以下方式确定的:从所述备用样本文字的每一笔画的笔点中确定对应该笔画的目标笔点;根据各所述笔画的目标笔点的笔点特征确定所述备用样本文字中每两个笔画的连笔概率。4.根据权利要求3所述的方法,其特征在于,所述根据各所述笔画的目标笔点的笔点特征确定所述备用样本文字中每两个笔画的连笔概率,包括:根据每一笔点的采集时间戳确定所述备用样本文字中每两个笔画中的先写笔画以及后写笔画;根据所述先写笔画的收笔点的笔点坐标以及所述后写笔画的起笔点的笔点坐标,确定所述每两个笔画的起收笔点距离,所述目标笔点包括所述收笔点以及所述起笔点;基于最小二乘法,根据所述先写笔画的收笔点的笔点特征以及所述收笔点之前的多个行笔点的笔点特征拟合得到第一直线,并根据所述后写笔画的起笔点的笔点特征以及所述起笔点之后的多个行笔点的笔点特征拟合得到第二直线,所述目标笔点包括所述收笔点之前的多个行笔点以及所述起笔点之后的多个行笔点;根据所述第一直线以及所述第二直线得到所述每两个笔画的直线夹角;根据所述每两个笔画的起收笔点距离与距离阈值之间的大小关系,以及所述每两个笔画的直线夹角与预设角度阈值的大小关系,确定所述备用样本文字中所述每两个笔画的连笔概率;其中,所述距离阈值是根据所述样本文字的文字宽度确定的。5.根据权利要求4所述的方法,其特征在于,所述根据所述每两个笔画的起收笔点距离与距离阈值之间的大小关系,以及所述每两个笔画的直线夹角与预设角度阈值的大小关系,确定所述备用样本文字中所述每两个笔画的连笔概率,包括:在所述起收笔点距离小于所述距离阈值,和/或,所述直线夹角小于所述预设角度阈值的情况下,将预设连笔概率作为所述两个笔画的连笔概率;在所述起...

【专利技术属性】
技术研发人员:麻凯利马志国张飞飞
申请(专利权)人:北京鼎事兴教育咨询有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1