手写识别方法及装置制造方法及图纸

技术编号:23459536 阅读:46 留言:0更新日期:2020-03-03 05:34
本发明专利技术公开了一种手写识别方法及装置,该方法包括:获取字符笔迹;获取对应所述字符笔迹所属语言类别的切分模型;利用所述切分模型对所述字符笔迹进行切分,得到切分块序列;对所述切分块序列进行识别,得到所述字符笔迹对应的字符串。利用本发明专利技术,可以在数据资源相对较少的情况下,也能够达到相对较高的识别准确率。

Handwritten recognition method and device

【技术实现步骤摘要】
手写识别方法及装置
本专利技术涉及手写识别领域,具体涉及一种手写识别方法及装置。
技术介绍
手写识别技术,是指将在手写设备上书写时产生的有序轨迹信息转化为文字内码的过程,实际上是手写轨迹的坐标序列到文字的内码的一个映射过程,是人机交互最自然、最方便的手段之一。随着智能手机、掌上电脑等智能终端的普及,手写识别技术也进入了规模应用时代。由于不同国家的语言具有不同的书写特点,因此,现有针对单一语种的手写识别技术不能很好地实现对其它语种手写文本的识别。为此,业内提出了一些针对多国语言进行手写识别的技术方案,比如基于LSTM(LongShort-TermMemory,长短期记忆网络)+CTC(ConnectionistTemporalClassification)的序列识别方法,基于规则的HMM(HiddenMarkovModel,隐马尔科夫模型)方法等。其中,LSTM方法需要大量数据训练才能得到较好的收敛结果,需要大量的计算资源和训练时间,才能取得较好的字准确率(词准确率会相应幅度降低更多);而基于HMM的方法虽然能够有效解决草书连笔问题,但是该方法在特征提取的过程非常困难,而特征提取又直接影响到最终模型效果。
技术实现思路
本专利技术实施例提供一种手写识别方法及装置,可以在数据资源相对较少的情况下,也能够达到相对较高的识别准确率。为此,本专利技术提供如下技术方案:一种手写识别方法,所述方法包括:获取字符笔迹;获取对应所述字符笔迹所属语言类别的切分模型;利用所述切分模型对所述字符笔迹进行切分,得到切分块序列;对所述切分块序列进行识别,得到所述字符笔迹对应的字符串。可选地,所述语言类别包括:连笔字符书写类语言和非连笔字符书写类语言。可选地,所述方法还包括:通过以下方式预先构建对应连笔字符书写类语言的切分模型:采集连笔笔迹数据作为训练样本,并标注所述训练样本的切分点;确定每个训练样本的特征信息;所述特征信息包括:所述训练样本的基线;所述基线为所述字符笔迹在Y轴或X轴投影坐标点数量最多的区间的均线;确定所述训练样本与其基线的交点,并将所述交点作为预估切分信息;利用所述预估切分信息及标注信息训练得到对应连笔字符书写类语言的切分模型。可选地,所述切分模型为回归模型或者卷积神经网络模型。可选地,所述方法还包括:在对所述切分块序列进行识别之前,判断所述字符笔迹对应的语言类别是否为易产生过切分的语言;如果是,则对所述切分块序列中的切分块进行组合处理;否则执行对所述切分块序列进行识别的步骤。可选地,所述对所述切分块序列中的切分块进行组合处理包括:提取各切分块的几何特征;利用预先构建的多元几何模型及相邻切分块的几何特征判断所述相邻切分块是否属于同一个字符;如果是,则将所述相邻切分块合并。可选地,所述方法还包括:通过以下方式预先构建所述多元几何模型:采集大量切分块数据作为训练样本,并对属于同一字符的切分块进行标注;提取所述训练样本的几何特征,所述几何特征包括以下任意一种或多种:各切分块的长度、宽度、位置;相邻切分块的距离、位置关系;各切分块的长度与平均长度的差值,各切分块的宽度与平均宽度的差值;利用所述几何特征及标注信息训练得到所述多元几何模型。可选地,所述多元几何模型为回归模型或分类模型。可选地,所述对所述切分块序列进行识别,得到所述字符笔迹对应的字符串包括:对所述切分块序列中的切分块进行识别,得到所述切分块对应的各字符;确定各候选路径;计算各候选路径的得分;选择最优候选路径;根据所述最优候选路径上的各字符得到所述字符笔迹对应的字符串。可选地,所述计算各候选路径的得分包括:计算所述候选路径上各字符的得分,并将所述候选路径上各字符的得分相加得到得分总和;将所述得分总和除以所述候选路径的长度,得到所述候选路径的得分。可选地,所述计算所述候选路径上各字符的得分包括:根据以下任意一项或多项计算所述候选路径上各字符的得分:所述字符的分类器得分、语言模型得分、词库得分。一种手写识别装置,所述装置包括:接收模块,用于获取字符笔迹;切分模型获取模块,用于获取所述字符笔迹所属语言类别的切分模型;切分模块,用于利用所述切分模型对所述字符串笔迹进行切分,得到切分块序列;识别模块,用于对所述切分模块得到的切分块序列进行识别,得到所述字符笔迹对应的字符串。可选地,所述语言类别包括:连笔字符书写类语言和非连笔字符书写类语言。可选地,所述装置还包括:用于预先构建切分模型的切分模型构建模块;用于构建对应连笔字符书写类语言的切分模型的切分模型构建模块包括:数据采集单元,用于采集连笔笔迹数据作为训练样本,并标注所述训练样本的切分点;特征信息确定单元,用于确定每个训练样本的特征信息;所述特征信息包括:所述训练样本的基线;所述基线为所述字符笔迹在Y轴或X轴投影坐标点数量最多的区间的均线;预估单元,用于确定所述训练样本与其基线的交点,并将所述交点作为预估切分信息;切分模型训练单元,用于利用所述预估切分信息及标注信息训练得到对应连笔字符书写类语言的切分模型。可选地,所述切分模型为回归模型或者卷积神经网络模型。可选地,所述装置还包括:组合判断模块、组合处理模块;所述组合判断模块在所述识别模块对所述切分块序列进行识别之前,判断所述字符笔迹对应的语言类别是否为易产生过切分的语言;如果是,则触发所述组合处理模块对所述切分块序列中的切分块进行组合处理。可选地,所述组合处理模块包括:几何特征提取单元,用于提取各切分块的几何特征;字符判断单元,用于利用预先构建的多元几何模型及相邻切分块的几何特征判断所述相邻切分块是否属于同一个字符;组合单元,用于在所述字符判断单元判断所述相邻切分块属于同一个字符后,将所述相邻切分块合并。可选地,所述装置还包括:用于构建所述多元几何模型的几何模型构建模块;所述几何模型构建模块包括:样本采集单元,用于采集大量切分块数据作为训练样本,并对属于同一字符的切分块进行标注;几何特征提取单元,用于提取所述训练样本的几何特征,所述几何特征包括以下任意一种或多种:各切分块的长度、宽度、位置;相邻切分块的距离、位置关系;各切分块的长度与平均长度的差值,各切分块的宽度与平均宽度的差值;几何模型训练单元,用于利用所述几何特征及标注信息训练得到所述多元几何模型。可选地,所述多元几何模型为回归模型或分类模型。可选地,所述识别模块包括:字符识别单元,用于对所述切分块序列中的切分块进行识别,得到所述切分块对应的各字符;候选路径确定单元,用于确定各候选路径;路径得分计算单元,用于计算各候选路径的得分;选择单元,用于选择最优本文档来自技高网...

【技术保护点】
1.一种手写识别方法,其特征在于,所述方法包括:/n获取字符笔迹;/n获取对应所述字符笔迹所属语言类别的切分模型;/n利用所述切分模型对所述字符笔迹进行切分,得到切分块序列;/n对所述切分块序列进行识别,得到所述字符笔迹对应的字符串。/n

【技术特征摘要】
1.一种手写识别方法,其特征在于,所述方法包括:
获取字符笔迹;
获取对应所述字符笔迹所属语言类别的切分模型;
利用所述切分模型对所述字符笔迹进行切分,得到切分块序列;
对所述切分块序列进行识别,得到所述字符笔迹对应的字符串。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在对所述切分块序列进行识别之前,判断所述字符笔迹对应的语言类别是否为易产生过切分的语言;如果是,则对所述切分块序列中的切分块进行组合处理;否则执行对所述切分块序列进行识别的步骤。


3.根据权利要求2所述的方法,其特征在于,所述对所述切分块序列中的切分块进行组合处理包括:
提取各切分块的几何特征;
利用预先构建的多元几何模型及相邻切分块的几何特征判断所述相邻切分块是否属于同一个字符;
如果是,则将所述相邻切分块合并。


4.根据权利要求3所述的方法,其特征在于,所述方法还包括:通过以下方式预先构建所述多元几何模型:
采集大量切分块数据作为训练样本,并对属于同一字符的切分块进行标注;
提取所述训练样本的几何特征,所述几何特征包括以下任意一种或多种:各切分块的长度、宽度、位置;相邻切分块的距离、位置关系;各切分块的长度与平均长度的差值,各切分块的宽度与平均宽度的差值;
利用所述几何特征及标注信息训练得到所述多元几何模型。


5.根据权利要求1至4任一项所述的方法,其特征在于,所述对所述切分块序列进行识别,得到所述字符笔迹对应的字符串包...

【专利技术属性】
技术研发人员:辛晓哲
申请(专利权)人:北京搜狗科技发展有限公司搜狗杭州智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1