字符切分方法及装置制造方法及图纸

技术编号:23459510 阅读:15 留言:0更新日期:2020-03-03 05:33
本发明专利技术公开了一种字符切分方法及装置,所述方法包括:获取字符笔迹;确定所述字符笔迹的特征信息,所述特征信息包括:所述字符笔迹的基线;确定所述字符轨迹与其基线的交点,并将所述交点作为预估切分信息;根据所述预估切分信息及预先构建的切分模型确定实际切分点;根据所述实际切分点对所述字符笔迹进行切分,得到切分结果。利用本发明专利技术可以对手写文本中的连笔字符进行准确切分。

Character segmentation method and device

【技术实现步骤摘要】
字符切分方法及装置
本专利技术涉及手写识别领域,具体涉及一种字符切分方法及装置。
技术介绍
手写识别技术,是指将在手写设备上书写时产生的有序轨迹信息转化为文字内码的过程,实际上是手写轨迹的坐标序列到文字内码的一个映射过程,是人机交互最自然、最方便的手段之一。随着智能手机、掌上电脑等智能终端的普及,手写识别技术也进入了规模应用时代。由于文本行输入比单字符输入具有更高的输入效率,而且用户可以按照日常的手写风格及习惯进行书写,因此,对于基于文本行的手写输入的自动识别,常用的一个关键技术是如何将文本行中的单个字符正确切分出来,以便利用单字符识别技术进行字符识别处理。传统的切分模型是基于每个笔划结束位置进行切分判定,由于不同国家的语言具有不同的书写特点,比如,阿拉伯语在书写时,每个字母均有单写与连写之分,在手写体中,经常是一个单词从头到尾只用一笔就可以写完,如图1所示。对于这种手写文本,对手写文本进行切分时,该单词不会进入传统的切分模型进行判定,也就无法得到基于单个字符的切分块。
技术实现思路
本专利技术实施例提供一种字符切分方法及装置,可以对手写文本中的连笔字符进行准确切分。为此,本专利技术提供如下技术方案:一种字符切分方法,所述方法包括:获取字符笔迹;确定所述字符笔迹的特征信息,所述特征信息包括:所述字符笔迹的基线;确定所述字符轨迹与其基线的交点,并将所述交点作为预估切分信息;根据所述预估切分信息及预先构建的切分模型确定实际切分点;根据所述实际切分点对所述字符笔迹进行切分,得到切分结果。可选地,所述字符笔迹是以行连续输入的字符笔迹;所述基线为所述字符笔迹在Y轴投影坐标点数量最多的区间的均线。可选地,确定所述字符笔迹的基线包括:将所述字符笔迹向Y轴投影,并根据所述投影得到统计直方图,所述统计直方图记录Y轴各区间内坐标点的数量;根据所述统计直方图确定在Y轴上坐标点数量最多的区间,将所述区间的均线作为所述字符笔迹的基线。可选地,所述字符笔迹是以列连续输入的字符笔迹;所述基线为所述字符笔迹在X轴投影坐标点数量最多的区间的均线。可选地,确定所述字符笔迹的基线包括:将所述字符笔迹向X轴投影,并根据所述投影得到统计直方图,所述统计直方图记录X轴各区间内坐标点的数量;根据所述统计直方图确定在X轴上坐标点数量最多的区间,并将所述区间的均线作为所述字符笔迹的基线。可选地,所述特征信息还包括:所述字符笔迹的最低线和最高线;所述字符笔迹的最低线是连接所述字符笔迹中Y值或X值局部最小坐标点的拟合直线;所述字符笔迹的最高线是连接所述字符笔迹中Y值或X值局部最大坐标点的拟合直线;根据所述最低线和最高线、以及所述统计直方图确定在Y轴或X轴上坐标点数量最多的区间。可选地,所述方法还包括:通过以下方式预先构建所述切分模型:采集连笔笔迹数据作为训练样本,并标注所述训练样本的切分点;确定每个训练样本的特征信息;所述特征信息包括:所述训练样本的基线;确定所述训练样本与其基线的交点,并将所述交点作为预估切分信息;利用所述预估切分信息及标注信息训练得到所述切分模型。可选地,所述切分模型为回归模型或分类模型。可选地,所述方法还包括:预先构建针对不同语言类别的切分模型;在获取字符笔迹之前,确定当前语言类别;获取对应所述当前语言类别的切分模型。可选地,所述用户输入语言类别为阿拉伯语;所述预估切分信息还包括:所述字符笔迹的各局部最低点,所述局部是指沿X轴或Y轴方向的一定步长范围。一种字符切分装置,所述装置包括:接收模块,用于获取字符笔迹;特征信息确定模块,用于确定所述字符笔迹的特征信息,所述特征信息包括:所述字符笔迹的基线;预估模块,用于确定所述字符轨迹与其基线的交点,并将所述交点作为预估切分信息;切分点确定模块,用于根据所述预估信息及预先构建的切分模型确定实际切分点;输出模块,用于根据所述实际切分点对所述字符笔迹进行切分,得到切分结果。可选地,所述字符笔迹是以行连续输入的字符笔迹;所述基线为所述字符笔迹在Y轴投影坐标点数量最多的区间的均线。可选地,所述特征信息确定模块包括:基线确定单元,用于确定所述字符笔迹的基线;所述基线确定单元包括:直方图生成单元,用于将所述字符笔迹向Y轴投影,并根据所述投影得到统计直方图,所述统计直方图记录Y轴各区间内坐标点的数量;统计单元,用于根据所述统计直方图确定在Y轴上坐标点数量最多的区间,将所述区间的均线作为所述字符笔迹的基线。可选地,所述字符笔迹是以列连续输入的字符笔迹;所述基线为所述字符笔迹在X轴投影坐标点数量最多的区间的均线。可选地,所述特征信息确定模块包括:基线确定单元,用于确定所述字符笔迹的基线;所述基线确定单元包括:直方图生成单元,用于将所述字符笔迹向X轴投影,并根据所述投影得到统计直方图,所述统计直方图记录X轴各区间内坐标点的数量;统计单元,用于根据所述统计直方图确定在X轴上坐标点数量最多的区间,将所述区间的均线作为所述字符笔迹的基线。可选地,所述特征信息还包括:所述字符笔迹的最低线和最高线;所述字符笔迹的最低线是连接所述字符笔迹中Y值或X值局部最小坐标点的拟合直线;所述字符笔迹的最高线是连接所述字符笔迹中Y值或X值局部最大坐标点的拟合直线;所述统计单元根据所述最低线和最高线、以及所述统计直方图确定在Y轴或X轴上坐标点数量最多的区间。可选地,所述装置还包括:模型构建模块,用于预先构建所述切分模型;所述模型构建模块包括:数据采集单元,用于采集连笔笔迹数据作为训练样本,并标注所述训练样本的切分点;特征确定单元,用于确定每个训练样本的特征信息;所述特征信息包括:所述训练样本的基线;预估单元,用于确定所述训练样本与其基线的交点,并将所述交点作为预估切分信息;训练单元,用于利用所述预估切分信息及标注信息训练得到所述切分模型。可选地,所述切分模型为回归模型或分类模型。可选地,所述模型构建模块预先构建针对不同语言类别的切分模型;所述装置还包括:语言类别确定模块,用于在所述接收模块获取字符笔迹之前,确定当前语言类别;切分模型获取模块,用于获取对应所述当前语言类别的切分模型。可选地,所述用户输入语言类别为阿拉伯语;所述预估模块,还用于获取所述字符笔迹的各局部最低点,并将所述各局部最低点作为预估切分信息,所述局部是指沿X轴或Y轴方向的一定步长范围。一种计算机设备,包括:一个或多个处理器、存储器;所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,以实现前面所述的方法。一种可读存储介质,其上存储有指令,所述指令被执行以实现前面所述的方法。本专利技术实施例提供的字本文档来自技高网...

【技术保护点】
1.一种字符切分方法,其特征在于,所述方法包括:/n获取字符笔迹;/n确定所述字符笔迹的特征信息,所述特征信息包括:所述字符笔迹的基线;/n确定所述字符轨迹与其基线的交点,并将所述交点作为预估切分信息;/n根据所述预估切分信息及预先构建的切分模型确定实际切分点;/n根据所述实际切分点对所述字符笔迹进行切分,得到切分结果。/n

【技术特征摘要】
1.一种字符切分方法,其特征在于,所述方法包括:
获取字符笔迹;
确定所述字符笔迹的特征信息,所述特征信息包括:所述字符笔迹的基线;
确定所述字符轨迹与其基线的交点,并将所述交点作为预估切分信息;
根据所述预估切分信息及预先构建的切分模型确定实际切分点;
根据所述实际切分点对所述字符笔迹进行切分,得到切分结果。


2.根据权利要求1所述的方法,其特征在于,所述字符笔迹是以行连续输入的字符笔迹;所述基线为所述字符笔迹在Y轴投影坐标点数量最多的区间的均线。


3.根据权利要求2所述的方法,其特征在于,确定所述字符笔迹的基线包括:
将所述字符笔迹向Y轴投影,并根据所述投影得到统计直方图,所述统计直方图记录Y轴各区间内坐标点的数量;
根据所述统计直方图确定在Y轴上坐标点数量最多的区间,将所述区间的均线作为所述字符笔迹的基线。


4.根据权利要求1所述的方法,其特征在于,所述字符笔迹是以列连续输入的字符笔迹;所述基线为所述字符笔迹在X轴投影坐标点数量最多的区间的均线。


5.根据权利要求4所述的方法,其特征在于,确定所述字符笔迹的基线包括:
将所述字符笔迹向X轴投影,并根据所述投影得到统计直方图,所述统计直方图记录X轴各区间内坐标点的数量;
根据所述统计直方图确定在X轴上坐标点数量最多的区间,并将所述区间的均线作为所述字符笔迹的基线。


6.根据权利要求1所述的方...

【专利技术属性】
技术研发人员:辛晓哲
申请(专利权)人:北京搜狗科技发展有限公司搜狗杭州智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1