【技术实现步骤摘要】
字符笔画拆分方法和装置
本申请涉及计算机
,尤其涉及一种字符笔画拆分方法和装置。
技术介绍
虽然字符结构复杂多变,但对于确定的字符,该字符中笔画之间的位置关系是不变的。若能够从字符的字形轮廓曲线中将字符的笔画准确确定出来,对于字符识别、笔画拆分和字符正确性检查具有重要的意义。现有的字符笔画拆分方法主要可分为两类,一类是基于图像确定字符中的笔画,另一类是基于字形轮廓确定字符中的笔画。但上述字符笔画拆分方法的准确度不高。
技术实现思路
本申请实施例提供一种字符笔画拆分方法和装置,可以提高字符笔画拆分的准确度。第一方面,本申请提供了一种字符笔画拆分方法,包括:获取待拆分字符和参考字符;获取曲线段组,曲线段组包括组成待拆分字符同一笔画的曲线段;对待拆分字符和参考字符进行离散化,得到待拆分字符的第一离散点的点集和参考字符的第二离散点的点集;获取第一离散点的点集和第二离散点的点集之间的对应关系,对应关系表征与每个第一离散点的相似度最大的第二离散点;根据曲线段组、对应关系和参考字符,拆分待拆分字符所包括的笔画。可选的,还包括:获取多个曲线段对,曲线段对所包括的一对曲线段为待拆分字符同一笔画中的部分或全部曲线段;从待拆分字符的轮廓曲线上的多个端点中确定同一笔画的曲线段的连接点,端点为曲线段的端点;根据同一笔画的曲线段的连接点和多个曲线段对,获取曲线段组。可选的,从待拆分字符的轮廓曲线上的所有端点中确定同一笔画的曲线段的连接点,包括:对于待拆分字符的轮廓曲线上的任一曲线段的任一 ...
【技术保护点】
1.一种字符笔画拆分方法,其特征在于,包括:/n获取待拆分字符和参考字符;/n获取曲线段组,所述曲线段组包括组成待拆分字符同一笔画的曲线段;/n对所述待拆分字符和所述参考字符进行离散化,得到所述待拆分字符的第一离散点的点集和所述参考字符的第二离散点的点集;/n获取所述第一离散点的点集和所述第二离散点的点集之间的对应关系,所述对应关系表征与每个所述第一离散点相似度最大的第二离散点;/n根据所述曲线段组、对应关系和所述参考字符,拆分所述待拆分字符所包括的笔画。/n
【技术特征摘要】
1.一种字符笔画拆分方法,其特征在于,包括:
获取待拆分字符和参考字符;
获取曲线段组,所述曲线段组包括组成待拆分字符同一笔画的曲线段;
对所述待拆分字符和所述参考字符进行离散化,得到所述待拆分字符的第一离散点的点集和所述参考字符的第二离散点的点集;
获取所述第一离散点的点集和所述第二离散点的点集之间的对应关系,所述对应关系表征与每个所述第一离散点相似度最大的第二离散点;
根据所述曲线段组、对应关系和所述参考字符,拆分所述待拆分字符所包括的笔画。
2.根据权利要求1所述的方法,其特征在于,所述获取曲线段组,包括:
获取多个曲线段对,所述曲线段对所包括的一对曲线段为所述待拆分字符同一笔画中的部分或全部曲线段;
从所述待拆分字符的轮廓曲线上的所有端点中确定同一笔画的曲线段的连接点,所述端点为所述曲线段的端点;
根据同一笔画的曲线段的连接点和所述多个曲线段对,获取曲线段组。
3.根据权利要求2所述的方法,其特征在于,所述从所述待拆分字符的轮廓曲线上的端点中确定同一笔画的曲线段的连接点,包括:
对于所述待拆分字符的轮廓曲线上的任一曲线段的任一端点:若所述端点所在的两条曲线段的夹角小于第一预设值,则确定所述端点为关键点;
从所有所述关键点中确定同一笔画的曲线段的连接点。
4.根据权利要求3所述的方法,其特征在于,所述从所有所述关键点中确定同一笔画的曲线段的连接点,包括:
对于任一关键点,若所述关键点所在的两条曲线段的其它端点与所述关键点围成的三角形区域不属于所述轮廓曲线围成的区域的一部分,则确定所述关键点为分叉点;
从所有所述分叉点中确定同一笔画的曲线段的连接点。
5.根据权利要求4所述的方法,其特征在于,所述从所有所述分叉点中确定同一笔画的曲线段的连接点,包括:
对于任意的第一分叉点和第二分叉点,若第一向量和第二向量的夹角小于第二预设值,且所述第一分叉点和所述第二分叉点组成的线段上的其它点均位于所述轮廓曲线围成的区域的内部,则确定所述第一分叉点和所述第二分叉点为同一笔画所对应的曲线段的连接点;
其中,所述第一向量为所述第一分叉点作为终点所在曲线的曲线向量,所述第二向量为第二分叉点作为起点所在曲线的曲线向量。
6.根据权利要求5所述的方法,其特征在于,所述根据同一笔画的曲线段的连接点和所述多个曲线段对,获取曲线段组,包括:
在所述第一...
【专利技术属性】
技术研发人员:郝龙杰,
申请(专利权)人:北大方正集团有限公司,北京北大方正电子有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。