毛刺类型笔段的处理方法和装置制造方法及图纸

技术编号:20488229 阅读:34 留言:0更新日期:2019-03-02 20:31
本发明专利技术公开了一种毛刺类型笔段的处理方法和装置。其中,该方法包括:在判断汉字的骨架笔段为毛刺类型笔段的情况下,删除毛刺类型笔段,其中,毛刺类型笔段是指骨架笔段的一端没有邻接的骨架笔段,另一端有两个邻接的骨架笔段;将与毛刺类型笔段相邻的两条骨架笔段删除预定长度的骨架笔段得到部分相邻笔段,其中,预定长度的骨架笔段是在毛刺类型笔段的预定阈值范围内的部分骨架笔段;将部分相邻笔段延长至预定点,其中,预定点是使部分相邻笔段延长后能够平滑连接的点。本发明专利技术解决了现有技术在汉字笔段消歧中无法自动处理笔段歧义畸变的技术问题。

Processing Method and Device of Burr Type Pen Segments

The invention discloses a processing method and device for burr type pen segments. Among them, the method includes: in the case of judging that the skeleton segment of Chinese characters is a burr-type segment, the burr-type segment is deleted, in which the burr-type segment refers to the skeleton segment without adjacent at one end and two adjacent skeleton segments at the other end; and the skeleton segment adjacent to the burr-type segment is deleted and the skeleton segment with predetermined length is partially adjacent. Among them, the skeleton segment of predetermined length is a part of skeleton segment within the predetermined threshold range of burr type segments, and part of adjacent segments are extended to the predetermined point, where the predetermined point is the point where the adjacent segments can be smoothly connected after being extended. The invention solves the technical problem that the prior technology can not automatically process the ambiguity distortion of the Chinese character segment in the disambiguation of the Chinese character segment.

【技术实现步骤摘要】
毛刺类型笔段的处理方法和装置
本专利技术涉及计算机应用
,具体而言,涉及一种毛刺类型笔段的处理方法和装置。
技术介绍
历代书法名家的作品都是静态的;市面上很多的书法字帖也都是静态的。然而,汉字书写的动态过程在书法艺术鉴赏、书写教学等方面意义明显。所以,对静态字帖汉字的书写过程进行动态还原是非常有必要的。在静态字帖汉字书写过程的动态还原过程需要解决两个关键问题:字帖汉字骨架笔段的提取,以及对骨架笔段序列的消歧和排序。目前,在汉字的骨架笔段提取方面,已经出现很多方法。例如,外围轮廓法、数学形态法、段化法、区域分解法、模糊区域检测法、基于细化的方法、基于距离的方法、基于方向游程长度的方法、基于编码的方法、基于神经元网络的方法等。这些方法基本都是基于印刷体的汉字识别而提出的,因而它们对汉字具有较强的限制,在字符集的容量上、字体字形的视觉效果上都具有很强的约束性。目前,在对汉字笔段消歧和排序方面研究较少,主要有以下几种方法:第一种,通过定义规则生成汉字的笔顺,并通过计算与标准模板中的笔顺的相似度进行纠正,该方法难以区分相同笔顺的近似字,分辨率不高;第二种,重构数字字符笔迹顺序的方法,通过搜寻最小代价的Hamilton路径来重构书写笔迹,但该方法只能用于数字等复杂程度低的字符集合,并且上述方法均不能适应汉字字形的各种笔画;第三种,针对每一个汉字建立一个笔段消歧规则,该方法不能实现笔段歧义畸变的自动识别和处理,且数据量大、适应性低,对于笔段消歧规则中不包含的歧义无法消除。针对上述现有技术在汉字笔段消歧中无法自动处理笔段歧义畸变的问题,目前尚未提出有效的解决方案。专
技术实现思路
本专利技术实施例提供了一种毛刺类型笔段的处理方法和装置,以至少解决现有技术在汉字笔段消歧中无法自动处理笔段歧义畸变的技术问题。根据本专利技术实施例的一个方面,提供了一种毛刺类型笔段的处理方法包括:在判断汉字的骨架笔段为毛刺类型笔段的情况下,删除所述毛刺类型笔段,其中,所述毛刺类型笔段是指所述骨架笔段的一端没有邻接的骨架笔段,另一端有两个邻接的骨架笔段;将与所述毛刺类型笔段相邻的两条骨架笔段删除预定长度的骨架笔段得到部分相邻笔段,其中,所述预定长度的骨架笔段是在所述毛刺类型笔段的预定阈值范围内的部分骨架笔段;将所述部分相邻笔段延长至预定点,其中,所述预定点是使所述部分相邻笔段延长后能够平滑连接的点。进一步地,将与所述内部短笔段相邻的骨架笔段删除预定长度的骨架笔段得到部分相邻笔段之前包括:判断与所述毛刺类型笔段相邻的两条骨架笔段之间的第一夹角;如果所述第一夹角小于第一阈值,则所述毛刺类型笔段为笔画转折毛刺;如果所述第一夹角大于小于第一阈值,则判断所述毛刺类型笔段所对应的向量的方向;如果所述向量的方向在第一象限或第三象限,则所述毛刺类型笔段为笔画粘连毛刺,进行笔画粘连毛刺的处理;如果所述向量的方向在第四象限,则所述毛刺类型笔段为笔画转折毛刺;如果所述向量的方向在第二象限,将与所述毛刺类型笔段相邻的两条骨架笔段中更加接近竖直方向的的骨架笔段作为基准笔段;判断所述基准笔段与所述毛刺类型笔段的第二夹角;如果所述第二夹角小于第二阈值,则所述毛刺类型笔段为笔画转折毛刺;如果所述第二夹角大于等于第二阈值,则所述毛刺类型笔段为笔画粘连毛刺。进一步地,在所述毛刺类型笔段为笔画转折毛刺的情况下,将所述部分相邻笔段延长至预定点包括:在所述毛刺类型笔段的延长线上选取预订点,其中,所述延长线不超过二值图像的边界;分别将所述部分相邻笔段延长至所述预定点。进一步地,在所述毛刺类型笔段为笔画粘连毛刺的情况下,将所述部分相邻笔段延长至预定点包括:在所述毛刺类型笔段的延长线上选取预订点,其中,所述延长线不超过二值图像的边界;分别将所述部分相邻笔段延长至所述预定点形成多条拟合直线;筛选所述拟合直线中接近直线拟合效果的直线作为基准线;将其余拟合直线中的部分骨架笔段延长至所述基准线。根据本专利技术实施例的一个方面,提供了一种毛刺类型笔段的处理装置,包括:第一删除模块,用于在判断汉字的骨架笔段为毛刺类型笔段的情况下,删除所述毛刺类型笔段,其中,所述毛刺类型笔段是指所述骨架笔段的一端没有邻接的骨架笔段,另一端有两个邻接的骨架笔段;第二删除模块,用于将与所述毛刺类型笔段相邻的两条骨架笔段删除预定长度的骨架笔段得到部分相邻笔段,其中,所述预定长度的骨架笔段是在所述毛刺类型笔段的预定阈值范围内的部分骨架笔段;处理模块,用于将所述部分相邻笔段延长至预定点,其中,所述预定点是使所述部分相邻笔段延长后能够平滑连接的点。根据本专利技术实施例的一个方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,所述程序执行上述的方法。根据本专利技术实施例的一个方面,提供了一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行上述的方法。在本专利技术实施例中,采用在判断汉字的骨架笔段为毛刺类型笔段的情况下,删除毛刺类型笔段,其中,毛刺类型笔段是指骨架笔段的一端没有邻接的骨架笔段,另一端有两个邻接的骨架笔段;将与毛刺类型笔段相邻的两条骨架笔段删除预定长度的骨架笔段得到部分相邻笔段,其中,预定长度的骨架笔段是在毛刺类型笔段的预定阈值范围内的部分骨架笔段;将部分相邻笔段延长至预定点,其中,预定点是使部分相邻笔段延长后能够平滑连接的点的方式,从而使得当检测到笔段为毛刺类型的笔段时,可以自动的删除毛刺类型的笔段并在合适的位置进行光滑连接,保证后续的排序等处理更加顺畅,进而解决了现有技术在汉字笔段消歧中无法自动处理笔段歧义畸变的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种毛刺类型笔段的处理方法的流程图;图2是根据本专利技术实施例的一种毛刺类型笔段的处理装置的示意图;图3是根据本专利技术实施例的一种可选的字帖汉字的采集结果的示意图;图4是根据本专利技术实施例的一种可选的字帖汉字的采集结果的示意图;图5是根据本专利技术实施例的字帖汉字图像的二值化结果的示意图;图6是根据本专利技术实施例的字帖汉字图像的细化结果的示意图;图7是根据本专利技术实施例的汉字骨架中像素点分类的示意图;图8是根据本专利技术实施例的提取的骨架笔段的示意图;图9是根据本专利技术实施例的骨架笔段分类的示意图;图10是根据本专利技术实施例的一种“毛刺判断模块”的流程图;图11是根据本专利技术实施例的毛刺类型骨架笔段的识别结果举例的示意图;图12是根据本专利技术实施例的“内部短笔段判断模块”的流程图;图13是根据本专利技术实施例的三角形法则的第一示意图;图14是根据本专利技术实施例的三角形法则的第二示意图;图15是根据本专利技术实施例的三角形法则的第三示意图;图16是根据本专利技术实施例的三角形法则的第四示意图;图17是根据本专利技术实施例的三角形法则的第五示意图;图18是根据本专利技术实施例的三角形法则的第六示意图;图19是根据本专利技术实施例的内部短笔段类型的示意图;图20是根据本专利技术实施例的分组中只包含一条内部短笔段时的处理效果对比图;图21是根据本专利技术实施例的分组中包含多条内部短笔段时的处理效果对比图;图22是根据本专利技术实施例的坐标系的示意图;图23是根据本专利技术实施例的“笔画本文档来自技高网
...

【技术保护点】
1.一种毛刺类型笔段的处理方法,其特征在于,包括:在判断汉字的骨架笔段为毛刺类型笔段的情况下,删除所述毛刺类型笔段,其中,所述毛刺类型笔段是指所述骨架笔段的一端没有邻接的骨架笔段,另一端有两个邻接的骨架笔段;将与所述毛刺类型笔段相邻的两条骨架笔段删除预定长度的骨架笔段得到部分相邻笔段,其中,所述预定长度的骨架笔段是在所述毛刺类型笔段的预定阈值范围内的部分骨架笔段;将所述部分相邻笔段延长至预定点,其中,所述预定点是使所述部分相邻笔段延长后能够平滑连接的点。

【技术特征摘要】
1.一种毛刺类型笔段的处理方法,其特征在于,包括:在判断汉字的骨架笔段为毛刺类型笔段的情况下,删除所述毛刺类型笔段,其中,所述毛刺类型笔段是指所述骨架笔段的一端没有邻接的骨架笔段,另一端有两个邻接的骨架笔段;将与所述毛刺类型笔段相邻的两条骨架笔段删除预定长度的骨架笔段得到部分相邻笔段,其中,所述预定长度的骨架笔段是在所述毛刺类型笔段的预定阈值范围内的部分骨架笔段;将所述部分相邻笔段延长至预定点,其中,所述预定点是使所述部分相邻笔段延长后能够平滑连接的点。2.根据权利要求1所述的方法,其特征在于,将与所述内部短笔段相邻的骨架笔段删除预定长度的骨架笔段得到部分相邻笔段之前包括:判断与所述毛刺类型笔段相邻的两条骨架笔段之间的第一夹角;如果所述第一夹角小于第一阈值,则所述毛刺类型笔段为笔画转折毛刺;如果所述第一夹角大于小于第一阈值,则判断所述毛刺类型笔段所对应的向量的方向;如果所述向量的方向在第一象限或第三象限,则所述毛刺类型笔段为笔画粘连毛刺,进行笔画粘连毛刺的处理;如果所述向量的方向在第四象限,则所述毛刺类型笔段为笔画转折毛刺;如果所述向量的方向在第二象限,将与所述毛刺类型笔段相邻的两条骨架笔段中更加接近竖直方向的的骨架笔段作为基准笔段;判断所述基准笔段与所述毛刺类型笔段的第二夹角;如果所述第二夹角小于第二阈值,则所述毛刺类型笔段为笔画转折毛刺;如果所述第二夹角大于等于第二阈值,则所述毛刺类型笔段为笔画粘连毛刺。3.根据权利要求2所述的方法,其特征在于,在所述...

【专利技术属性】
技术研发人员:安维华
申请(专利权)人:北京语言大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1