一种基于汉字轮廓的笔画分离方法技术

技术编号:21433356 阅读:27 留言:0更新日期:2019-06-22 12:16
本发明专利技术提供一种基于汉字轮廓的笔画分离方法,包括:提取汉字字符的轮廓,确定内轮廓、外轮廓,获得组合轮廓集合;提取笔画分离的轮廓候选特征点;针对任意一个候选特征点;计算特征点集合中任意两个特征点之间的距离,及每个特征点的入向量和出向量,并初始化特征点对列表;在任意两个不同的特征点之间,如果第一特征点和第二特征点之间的距离不大于阈值时,计算两特征点对应的余弦夹角;如果满足预设条件,则将第一特征点和第二特征点加入到特征点对集合中;基于轮廓集合、特征点集合和特征点对集合进行笔画分离。应用本发明专利技术实施例,通过特征点位置检测和角度检测,提高有效特征点筛选的准确率,并提高了独立笔画提取的准确率。

【技术实现步骤摘要】
一种基于汉字轮廓的笔画分离方法
本专利技术涉及汉字轮廓提取
,特别是涉及一种基于汉字轮廓的笔画分离方法。
技术介绍
汉字拥有着近五千年的悠久进化史,且应用广泛,随着计算机和信息技术的发展,人们对各种不同风格字体的需求越来越迫切而多样化。尽管目前有多种方法用于分离汉字的独立自然笔画,但相对分离准确率和效率较低。由于汉字书法与印刷字体的多样性,生成一款优美的计算机矢量字库需要大量的人工,效率较低。就目前的TTF等矢量字库中,只有个别字库具有独立笔画轮廓信息可供教学使用,且只具有常用的简体字笔画信息。这为多种风格字体的教学应用带来了许多困难,特别是随着计算机技术和网络技术的发展,汉字教学也从一对一的言传身教的导师模式,演变为计算机和互联网+的自主学习模式,由计算机演示书写过程和要点,学生通过观摩和临摹自主学习。同时,在基于汉字的艺术创作时,将汉字笔画与绘画技巧融合在一起,可产生许多益智类的汉字画艺术品,给人带来美感的同时,也让人增长了知识和智慧。目前独立笔画的提取方法主要分为基于汉字轮廓的提取方法、基于骨架的提取方法、基于书写规则的提取方法,或基于模板匹配的提取方法,以及基于轮廓和骨架信息融合的提取方法。已发表的研究成果表明,这些方法对一些特定的字集或字体有效,但准确率都有等提高。这是因为在这些方法的轮廓特征点查找和配对、骨架点的提取和优化算法都会存在误差,导致汉字的独立笔画提取准确率有待提高。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种基于汉字轮廓的笔画分离方法,旨在通过通过特征点位置检测和角度检测,提高有效特征点筛选的准确率,以及提出特征点向量对的匹配算法和轮廓点单方向搜索算法,提高笔画提取的准确率。为实现上述目的及其他相关目的,本专利技术提供一种基于汉字轮廓的笔画分离方法,所述方法包括步骤:基于图形引擎的路径,提取汉字字符的轮廓;基于所提取的轮廓,确定内轮廓、外轮廓,获得轮廓集合;针对任意的连续三个轮廓点,判断中间轮廓点是否在其前一个轮廓点和后一个轮廓点的连线的右边;如果是,确定该中间轮廓点为候选特征点;针对任意一个候选特征点,判断该候选特征点与其前一个轮廓点和后一个轮廓点所构成的余弦夹角是否位于预设角度范围内;如果是,则确定该候选特征点为特征点,获得特征点集合;计算所述特征点集合中任意两个特征点之间的距离,及每个特征点的入向量和出向量,并初始化特征点对列表;在任意两个不同的特征点之间,如果第一特征点Pi和第二特征点Pj之间的距离不大于阈值时,计算第一特征点Pi的入向量与第二特征点Pj的出向量之间的夹角θ12Inout、以及计算第一轮廓点与第一特征点和第二特征点之间所形成的第一余弦夹角、第一特征点与第二特征点和第二轮廓点之间所形成的第二余弦夹角;其中,第一轮廓点为第一特征点的前一个轮廓点,第二轮廓点为第二特征点的后一个轮廓点;判断是否满足预设条件,所述预设条件包括:|θ12Inout|<THAngle1,|180-∠(Pilast,Pi,Pj)|<THAngle2,|180-∠(Pi,Pi,Pjnext)|<THAngle2.,其中,THAngle1、THAngle2均为预先设置的角度值,∠(Pilast,Pi,Pj)是第一余弦夹角,∠(Pi,Pj,Pjnext)是第二余弦夹角,如果满足,则将所述第一特征点和所述第二特征点加入到特征点对集合中;基于所述轮廓集合、所述特征点集合和所述特征点对集合进行笔画分离。本专利技术的一种实现方式中,所述确定内轮廓、外轮廓的步骤,包括:确定子轮廓;如果子轮廓内部点的数量在预设比例以上均包括在另一轮廓上,则该另一轮廓为该子轮廓的父轮廓;确定一个父轮廓及其子轮廓所构成的笔画轮廓为一个复合轮廓;由相连笔画构成的封闭区域中的父轮廓称为外轮廓,该父轮廓的子轮廓称为内轮廓,且内轮廓点按逆时针顺序排列,外轮廓则按顺时针顺序排列。本专利技术的一种实现方式中,所述基于所述轮廓集合、所述特征点集合和所述特征点对集合进行笔画分离的步骤,包括:S31:初始化存放提取笔画队列、第一笔画轮廓点集合S(n)(n=1)为空;S32:从所述轮廓集合中取出任意一个未处理的复合轮廓OL(k)(k=1),并按轮廓先后顺序设置标志,对标记普通轮廓点、特征点集合中包含的特征点、特征点集合中每个未处理的特征点进行标志;S33.从复合轮廓OL(k)集合中查找一个普通点Pm,加入到第一笔画轮廓点集合S(n)中,并设置Pm已处理标志为0,特征点计数器FCounter为0,取Pm后续相邻点Ps,加入到S(n)中;S34.判断Ps是否属于特征点对集合FL中特征点向量对起始点,如果是,执行S35;否则执行S36;S35.设置特征点计数器FCounter为1,检查以Ps起始的特征点对每个终点Pes,找出最接近当前笔画轮廓轨迹方向的终点Pei,并将该点加入到S(n)中,并将Ps更新为Pei,设置特征点计数器FCounter为2;S36.判断Ps是否属于FL集合中特征点对终点,如果是,则设置FCounter为0,将Ps加入S(n)中,并将Ps的后续相邻点Pn作为新的Ps;S37.判断Ps如果不属于FL集合中的特征点,则为普通轮廓点Pc,如果Pc为未处理点,则加入S(n)中,重复S34—S37;如果Pc为已处理点,说明该笔画已分离完成,则结束该笔画的搜索;S38.将S(n)加入到SS队列中,新建笔画S(n)(n=n+1),重复S33,直至OL(k)中没有普通点,说明该复合轮廓中笔画已分离完成;S39.更新k=k+1,重复S32-S39;直至所有的复合轮廓都处理完成。如上所述,本专利技术实施例提供的一种基于汉字轮廓的笔画分离方法,通过特征点位置检测和角度检测,提高有效特征点筛选的准确率,且通过所提出的特征点向量对的匹配算法和轮廓点单方向搜索算法,提高笔画提取的准确率。附图说明图1是本专利技术实施例的一种基于汉字轮廓的笔画分离方法的一种流程示意图。图2是本专利技术实施例的一种基于汉字轮廓的笔画分离方法的第一种实施例示意图。图3是本专利技术实施例的一种基于汉字轮廓的笔画分离方法的第二种实施例示意图。图4A是本专利技术实施例的一种基于汉字轮廓的笔画分离方法的第三种实施例示意图。图4B是本专利技术实施例的一种基于汉字轮廓的笔画分离方法的第四种实施例示意图。图5是本专利技术实施例的一种基于汉字轮廓的笔画分离方法的第五种实施例示意图。图6是本专利技术实施例的一种基于汉字轮廓的笔画分离方法的第六种实施例示意图。图7是本专利技术实施例的一种基于汉字轮廓的笔画分离方法的第七种实施例示意图。图8是本专利技术实施例的一种基于汉字轮廓的笔画分离方法的第八种实施例示意图。图9是本专利技术实施例的一种基于汉字轮廓的笔画分离方法的第九种实施例示意图。图10是本专利技术实施例的一种基于汉字轮廓的笔画分离方法的第十种实施例示意图。图11是本专利技术实施例的一种基于汉字轮廓的笔画分离方法的第十一种实施例示意图。具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。请本文档来自技高网...

【技术保护点】
1.一种基于汉字轮廓的笔画分离方法,其特征在于,所述方法包括步骤:基于图形引擎的路径,提取汉字字符的轮廓;基于所提取的轮廓,确定内轮廓、外轮廓,获得轮廓集合;针对任意的连续三个轮廓点,判断中间轮廓点是否在其前一个轮廓点和后一个轮廓点的连线的右边;如果是,确定该中间轮廓点为候选特征点;针对任意一个候选特征点,判断该候选特征点与其前一个轮廓点和后一个轮廓点所构成的余弦夹角是否位于预设角度范围内;如果是,则确定该候选特征点为特征点,获得特征点集合;计算所述特征点集合中任意两个特征点之间的距离,及每个特征点的入向量和出向量,并初始化特征点对列表;在任意两个不同的特征点之间,如果第一特征点Pi和第二特征点Pj之间的距离不大于阈值时,计算第一特征点Pi的入向量与第二特征点Pj的出向量之间的夹角θ12Inout、以及计算第一轮廓点与第一特征点和第二特征点之间所形成的第一余弦夹角、第一特征点与第二特征点和第二轮廓点之间所形成的第二余弦夹角;其中,第一轮廓点为第一特征点的前一个轮廓点,第二轮廓点为第二特征点的后一个轮廓点;判断是否满足预设条件,所述预设条件包括:|θ12Inout|<THAngle1,|180‑∠(Pilast,Pi,Pj)|<THAngle2,|180‑∠(Pi,Pi,Pjnext)|<THAngle2.,其中,THAngle1、THAngle2均为预先设置的角度值,∠(Pilast,Pi,Pj)是第一余弦夹角,∠(Pi,Pj,Pjnext)是第二余弦夹角,如果满足,则将所述第一特征点和所述第二特征点加入到特征点对集合中;基于所述轮廓集合、所述特征点集合和所述特征点对集合进行笔画分离。...

【技术特征摘要】
1.一种基于汉字轮廓的笔画分离方法,其特征在于,所述方法包括步骤:基于图形引擎的路径,提取汉字字符的轮廓;基于所提取的轮廓,确定内轮廓、外轮廓,获得轮廓集合;针对任意的连续三个轮廓点,判断中间轮廓点是否在其前一个轮廓点和后一个轮廓点的连线的右边;如果是,确定该中间轮廓点为候选特征点;针对任意一个候选特征点,判断该候选特征点与其前一个轮廓点和后一个轮廓点所构成的余弦夹角是否位于预设角度范围内;如果是,则确定该候选特征点为特征点,获得特征点集合;计算所述特征点集合中任意两个特征点之间的距离,及每个特征点的入向量和出向量,并初始化特征点对列表;在任意两个不同的特征点之间,如果第一特征点Pi和第二特征点Pj之间的距离不大于阈值时,计算第一特征点Pi的入向量与第二特征点Pj的出向量之间的夹角θ12Inout、以及计算第一轮廓点与第一特征点和第二特征点之间所形成的第一余弦夹角、第一特征点与第二特征点和第二轮廓点之间所形成的第二余弦夹角;其中,第一轮廓点为第一特征点的前一个轮廓点,第二轮廓点为第二特征点的后一个轮廓点;判断是否满足预设条件,所述预设条件包括:|θ12Inout|<THAngle1,|180-∠(Pilast,Pi,Pj)|<THAngle2,|180-∠(Pi,Pi,Pjnext)|<THAngle2.,其中,THAngle1、THAngle2均为预先设置的角度值,∠(Pilast,Pi,Pj)是第一余弦夹角,∠(Pi,Pj,Pjnext)是第二余弦夹角,如果满足,则将所述第一特征点和所述第二特征点加入到特征点对集合中;基于所述轮廓集合、所述特征点集合和所述特征点对集合进行笔画分离。2.根据权利要求1所述的基于汉字轮廓的笔画分离方法,其特征在于,所述确定内轮廓、外轮廓的步骤,包括:确定子轮廓;如果子轮廓内部点的数量在预设比例以上均包括在另一轮廓上,则该另一轮廓为该子轮廓的父轮廓;确...

【专利技术属性】
技术研发人员:杨文璐于孟孟谢宏夏斌
申请(专利权)人:上海海事大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1