一种用于手写汉字的美化方法技术

技术编号:3806216 阅读:184 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种用于手写汉字识别的笔画特征美化方法,包括如下步骤:(1)对手写汉字的点序列进行插值处理,插值后的点序列为空间上连续的笔画曲线;(2)提取笔画的拐点信息,并根据拐点把笔画分段;(3)建立汉字笔画中的笔画段模型;(4)建立汉字笔画中的连接件模型;(5)根据笔画段及连接件组合规则,对手写汉字笔画时序点序列的方向信息采用步骤(3)和(4)中的笔画段和连接件模型进行渲染,从而完成对笔画的美化。

【技术实现步骤摘要】

本专利技术属于利用计算机处理识别进行手写汉字识别及美化领域,特别是涉 及一种用于楷书体手写汉字的笔画特征美化方法。
技术介绍
手写体汉字美化是一种将联机手写体轨迹变化成一种有风格的图像的方 法。 一般而言,联机手写体轨迹都不具有风格,仅仅是一些时序点序列。 一个 笔画就是一个点序列;汉字可以认为是一系列点序列的组合。手写体美化就是 要将这些点序列变成有某种风格的图像。楷书体美化是要将手写体点序列变成楷书体风格图像。楷体被认为是标准 的汉字书法体,又称"正书",其风格体现在笔画段的瘦劲有力及笔画段连接处 的明显突兀。它是最常见的汉字书法体。以往的汉字美化多采用数字墨水技术对手写体轨迹进行简单处理。中国专 利申请号为200410063987.8的《用于识别,锚定和回流数字墨水注释的数字墨 水注释方法和系统》保留位于一个文档中的注释位置,以使注释的原始的意图 和意向能被保留。中国专利申请号为200510069577.9的《激光笔的数字墨水生 成方法与生成系统》;另有中国专利申请号为01819444.3的《数字墨水的压縮》 提出了一种节省数字墨水存储量的方法。均属于此种技术。中国专利申请号为200810028916.2釆用模板匹配的方法对手写体汉字进行 美化,可以将汉字美化成与模板相同的风格,但它仅能对整个汉字进行美化, 而不能对某一个笔画进行美化。并且涉及到了汉字识别技术,难以实现实时美 化。屮国专利申请号为200810121201.1的《一种手写体汉字的计算机生成与美 化方法》是一种汉字生成方法,先进行风格学习,再将书写的汉字美化成已有的风格。涉及汉字美化度评价及新风格的适配方法。同样也具有难以实时的问 题。
技术实现思路
本专利技术的目的在于克服上述汉字美化方法的不足,提供一种通过对笔画特 征建模的方法对手写体进行美化。 本专利技术采用的技术方案为一种用于手写汉字识别的笔画特征美化方法,包括如下步骤(1) 、对手写汉字的点序列进行插值处理,插值后的点序列为空间上连续 的笔画曲线;(2) 、提取笔画的拐点信息,并根据拐点把笔画分段;(3) 、建立汉字笔画中的笔画段模型;(4) 、建立汉字笔画中的连接件模型;(5) 、根据笔画段及连接件组合规则,对手写汉字笔画时序点序列的方向 信息采用步骤(3)和(4)中的笔画段和连接件模型进行渲染,从而完成对笔 画的美化。、上述技术方案中,所述步骤(1)采用数字微分法DDA进行插值处理。 所述步骤(2)采用自适应弯曲值法找出笔画曲线中的拐点,并以所述拐点对笔 画曲线进行分段。步骤(2)所采用的自适应弯曲值法中,计算弯曲值Bending Value的表达式 为&=腿(卜,.^—《)+(《"-义,)|, |(y,._A—_y,.)+0^—_v,)|),其中(x,,_y,.) , (x,4,乂一》和"",力")分别为S, &*, ^的坐标,k的值为《的支撑域,^,《"分别为它的前k点和后k点。该算法的步骤包括(A)、将属于直线段的点去除,方法是对于S,《-',^'三点,判断《-',^两点的斜率和《,^两点的斜率是否相同,或判断它们之间的链码是否相同, 如相同,证明这三点是在同一直线上,将这些不可能是拐点的直线上的点排除,剩余的点作为侯选点;(B) 、计算侯选点的Bending Value,支撑域k从l开始,用^表示当支撑 域的大小为k时,第i点的Bending Value。如果^^',"1, k值增加1,否则k 值停止增加,为所求的支撑域大小;1—二丄y ~(C) 、应用公式 ,算出每一侯选点的Bending Value;(D) 、根据以下条件得出符合条件的拐点 根据以下条件得出符合以下条件之一,就排除它是拐点 条件h ^'",这里s为1.1;条件2:卜<^,对于_/ = !'-1或_/ = "1; 条件3: 并且&<、1; 条件4: ^=—+1,并且^^'";条件1表示Bending Value应大于阈值,条件2、 3、 4表示求出的拐点的 Bending Value应为局部最大值,否则就排除。通过条件1到4,筛选出拐点(不 符合条件1到4的任意一条)。此算法的优点是能根据曲线的不同特点自适应调 整支撑域。所述步骤(3)归纳了三种笔画段,分别是 (1)、两头粗,中间细型;(n)、渐细型;(III)、渐粗型; 所述三种笔画段具体模型建立如下根据拐点信息,把笔画段用最小二乘法拟合成三阶贝塞尔曲线; 根据笔画段类型以及拐点附近点方向信息,给拟合后的贝塞尔曲线添加宽 度信息;沿着添加了宽度信息的贝塞尔曲线画出不同半径的圆,完成对各种笔画段8模型的建模;其中,所述宽度信息确定如下令笔画段的宽度为W,对于I型,设定始末两端的宽度为W,距离始端1/2 位置的宽度为0.7W;对于II型,设定始端的宽度为w,距离始端1/2位置的宽度为0.7w,末端的宽度为O;对于III型,设定始端的宽度为O,距离始端1/2位置的宽度为0.7w,末端的宽度为w。所述步骤(4)归纳出了九种连接件,分为如下三类 独体连接件,仅包括"点"连接件;单向连接件,包括"横头"、"横尾"、"竖头"、"竖尾"、"捺头"、"捺尾"6种;双向连接件,包括"横折"和"竖提"2种;所述独体连接件用于"点"笔画的美化,所述单向连接件用于笔画的起笔 及收笔处的美化,所述双向连接件用于笔画中相邻笔画段的连接处美化。 所述步骤(5)确定了笔画表达式如下笔画=(&起笔连接件)+笔段+《b:中间连接件+笔段}+(&收笔连接件)其中,《W表示b出现0次或多次,(a)表示a出现O次或l次,起笔连接件 指位于笔画起笔处的连接件,收笔连接件指位于笔画收笔处的连接件,中间连 接件指除去起笔连接件和收笔连接件的其它连接件。所述步骤(5)将笔画分为如下两大类简单笔画没有拐点的笔画,包括"横"、"竖"、"撇"、"捺"、"点"、"提"; 复合笔画除6种简单笔画外的其它所有笔画,是简单笔画的复合。 所述步骤(5)对手写汉字笔画进行渲染的步骤包括(51)、判断输入笔画的点数,如果点数少于30,判断笔画为点,用独体连9接件进行渲染,结束;(52) 、如果点数多于30,再判断步骤(2)中提取到的拐点数,如果拐点 数为2,说明笔画只有笔画头和笔画尾两个拐点,判断该笔画为简单笔画,进行 简单笔画渲染,结束;(53) 、对于其他的复合笔画,进行普通的复合笔画渲染,结束。 所述步骤(5)进一步包括对笔画段拟合的方法,其具体步骤如下-(A) 、将插值处理后的点序列进行最小二乘法贝氏拟合,得到拟合后的贝 氏曲线,同时得到最大拟合误差位置及误差值;若误差值大于某一阈值,则将 原曲线分为两段曲线,并分别再次拟合,直到误差小于阈值。(B) 、依据不同类型的笔画段,分别赋予原始点序列每个时序点不同的宽 度信息,分别得到三种宽度信息;(C) 、将贝氏曲线分为5段,分别为,0,0.25, 0.5, 0.75, 1处的5个端点, 并求取这5个点处的宽度,这个宽度是距离原始曲线最近的那个点的宽度;(D) 、用变宽贝氏曲线的反走样画法将含变宽信息的贝氏曲线表达出来, 依据步骤(C)中赋予的宽度,在每个曲线点处用相应宽度的反走样圆进行渲染, 最本文档来自技高网
...

【技术保护点】
一种用于手写汉字的美化方法,其特征在于包括如下步骤: (1)、对手写汉字的每个笔画上的原始点序列进行插值处理,插值后的点序列为空间上连续的笔画曲线;(2)、提取笔画的拐点信息,并根据拐点把笔画分段; (3)、建立汉字笔画中的笔画段模型;  (4)、建立汉字笔画中的连接件模型; (5)、根据笔画段及连接件组合规则,对手写汉字笔画时序点序列的方向信息采用步骤(3)和(4)中的笔画段和连接件模型进行渲染,从而完成对笔画的美化。

【技术特征摘要】

【专利技术属性】
技术研发人员:金连文夏伟平
申请(专利权)人:华南理工大学
类型:发明
国别省市:81[中国|广州]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1