当前位置: 首页 > 专利查询>北京大学专利>正文

一种基于流形学习的汉字笔画自动提取方法技术

技术编号:16080504 阅读:26 留言:0更新日期:2017-08-25 15:46
本发明专利技术提供一种基于流形学习的汉字笔画自动提取方法,属于人工智能、计算机图形学领域。该方法通过构建汉字骨架的二维流形空间并从其中寻找风格最相似的字作为参考字来指导目标字的笔画提取。本发明专利技术可以解决基于数据驱动的笔画自动提取方法中参考字与目标字风格差异太大的问题,有效提高了汉字笔画提取的准确率。

【技术实现步骤摘要】
一种基于流形学习的汉字笔画自动提取方法
本专利技术提供一种面向汉字的笔画自动提取算法,具体涉及字体骨架流形的建立,在流形中寻找与目标字形最相似的模板,以及根据模板对字形进行笔画自动提取,属于人工智能、计算机图形学领域。
技术介绍
图形切分是计算机图形学和计算机视觉领域中最重要的研究问题之一。对于汉字字形而言,汉字是由笔画构成的,且笔画是组成汉字的最小基本单位,所以一个字形通常会按照笔画级别进行切分,汉字字形切分又被称为汉字笔画提取。汉字笔画提取技术是汉字识别、书写风格分析以及合成新字体等领域的关键步骤。然而,目前在学术界并没有很好地解决汉字笔画自动提取技术难题,主要原因在于汉字结构的复杂性以及多样性。一个复杂的汉字会有多个笔画交叉、粘连在一起,即使人工手动提取也会费时费力。现有的汉字笔画自动提取技术基本可以分为两类:无监督方法和基于数据驱动的方法。在无监督方法中,Wang(WANGX.,LIANGX.,SUNL.,LIUM.:Triangularmeshbasedstrokesegmentationforchinesecalligraphy.InDocumentAnalysisandRecognition(ICDAR),201312thInternationalConferenceon(2013),IEEE,pp.1155–1159.)首先提取出字形的轮廓,然后将轮廓进行三角网格剖分,根据三角网格的不同特征得到模糊区域和小笔画段,最后通过分析笔画段之间的连通性将小笔画段连接成完整的笔画。无监督的笔画自动提取方法存在一个固有缺陷,就是只能提取简单笔画,无法提取出类似于竖弯钩这样的复杂笔画。而基于数据驱动的方法则通过使用参考笔画信息有效地解决了这个问题,并且能够保持笔画的原有顺序。Chen(CHENX.,LIANZ.,TANGY.,XIAOJ.:Abenchmarkforstrokeextractionofchinesecharacters.ActaScientiarumNaturaliumUniversitatisPekinensis(2016)),Lian(LIANZ.,ZHAOB.,XIAOJ.:Automaticgenerationoflargescalehandwritingfontsviastylelearning.InSIGGRAPHASIA2016TechnicalBriefs(2016),ACM),Wang(WANGC.,LIANZ.,TANGY.,XIAOJ.:AutomaticcorrespondencefindingforChinesecharactersusinggraphmatching.InImageandGraphics(ICIG),2013SeventhInternationalConferenceon(2013),IEEE,pp.545–550.)等人使用一套源自方正公司的含有独立笔画信息的GB2312楷体交叉字库作为参考模型,然后将参考字的骨架上的关键点和目标字的骨架上的关键点进行点集匹配,根据点集匹配结果提取出最终的笔画。基于数据驱动的汉字笔画自动提取方法,其笔画提取结果的有效性很大程度上取决于骨架上的关键点的点集匹配准确率。然而字体风格多样,同一个字的结构和形状在不同字体中可能相差很大,导致点集匹配算法的准确率不高,使得现有的方法在处理与标准楷体风格相差很大的字体问题上效果不佳。
技术实现思路
本专利技术涉及的术语如下:参考字:基于数据驱动的汉字笔画自动提取方法中,作为参考的汉字图像,包含其每一个笔画的图像和位置,以及每一个笔画对应的笔顺;目标汉字:用户输入的汉字图像(二值图);骨架点:对字形或笔画二值图采用细化算法得到的骨架上的所有像素点;骨架上的关键点:笔画骨架上位于三种关键位置的骨架点,即笔画骨架点中的起点、终点和拐点;本专利技术的目的是提供一种基于流形学习的汉字笔画自动提取方法,通过构建汉字骨架的二维流形空间并从其中寻找风格最相似的字作为参考字来指导目标字的笔画提取,用以解决现有的数据驱动方法中参考字与目标字的字体风格相差太大的问题。本专利技术的方法包括如下步骤:A目标汉字图片输入;B.构造汉字骨架流形,实现方法为:B1.选取30种左右的风格各异的字体的字形二值图,离线提取出每一个字中每一个笔画的骨架上的关键点;B2.离线搭建标准汉字笔画模型库,其中包括了339个种类的笔画信息,通过人工标注得到每一类笔画的骨架,以及骨架上的关键点(起点、终点、拐点);B3.对于B1中每一个字形的每一个笔画,找到B2中的标准笔画模型库中对应的笔画模型,然后采用一致性点集漂移算法(CPD--CoherentPointDrift)(Myronenko,A.,Song,X.Pointsetregistration:Coherentpointdrift.IEEETransactionsonPatternAnalysisandMachineIntelligence.2010:32(12),2262–2275),将B1中的笔画骨架上的关键点与B2中的标准笔画模型骨架上的关键点进行点集注册操作,然后根据点集注册结果得到B1中每个笔画骨架上的关键点;B4.经过B3步骤之后,将B1中每个笔画的骨架在相邻的关键点之间均匀采样,以保证骨架点个数与对应笔画模型中的骨架点个数一致,从而B1中不同字体的同一个汉字字符对应的字形笔画骨架点彼此之间一一对应,并且也和B2中笔画模型的骨架点一一对应;B5.由于满足一一对应关系,对于每一个字符构造一个矩阵,首先将B1中每一个字形图片大小都归一化至500*500,然后每一个字体该字符对应的字形笔画的骨架点按笔顺放在一起作为该矩阵中的一个行向量,即矩阵中每一行表示一种字体风格,每一列表示不同字体之间一一对应的每一个笔画的骨架点。B6.将该矩阵作为训练数据进行流行学习,得到汉字骨架流形。作为一种优选方案,这里将该矩阵输入到GP-LVM(LAWRENCEN.:Probabilisticnon-linearprincipalcomponentanalysiswithgaussianprocesslatentvariablemodels.JournalofMachineLearningResearch6,Nov(2005),1783–1816.)模型中进行降维操作,最终降到二维空间。C.从汉字骨架流形中寻找与目标字风格最相似的字形作为参考字;C1预处理,即先将目标字归一化,再通过细化算法得到其骨架;C2计算目标字和流形中已有字体的骨架方向网格特征(JINL.W.,GAOX.:Studyofseveralhandwrittenchinesecharacterdirectionalfeatureextractionapproaches.ApplicationResearchofComputers21,11(2004),38–40.),然后计算特征相似度;C3选取特征相似度最大的字体作为流形中遍历的起点,在该点附近不断遍历,并计算遍历的每一个由流形生成的新的字形骨架与目标字的骨架方向网格特征相似度,遍历完毕后选取特征相似度最大的作为参考字。D.对目标汉字和参考字进行骨架点的点集注册,本文档来自技高网
...
一种基于流形学习的汉字笔画自动提取方法

【技术保护点】
一种基于流形学习的汉字笔画自动提取方法,包括如下步骤:A目标汉字图片输入;B.构造汉字骨架流形,具体步骤包括:B1.选取不同字体的字形二值图,离线提取出每一个字中每一个笔画的骨架上的关键点;B2.离线搭建标准汉字笔画模型库,通过人工标注得到每一类笔画的骨架,以及骨架上的关键点;B3.对于B1中每一个字形的每一个笔画,找到B2中的标准笔画模型库中对应的笔画模型,将B1中的笔画骨架上的关键点与B2中的标准笔画对应的骨架上的关键点进行点集注册操作,然后根据点集注册结果得到B1中每个笔画骨架上的关键点;B4.将B1中每个笔画的骨架在相邻的关键点之间均匀采样,以保证骨架点的个数与B2中的标准笔画模型中骨架点的个数一致,从而B1中不同字体的同一个汉字字符对应字形的笔画骨架点彼此之间一一对应,并且也和B2中的标准笔画模型库的骨架点一一对应;B5.由于满足一一对应关系,对于每一个字符构造一个矩阵,首先将B1中每一个字形图片大小都归一化至500*500,然后每一个字体对应的字形笔画骨架点按笔顺放在一起作为该矩阵中的一个行向量,上述矩阵中每一行表示一种字体风格,每一列表示不同字体之间一一对应的每一个笔画骨架点;B6.将该矩阵作为训练数据进行流行学习,得到汉字骨架流形;C从汉字骨架流形中寻找与目标汉字相似的字形作为参考字;D对目标汉字和参考字进行骨架点的点集注册,提取出目标汉字每一个笔画的骨架;E通过提取目标汉字对应的轮廓,并填充轮廓得到目标汉字的笔画。...

【技术特征摘要】
1.一种基于流形学习的汉字笔画自动提取方法,包括如下步骤:A目标汉字图片输入;B.构造汉字骨架流形,具体步骤包括:B1.选取不同字体的字形二值图,离线提取出每一个字中每一个笔画的骨架上的关键点;B2.离线搭建标准汉字笔画模型库,通过人工标注得到每一类笔画的骨架,以及骨架上的关键点;B3.对于B1中每一个字形的每一个笔画,找到B2中的标准笔画模型库中对应的笔画模型,将B1中的笔画骨架上的关键点与B2中的标准笔画对应的骨架上的关键点进行点集注册操作,然后根据点集注册结果得到B1中每个笔画骨架上的关键点;B4.将B1中每个笔画的骨架在相邻的关键点之间均匀采样,以保证骨架点的个数与B2中的标准笔画模型中骨架点的个数一致,从而B1中不同字体的同一个汉字字符对应字形的笔画骨架点彼此之间一一对应,并且也和B2中的标准笔画模型库的骨架点一一对应;B5.由于满足一一对应关系,对于每一个字符构造一个矩阵,首先将B1中每一个字形图片大小都归一化至500*500,然后每一个字体对应的字形笔画骨架点按笔顺放在一起作为该矩阵中的一个行向量,上述矩阵中每一行表示一种字体风格,每一列表示不同字体之间一一对应的每一个笔画骨架点;B6.将该矩阵作为训练数据进行流行学习,得到汉字骨架流形;C从汉字骨架流形中寻找与目标汉字相似的字形作为参考字;D对目标汉字和参考字进行骨架点的点集注册,提取出目标汉字每一个笔画的骨架;E通过提取目标汉字对应的轮廓,并填充轮廓得到目标汉字的笔画。2.如权利要求1所述的基于流形学习的汉字笔画自...

【专利技术属性】
技术研发人员:陈旭东连宙辉唐英敏肖建国
申请(专利权)人:北京大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1