一种书法作品中单字笔画的提取方法技术

技术编号:12134359 阅读:116 留言:0更新日期:2015-09-30 15:07
本发明专利技术公开了一种书法作品中单字笔画的提取方法,通过采用骨架爬虫单元获取书法作品中单字的骨架笔画,计算书法作品中原单字的各笔画的笔画宽度、获取骨架笔画轮廓的最小包围区,分析不同类型骨架交叉点与笔画轮廓最小包围区的关系、定位共享区及确定共享区的类型,根据共享区的类型及骨架笔画轮廓的最小包围区,完成笔画的提取。本发明专利技术能够为基于笔画的书法字识别、书法风格比较、书法作品真伪鉴别奠定基础。采用本发明专利技术提供的算法,能够完整提取书法作品中的单字笔画,为基于笔画的书法字分类、识别、重构、动画仿真等相关研究及应用提供笔画提取方法。

【技术实现步骤摘要】

本专利技术设及一种文字图像处理方法,具体设及一种书法作品中单字笔画的提取方 法。
技术介绍
笔画是组成和表征文字的基本元素,是文字分类、识别和检索的基础。汉文由笔画 和部首构成,从上及下、从左到右书写,W二维的方式排列。文字的分类和识别一般是W笔 画元素为基础。书法是一种手写体,西方书法用扁平笔书写,中国的书法通常用毛笔写,都 仍在教学实用中。汉字书法最大的特点在于:书法的笔画不像打印体那样:横平竖直,且每 个笔画或字母都是有固定模板的。汉字的毛笔书法,不仅每个笔画粗细不同,而且即使同一 个笔画的粗细也是不同的;除了笔画变形之外,笔画之间还会有打印体所没有的粘连。该些 变化给笔画提取带来困难,然而正是该些笔画上的信息变化,承载着书法最重要的独特信 息,是分类的依据,是书法笔画成为书写过程重现、书法风格识别的基础。 书法笔画是实现书体风格的建模、风格的表达与分类、书法风格的发现、书法书写 过程的重现、书法作品创作、书法临摹过程交互式动画、W及书法作品真伪检测的基础。上 述几项书法研究都是基于书法笔画。对于打印体汉字而言,汉字的笔画组成都是标准的、一 致的。书法,尤其是历史书法字,其笔画变化复杂多变,针对历史书法字笔画的获取和表达 存在较多的空白。本专利技术基于汉字书写规律,提出用笔画爬虫方法探测和提取基本的骨架 笔画,再结合轮廓信息,提取有笔画宽度的书法笔画。
技术实现思路
本专利技术的目的在于提供,通过采用骨架爬虫 单元获取书法作品中单字的骨架笔画,计算书法作品中原单字的各笔画的笔画宽度、获取 骨架笔画轮廓的最小包围区,分析不同类型骨架交叉点与笔画轮廓最小包围区的关系、定 位共享区及确定共享区的类型,根据共享区的类型及骨架笔画轮廓的最小包围区,完成笔 画的提取。本专利技术能够为基于笔画的书法字识别、书法风格比较、书法作品真伪鉴别奠定基 础。 为了达到上述目的,本专利技术通过W下技术方案实现: -种书法作品中单字笔画的提取方法,该提取方法包含; S1,采用骨架爬虫单元获取书法作品中单字的骨架笔画; S2,计算书法作品中原单字的各笔画的笔画宽度,获取所述步骤S1中骨架笔画轮 廓的最小包围区; S3,分析不同类型骨架交叉点与笔画轮廓最小包围区的关系,定位共享区及确定 共享区的类型; S4,根据所述共享区的类型及骨架笔画轮廓的最小包围区,完成笔画的提取。 优选地,所述步骤S1包含: SI. 1,对书法作品图像进行处理,对书法作品中单字进行骨架提取、轮廓提取; S1. 2,扫描单字骨架的所有骨架像素点,计算每个骨架像素点周边八个邻域内其 他骨架像素点的个数N进行分类;当N = 1时,该骨架像素点为端点;当N〉2时,该骨架像素 点为交叉点;当N = 2时,该骨架像素点为普通点;计算端点集合为s6、交叉点集合为sS S1. 3,在端点集合s6中任选一个端点处作为骨架爬虫的起始点,控制骨架爬虫单 元沿该端点开始的骨架点爬行,记录爬行过的所有骨架像素点; S1. 4当骨架爬虫单元爬行至交叉点时,暂停该骨架爬虫单元,进行路径选择的计 算;根据该交叉点相邻周边邻域内骨架像素点的个数N,控制N个试探爬虫单元m亥交叉点 为起点,相交的对应N个骨架像素点爬行,直至遇到如下情况之一时,试探爬虫单元停止爬 行: a.试探爬虫单元遇到骨架端点;b.试探爬虫单元的爬行距离达到阔值th ; 当所有试探爬虫单元终止爬行后,计算它们的爬行路径,选择与原暂停骨架爬虫 单元爬行方向最接近的路径;若该路径与原骨架爬虫单元路径的夹角大于90°,则终止原 暂停骨架爬虫单元;否则重新启动暂停的骨架爬虫单元,使其沿试探爬虫单元得到的最接 近的方向继续爬行,并记录爬行过的所有骨架像素点; S1. 5,对于端点集合s6中其他端点重复所述步骤S1. 3直至所述骨架爬虫单元爬 行过所有端点集合s?中端点,完成由端点起止的骨架笔画提取后,执行步骤S1. 6 ; S1. 6,获取所有未被所述骨架爬虫单元爬行过的剩余骨架像素点,当获取的像素 点个数大于3时,重新执行所述步骤S1. 2,重新计算端点,形成集合st; 重复执行所述步骤S1. 3-S1. 5,直至所获取的剩余骨架像素点个数小于等于3个 时,跳转至步骤S1. 7; S1. 7,扫描所有提取得到的笔画,计算所有笔画的平均长度及笔画长度标准差 〇1;并剔除任何笔画中笔画长度小于长度阔值y 1-3 〇1的毛刺笔画; S1. 8,扫描所有提取得到的笔画,将满足合并条件的笔画进行合并。 优选地,所述步骤S1中还包含: 当单字骨架中出现环形笔画时,即所有未被所述骨架爬行虫单元爬行过的骨架像 素点均为普通点时,控制该骨架爬行虫单元随机取一点作为端点,执行所述步骤S1. 4 ;优选地,所述步骤S1.7包含:[002引提取第i笔的笔画segi=巧1,Ei,Snake;},其中町,Ei分别为该笔画的起始点和 终止点,Snakei= {c1,C,,. . .,C。}为所述骨架爬虫单元爬过的该骨架笔画中的其他骨架点 转换的代码序列,当满足如下条件时: segi= (I Snake J < y 1-301,BiG S e|EiG S e}; 其中,I Snake; I为笔画链码长度; 第i笔的笔画为毛刺笔画,将该第i笔的笔画剔除。 优选地,所述步骤S1. 8包含: 当第i笔的笔画的走势与第j笔的笔画的走势相同,并且第i笔的笔画的终止点 与第j笔的笔画的起始点之间的距离小于阔值,即满足如下条件时: 其中,丫-th为阔值,Type(snake)是笔画的类型判定式,Bi为第i笔的笔画的起 始点,Ej.为第j笔的笔画的终止点;若 snakei= {c 而…Cj...},则;则将第i笔的笔画与第j笔的笔画合并;[003引当第i笔的笔画的走势与第j笔笔画的走势相反,且两端点间距离小于阔值,即满 足: 则将第i笔的笔画与第j笔的笔画合并。 优选地,所述步骤S2包含: S2. 1,根据所述步骤S1对单字进行的轮廓提取,计算骨架笔画中每一个骨架像素 点的笔画宽度屯,从而统计该笔画的平均宽度y及其标准差曰;S2. 2,根据每条笔画的平均宽度y及其标准差0,根据下式计算第i笔的笔画轮 廓最小包围区SSi;[004引其中,口某&为第i笔的笔画中第m个骨架像素点,P第i笔笔画中任一为轮廓点; 优选地,所述步骤S2. 1包含: S2.1.LW第i笔笔画的第m个骨架像素点輪ke为圆心做等角度P的M条直线, 获得M条直线中与轮廓线之间的交点(故。1,槪),计算柏产处的笔画宽度如=m化I蜗臘I,其 中k= 1,2,3, ...,M;e - M= 180° ;P班为M条直线中第k条直线与单字轮廓线相交的 第1个点;P畏为M条直线中第k条直线与单字轮廓线相交的第2个点; S2. 1. 2, W该单字为单位,获得该单字全部骨架像素点处的笔画宽度,得到集合sd =化,d2,...,cU,其中Num为该书法字骨架像素点数目,计算该集合的均值y与标准差 0〇[004引优选地,所述步骤S3包含: S3. 1,对该单字的交叉点集合sf使用基于密度的聚类算法进行聚类形成交叉点类 集合sf%并使用交叉点类集合sft聚类中屯、瑞隶征共享区;[005。S3. 2,对所述本文档来自技高网...
一种书法作品中单字笔画的提取方法

【技术保护点】
一种书法作品中单字笔画的提取方法,其特征在于,该提取方法包含:S1,采用骨架爬虫单元获取书法作品中单字的骨架笔画;S2,计算书法作品中原单字的各笔画的笔画宽度,获取所述步骤S1中骨架笔画轮廓的最小包围区;S3,分析不同类型骨架交叉点与笔画轮廓最小包围区的关系,定位共享区及确定共享区的类型;S4,根据所述共享区的类型及骨架笔画轮廓的最小包围区,完成笔画的提取。

【技术特征摘要】

【专利技术属性】
技术研发人员:章夏芬刘佳岩
申请(专利权)人:上海海事大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1