一种基于笔画的汉字图像修复方法技术

技术编号:8413473 阅读:219 留言:0更新日期:2013-03-14 02:19
一种基于笔画的汉字图像修复方法,属于计算机虚拟现实技术和机器视觉领域,将修复汉字所用到的信息限定在本图像或与其同源的几张图像中。在修复汉字前先将图像中为损坏的汉字分解为笔画。然后建立一个包含汉字及其笔画的模板集合。修复汉字时,提取损坏汉字的未损坏部分汉字或笔画的轮廓,利用部分轮廓匹配的方法,在笔画集合找到剩余轮廓的对应轮廓段,进而由对应轮廓段确定对应的可能笔画,然后从可能的相似笔画中选出与原笔画最可能相似的笔画,最后根据对应模板去恢复汉字损坏部分并修复相应的图像部分。本发明专利技术相比其它图像修复的方法,本发明专利技术能够较好的恢复汉字损坏部分的结构信息。

【技术实现步骤摘要】

本专利技术属于虚拟现实技术和计算机视觉领域,特别是涉及图像修复和汉字笔画提取。
技术介绍
图像修复技术是图像恢复技术一个重要分支,应用于古籍、古画等文物保护和破损修复,是一种对受损图像进行修改的技术。图像修复技术的发展方向主要有两个。一是从图像修补的含义本身出发,即对图像上细小的斑点、划痕的修补,但不能修补大面积的纹理区域。该分向的大部分图像修复模型都是基于偏微分方程或变分问题。基于变分问题的修复模型具有良好的理论基础,但是修复图像不自然,选定的目标区域轮廓明显。而用基于偏微分方程的方法来修复图片上大面积的空白区域时会产生严重的模糊现象。二是对于大 区域的修补,这类方法主要是基于样本的图像修复方法和纹理合成技术,有效的避免了模糊现象的发生。利用图像的纹理信息来引导纹理合成的过程,有效地提高了图像的修复质量,保持了图像结构纹理。而这种方法的主要问题主要是在损坏区域的结构信息恢复上。如Criminisi等人的基于样例(example-based)的图像修复方法,他们利用受损区域周围信息的isophote方向和发线方向为待修复区域块设置优先值,优先级大的部分将优先被修复,优先级小的像素将押后修复,这些优先级记录在一张表中。在修复中通过不断的更新表中的各像素优先级来引导修复的优先次序,以达到保持图像在该部分结构连续的目的。但是这种方法只能保持线性(如直线)结构,对于曲线结构(如物体的轮廓)效果难以人满意。为解决这一问题,Sun等人提出了一种基于结构传播(structure propagation)的图像修复方法。在这种方法中,首先由用户通过添加辅助线的方式指定图像中损坏区域周围结构在损坏区域延伸的方式,即根据人的经验喜好等画出损坏区域的结构线(损坏物体的部分轮廓),并且这些曲线经过外围的结构。添加完辅助线以后将损坏区域周围的结构信息沿辅助线“传播”到损坏区域内,即结构传播。在结构传播完成后再利用纹理合成的方法修复剩余的区域。这种方法在一定程度上解决了纹理方法中结构恢复的问题,缺点是需加入人工交互。为了使修复后对图像更加自然、顺畅。Hays等人采用建立图像集的办法,来寻找损害区域可能的信息。这种方法在修复图像时,要从数以百万的图像中匹配到和损坏图像可能相似的图像,然后利用该图像对应部分来填补图像损坏区域。这种方法有点是在找到匹配的图像时,能够有效恢复原图像丢失部分(填补的信息与周围信息兼容)。缺点是修复结构依赖于图像库,且匹配相似图像的过程十分的耗时间。对于汉字图像(如书法,碑文等)来说,最要的便是其结构特征(如轮廓信息等)。修复汉字的图像主要的便是恢复损坏部分结构信息,采用添加辅助线的方法需要过多的人工干预,且非专业人士难以正确的添加辅助线(恢复汉字的轮廓)。采用汉字集的办法,难点在于很多书法和碑文只有少量的可用样本(很多书法家留下的笔墨并不多),无法建立有效的样本,以至于在匹配时找不到合适的修复样本,而导致修复错误或不符合汉字构型相关知识。
技术实现思路
本专利技术技术解决问题克服现有图像技术无法有效恢复图像损坏部分结构信息的缺点,提供,解决了图像修复难以恢复损坏区域结构信息的缺点,能够有效对汉字图像进行修复。本专利技术所采用的技术方案是,其特征在于如下步骤步骤I、将图像中未损坏汉字分解为汉字基本组成元素笔画,并将原汉字中的部件和得到的笔画的轮廓放在一起,建立一个用于修复的笔画模板集合,集合中的笔画称为模板笔画,部件称为模板部件;步骤2、在修复损坏汉字时,获得损坏汉字图像中待修复区域周围的笔画轮廓段, 对这些轮廓段进行形状描述,即建立用于表示轮廓点之间关系的点与点间连线夹角的矩阵,然后采用部分轮廓匹配方法在笔画模板集合中找到轮廓段的在模板笔画或部件上的对应轮廓段,由这些对应轮廓段确定可能的相似笔画作为候选笔画;步骤3、一个候选的相似笔画包含多个对应轮廓段,采用K-相邻段,即KAS的方法描述由对应轮廓表示的候选笔画,然后与同样由KAS表示的损坏笔画,找出与损坏笔画最相似的笔画;步骤4、利用找到的最相似的笔画或部件去恢复汉字对应的损坏部分,并利用图像修复的方法恢复相应的图像纹理部分。所述步骤I中笔画提取的步骤如下(I. I)输入汉字图像,提取汉字的轮廓,利用均匀采用与关键采样相结合的方法获得轮廓的采样点表示;(I. 2)以轮廓的采样点为点集,进行受约束的Delaunay三角化,建立汉字的三角网格表示;(I. 3)根据三角网格中三角形中内边的数目将三角形分为三类末端三角形、正规三角形和连接三角形,合并相邻的连接三角形,得到汉字交联区域即模糊区域的多边形表示;(I. 4)检测完汉字的交联区域后,汉字被分为两部分笔画段和交联区域,以笔画段和交联区域为节点,以笔画段和交联区域连接关系为边建立汉字的图表示;(I. 5)提取笔画段的特征,分析与同一个交联区域相连的笔画段的连续性,如果两个笔画段Vi和 ' 在交联区域Vn连续,那么在图中两个笔画段节点Vi和 ' 通过交联区域连通Vn,即图中存在由Vi经过Vn到Vj的一条路径;(I. 6)搜索图中由一个端点到另一个端点的连通路径,图中的每一连通的路径表示一个笔画,利用B-样条方法恢复笔画连接部分,形成笔画;(I. 7)将提取的笔画和构成原汉字的连通域部件的轮廓放在一起,组成一个用于修复的笔画模板的集合,集合中的笔画称为模板笔画,部件称为模板部件。所述步骤2中部分轮廓匹配方法的实现步骤如下(2. I)获得损坏汉字中损坏区域周围的轮廓段,建立每个轮廓段进行形状描述矩阵A。,其元素为% =A(P1PpPiPB), Pi、Pj和是轮廓中的三点,a Jj是三点连线的夹角;(2.2)建立模板集合中各模板笔画和部件轮廓的形状描述矩阵Ai,其元素为 =<·{Ρ,Ρ: }Ρ \),Pi、Pj和Ρ」-δ是轮廓中的三点,a ij是三点连线的夹角;(2. 3)采用积分图的方法去计算矩阵Atl和Ai中相似的矩阵块,每个矩阵块代表相应的轮廓段;(2. 4)调节轮廓段表示点的数目,改变匹配的尺度,继续匹配,找到尺度范围内的最佳匹配块,即对应轮廓段,其中a为常数,可取值a = 5。本专利技术与现有技术相比的有益效果在于本专利技术在图像修复技术的基础上,加入 对汉字结构的分析,首先从笔画的层次上通过寻找相似笔画的方法去恢复汉字损坏部分的结构信息。在恢复汉字结构后,在采用结构传播的图像修复方法,去恢复丢失部分的图像信息。避免了图像修复方法无法恢复恢复损坏部分结构的缺点,能够有效对汉字图像进行修复。附图说明图I是本专利技术的整体过程示意图;图2是本专利技术的笔画提取中汉字三角化表示和交联区域图;图3是本专利技术的笔画提取中的汉字图模型表示示意图;图4是本明的汉字修复中损坏笔画匹配示意图;图5是本专利技术的笔画提取的部分结果图;图6是本专利技术的汉字修复结果示意图,其中(a)是在笔画模板集合中含有损坏笔画时的修复结果;(b)是在笔画模板集合中含有相似但不相同笔画时的修复结果;(C)是在笔画模板集合中只含有部分相似笔画的修复结果。具体实施例方式下面结合附图与实施例对本专利技术作进一步详细描述本专利技术实施过程包括四个主要步骤笔画提取,部分轮廓破匹配,相似笔画确定和汉字图像修复。如图I所示。步骤一、笔画提取,主要分为两个阶段,七个基本步骤第一个阶段基本文档来自技高网
...

【技术保护点】
一种基于笔画的汉字图像修复方法,其特征在于步骤如下:步骤1、将图像中未损坏汉字分解为汉字基本组成元素笔画,并将原汉字中的部件和得到的笔画的轮廓放在一起,建立一个用于修复的笔画模板集合,集合中的笔画称为模板笔画,部件称为模板部件;步骤2、在修复损坏汉字时,获得损坏汉字图像中待修复区域周围的笔画轮廓段,对这些轮廓段进行形状描述,即建立用于表示轮廓点之间关系的点与点间连线夹角的矩阵,然后采用部分轮廓匹配方法在笔画模板集合中找到轮廓段的在模板笔画或部件上的对应轮廓段,由这些对应轮廓段确定可能的相似笔画作为候选笔画;步骤3、一个候选的相似笔画包含多个对应轮廓段,采用K?相邻段,即KAS的方法描述由对应轮廓表示的候选笔画,然后与同样由KAS表示的损坏笔画,找出与损坏笔画最相似的笔画;步骤4、利用找到的最相似的笔画或部件去恢复汉字对应的损坏部分,并利用图像修复的方法恢复相应的图像纹理部分。

【技术特征摘要】

【专利技术属性】
技术研发人员:梁晓辉王晓卿孙林嘉
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1