甲骨拓片字形的计算机辅助复原方法技术

技术编号:4013596 阅读:338 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种甲骨拓片字形的计算机辅助复原方法,该方法包括将纸稿上的甲骨拓片字形扫描下来,存进电脑;对扫描的图像大小进行调整,进行二值化处理;通过计算甲骨拓片上各连通区域的面积以及具有相同面积的连通区域的数量,获得甲骨拓片上连通区域的分布特征,计算连通区域面积的数学期望,对区域面积进行识别处理,计算甲骨拓片字形轮廓的特征点,通过特征点计算字形笔段的端点,通过笔段的端点,区分不同的笔段;对甲骨拓片字形的各笔段进行压缩变换;计算甲骨拓片字形各笔段的分形维数。省时省力,方便快捷,复原效果好。适用于甲骨文拓片字形的复原。

【技术实现步骤摘要】

本专利技术涉及一种甲骨文拓片字形的复原方法。
技术介绍
甲骨文是契刻在较硬的龟甲和兽骨上的文字,因此刻出的笔划线条瘦劲挺直,两 端尖锐,转折处往往以两条直线相接成屈折状,形成方笔。由于龟甲和兽骨质地本身并非平 滑如镜,又深埋地下经历了几千年的岁月沧桑,由于受到腐蚀、发掘损坏和运输的污损,导 致甲骨上有许多噪声点,字形的边缘已经非常模糊,已经失去了原始面貌,如图1、图2、图3 所示,图4是甲骨拓片图像的轮廓图。这样受污损的字形无法在建设甲骨文字库以及数字图书馆中进一步使用,而且由 于字形受到腐蚀污染,字形边缘已经变得非常模糊,对于甲骨文字形的识读和研究带来极 大不便,因而非常需要对甲骨拓片上的字形进行复原。以往在甲骨拓片字形图像的处理过程中,通常是利用图像处理软件进行手工修 复。但是,目前的图像处理软件并不是针对甲骨拓片字形进行设计的,没有分析甲骨拓片噪 声区域和字形边缘的特征,对于像龟甲和兽骨这种书写材料比较特殊、污染原因多样化以 及埋藏时间漫长的甲骨字形缺乏针对性,其修复过程完全依靠非常繁重的手工交互劳动, 而且需要具有丰富经验的专业人员操作,非常耗时耗力。
技术实现思路
为了克服利用图像处理软件修复方法的耗时耗力的缺陷,本专利技术提供一种甲骨拓 片字形的计算机辅助复原方法,该计算机辅助复原方法,省时省力,方便快捷,复原效果好。本专利技术的技术方案是包括以下步骤(1)利用数字扫描仪,将纸稿上的甲骨拓片字形扫描下来,存储进电脑中;(2)对扫描得到的图像大小进行调整,对图像进行二值化处理;(3)通过计算甲骨拓片上各连通区域的面积以及具有相同面积的连通区域的数 量,获得甲骨拓片上连通区域的分布特征,这些连通区域的面积服从泊松分布;计算连通区 域面积的数学期望,对区域面积进行识别处理。根据连通区域面积与面积期望的差值判定 噪声区域和字形笔划区域,将面积小于期望的区域判定为噪声区域,并被填充,从而去除噪 声区域,保留字形区域。(4)计算甲骨拓片字形轮廓的特征点,通过特征点计算字形笔段的端点,通过笔段 的端点,区分不同的笔段。特征点的提取如下所示θ = arc cos (V1 ‘ V2/|Vj |V2|) θ≤π 上式中,θ为字形轮廓上每一点?1与相邻点Ρη、Ρμ形成的向量义、%之间的夹 角。考虑到用户的不同需求,我们设计了交互功能,让用户可以自行设置不同的角度阈值Μ, 当两向量的夹角θ < M时,系统就认SPi是特征点。笔段端点的提取方法与特征点的提取方法类似。如下所示 上式中,α为字形轮廓上每一特征点Fi与相邻特征点Fm、Fi+1形成的向量N” V2 之间的夹角。可以设置不同的角度阈值T,当偏移角度α < T时,系统就认为Fi是笔段的 端点。(5)对甲骨拓片字形的各笔段进行压缩变换。以笔段的首尾两个端点的连线建立X轴,过其中一端点垂直于端点连线建立Y轴, 建立平面直角坐标系。在对字形轮廓上的特征点进行压缩变换操作时,为了既对字形边缘 进行平滑,同时又保持甲骨拓片字形笔划的基本走向和基本形状,对特征点的坐标与其相 邻特征点的坐标进行加权处理,用矩阵表示如下 Pi+2 (xi+2, yi+2) >Pi+1 (xi+1, yi+1) ^Pi-: (Xi-i; Y^1) >Pi-2 (x^, Y^2)是 Pi (XiJi)相邻的四个 特征点,界^ +^^^界^分别是特征点?^?^?^?^汴^的坐标权值,P' ^x'y' 0是特征点PiUi, Yi)经过加权变换后的坐标点。(6)计算甲骨拓片字形各笔段的分形维数。如果分形维数小于设定的阈值,则程序 输出图像,否则继续对字形边缘进行压缩变换,直到字形边缘的分形维数符合设定的阈值 要求。本专利技术的优点省时省力,方便快捷,复原效果好。(1)具备图像处理去噪功能。甲骨拓片上的噪声区域是由于受到腐蚀以及发掘过程中的污损引起的,通过分析 甲骨拓片上各连通区域面积的统计分布特征,利用泊松分布的统计特征计算连通区域面积 的数学期望,通过计算期望与区域面积的差值判定噪声区域和字形笔划区域。将小于面积 期望的连通区域判定为噪声区域,进行填充,从而去除噪声。将大于面积期望的连通区域判 定为字形笔划区域,予以保留。反复进行上述操作,直到甲骨拓片连通区域面积的数学期望 大于设定的阈值为止。通过上述操作,噪声区域被去除,保留了字形笔划区域。(2)可以实现对甲骨拓片字形边缘的自动平滑处理。甲骨文字形的笔划多种多样,同样的笔划又具有很多种不同的书写形式,需要针 对不同的笔段分别进行压缩变换处理,从而得到接近甲骨文字形真实形态的字形。通过对 各个笔段进行压缩变换,就可以对甲骨拓片字形的边缘进行平滑。对笔段进行压缩变换,首 先要找到笔段的位置。字形轮廓边缘弯曲角度比较剧烈的地方,我们称之为特征点,通过轮 廓的特征点计算笔段的端点,从而找到笔段的位置。因此,只要能够提取出甲骨文字形轮廓 上的端点,就能够找到笔段的位置。通过计算找出甲骨拓片字形的特征点,然后利用特征点找到甲骨拓片字形笔段的 端点,通过字形笔划的端点,区分不同的笔段,实现对各笔段的平滑处理。通过对各笔段的 平滑处理,从而获得边缘得到平滑的甲骨拓片字形。(3)通过计算分形维数,可以设定字形边缘平滑程度。龟甲和兽骨上的甲骨文字形由于受到腐蚀,字形边缘出现锯齿形状,呈现分形特 征。在对字形的不同笔段进行平滑处理的过程中,可以预先设定笔段分形维数的阈值,从而 设定对字形边缘进行平滑的程度。通过本专利技术处理后,原来甲骨拓片上的噪声区域被去除,甲骨文字形的笔划边缘 被平滑,不再有锯齿形状,得到的甲骨文字形接近原始面貌,从而方便甲骨文研究学者对甲 骨文字形的辨识和研究,极大地改进甲骨学研究手段,促进甲骨学的发展,也有利于甲骨文 字库的建设以及在数字图书馆中的使用,使甲骨文能够借助数字网络为大众所共享。附图说明 图1是《甲骨文合集》(中华书局,1979-1983年)559 (正面)。图2是图1之局部放大。图3是图2经过二值化处理的图像。图4是图3的轮廓图。图5是图4中连通区域面积分布特征图。图6是图4中连通区域概率密度。图7是甲骨拓片字形计算机辅助复原系统的界面图。图8是图3去除噪声点的图像。图9是图8中字形右上角边缘的分形特征示意图。图10是字形边缘平滑示意图。图11是图8中字形边缘经过平滑的字形图像。具体实施例方式本专利技术提出的对甲骨拓片上的字形进行计算机辅助复原方法包括以下步骤(1)电脑与数字扫描仪连接,通过数字扫描仪将纸稿上的甲骨拓片图片扫描进电 脑,通过图像处理软件将甲骨拓片字形分割出来,并对甲骨拓片字形图像的高度进行调整, 将图像处理为高度为512像素的二值图像。(2)甲骨拓片字形的计算机辅助复原系统界面如图7所示,利用其去噪功能,将拓 片图像中的噪声点去除。采用基于泊松分布的区域填充的去噪方法,包括以下步骤1)通过计算甲骨拓片上各连通区域的面积以及具有相同面积的连通区域的数量, 获得甲骨拓片上连通区域的概率密度特征,得到连通区域的面积在统计上的泊松分布特 征。甲骨拓片上的噪声点具有如下特征1)噪声区域的亮度低于字形笔划的亮度;2) 噪声区域呈离散状态,连通区域面积较小,区域面积服从泊松分布。以高度512像素、宽度320像素本文档来自技高网...

【技术保护点】
一种甲骨拓片字形的计算机辅助复原方法,其特征在于该方法包括以下步骤:(1)利用数字扫描仪,将纸稿上的甲骨拓片字形扫描下来,存储进电脑中;(2)对扫描得到的图像大小进行调整,对图像进行二值化处理;(3)通过计算甲骨拓片上各连通区域的面积以及具有相同面积的连通区域的数量,获得甲骨拓片上连通区域的分布特征,这些连通区域的面积服从泊松分布,计算连通区域面积的数学期望,对连通区域的面积进行识别处理,根据连通区域面积与面积期望的差值判定噪声区域和字形笔划区域,将面积小于期望的区域判定为噪声区域,并被填充,从而去除噪声区域,保留字形区域;(4)计算甲骨拓片字形轮廓的特征点,通过特征点计算字形笔段的端点,通过笔段的端点,区分不同的笔段,特征点的提取如下所示:θ=arccos(V↓[1].V↓[2]/|V↓[1]||V↓[2]|)θ≤π设置角度阈值M,当两向量的夹角θ<M时,系统就认为Pi是特征点,笔段端点的提取如下所示:α=arccos(V↓[1].V↓[2]/|V↓[1]||V↓[2])α≤π设置角度阈值T,当偏移角度α<T时,系统就认为F↓[i]是笔段的端点;(5)对甲骨拓片字形的各笔段进行压缩变换,以笔段的首尾两个端点的连线建立X轴,过其中一端点垂直于端点连线建立Y轴,建立平面直角坐标系,对特征点的坐标与其相邻特征点的坐标进行加权处理,用矩阵表示如下:y↓[i]′=(y↓[i+2]y↓[i+1]y↓[i]y↓[i-1]y↓[i-2])(***)i≥2,P↓[i+2](x↓[i+2],y↓[i+2])、P↓[i+1](x↓[i+1],y↓[i+1])、P↓[i-1](x↓[i-1],y↓[i-1])、P↓[i-2](x↓[i-2],y↓[i-2])是P↓[i](x↓[i],y↓[i])相邻的四个特征点,w↓[i+2]、w↓[i+1]、w↓[i]、w↓[i-1]、w↓[i-2]分别是特征点P↓[i+2]、P↓[i+1]、P↓[i]、P↓[i-1]、P↓[i-2]的坐标权值,P′↓[i](x′↓[i],y′↓[i])是特征点P↓[i](x↓[i],y↓[i])经过加权变换后的坐标点;(6)计算甲骨拓片字形各笔段的分形维数,如果分形维数小于设定的阈值,则程序输出图像,否则继续对字形边缘进行压缩变换,直到字形边缘的分形维数符合设定的阈值要求。...

【技术特征摘要】

【专利技术属性】
技术研发人员:顾绍通杨亦鸣酆格斐
申请(专利权)人:徐州师范大学
类型:发明
国别省市:32[中国|江苏]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1