一种基于结构特征的中国书画印章图像自动提取方法技术

技术编号:3845906 阅读:265 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种基于结构特征的中国书画印章图像自动提取方法,其步骤包括:1)对输入图像进行颜色分层;2)基于连通区域的图像分割;3)基于印章结构特征的图像区域过滤;4)在输入图像中提取印章图像。本发明专利技术利用基于机器学习的中国书画颜色分层分析模型,实现了书画作品基于色层的同质区域粒度级别的图像分割。在此基础上提出了一种基于印章轮廓模板和内部结构复杂度的书画印章提取方法,该提取方法能够从整幅书画作品或书画作品局部图像中准确地自动提取出印章图像的全部信息,据此可以实现一个利用印章图像作为关键信息的基于内容的中国书画图像检索和语义标注系统,为中国书画作品的检索、鉴定以及分类等奠定了基础。

【技术实现步骤摘要】

本专利技术涉及一种图像提取领域,特别是关于。
技术介绍
中国书画作品是中国艺术文化中的重要组成部分。其中印章作为中国书画"四绝"之一("四绝"即诗、书、画、印),已经成为文人书画作品中不可分割的重要部分,它包含大量与作者相关的高层语义信息,具有相当重要的艺术和文化价值。 20世纪90年代以来,随着计算机技术和图像处理技术的迅速发展,基于内容的图像检索(CBIR,Content Based Image Retrieval)技术在数字图像检索领域得到广泛的应用。CBIR是图像检索中的主要技术之一,其利用图像的低层视觉特征描述,如图像的纹理、颜色、形状及在空间的分布规律等特征对图像进行区域分割和场景语义信息的提取,从而实现检索。但是由于"语义鸿沟"的存在,使得CBIR技术的应用受到很大限制,尤其在书画作品的基于内容的检索方面表现的更为突出。这主要是由于艺术和文化的传承性造成的,中国书画作品中所使用的绘画技法、画面构图、颜色运用以及表现形式和主题等的相似性,使得书画作品的低层视觉特征趋于一致,因此单纯的利用低层视觉特征进行检索很难满足用户需求。解决CBIR中“语义鸿沟”问题已经成为现阶段的研究焦点。 随着中国书画作品数字化的深入,大量的书画作品被以数字图像的形式保存下来,如何能够通过图像本身或者其草图对书画的数字图像和相关信息进行检索成为书画数字化领域的核心课题之一。针对中国书画作品的数字图像检索领域中的“语义鸿沟”问题,可以利用印章图像中包含的高层语义信息进行辅助检索,解决提取书画作品语义信息的关键问题。由此可见,印章图像提取是获得上述高层语义信息的基础。 在针对中国书画的数字图像研究领域,宾夕法尼亚州立大学的James.Wang等人在论文“Studying digital imagery of ancient paintings by mixtures of stochasticmodels”中采用了多尺度小波变换后的特征系数描述中国书画的数字图像的纹理特征,提出了二维多尺度隐马尔科夫模型(2D-MHMMs)对于吴昌硕、唐寅、张大千等五位的中国书画的数字图像进行建模并构建分类器,以实现对未知书画图像的自动分类,但这种方法缺乏可扩展性。 国内,中科院计算所的黄庆明等在论文“An effective method to detect andcategorize digitized traditional Chinese paintings”中基于Tamura等人提出的一组对应人类视觉感知的纹理特征集,采用自相关纹理特征来描述中国书画数字图像的复杂程度,针对中国画中工笔画和写意画的特性提出使用边缘大小直方图来测量图像边缘的稀疏程度和粒度。而在另一篇论文“Visual Ontology Construction forDigitized Art Image Retrieval”中提出了将图像分析和领域本体技术相结合的书画图像语义自动分类算法。 在印章的数字图像研究领域,目前主要集中在对规范的公章或会计和法人印章上。针对书画作品中印章图像的研究,只有2008年娄海涛、鲍泓等提出的一种自动提取中国书画作品中印章图像的方法(专利号200710143946.3),该提取方法仅利用到印章图像的颜色特征,不能有效的提取书画作品中非红色的印章图像,且阀值多,提取率受印章图像大小的限制,没有充分利用印章图像的结构特征。目前国内外对中国书画作品中印章图像自动提取的研究鲜有人涉足,特别是基于结构特征的提取方法。 印章一般是由质地较为坚硬的金、银、铜、玉石等材料雕刻而成。将章料的底面(即“印面”)打磨平整,再在印面上雕刻文字或图案,即为“印文”。使用时,将印面沾取印泥后钤盖在书画作品上,形成印章图像。因此,印章图像的颜色即为印泥的颜色,通常呈现红色,还有少数为蓝色或其它颜色。印章图像有阴阳文,阳文印(也称朱文印)没有底色,字体为印泥颜色;阴文印(也称白文印)底色为印泥颜色,字体是白色,即背景颜色。印泥有厚薄、干湿,有蜜印、水印、油印之分,这些都能使同一印章的不同印文图像发生变化;同一枚印章钤盖在不同的纸或绢上,钤盖时用力轻重的不同,不同的背景颜色和纹理等,都会使图像发生变化;书画作品在装裱过程中,各种纸张或绢帛的伸缩延展也会导致印章图像发生变化;再考虑到印泥新旧,纸绢的包浆(纸绢上的光泽)等因素,可以遇到的变化是很多的。历代书画家都对印章情有独钟,一位画家往往拥有几枚到几十枚不同的印章。为配合书画作品的意境或画家个人的情趣,常会在一幅作品中的不同位置钤盖一枚或数枚不同的印章。此外,书画作品中往往还钤盖有一枚或数枚收藏家的印章,且钤盖位置及其背景变化复杂,难以确定。故而针对书画作品中印章图像的自动提取较难实现。
技术实现思路
针对上述问题,本专利技术的目的是提供。 为实现上述目的,本专利技术采取以下技术方案,其步骤包括1)对输入图像进行颜色分层;2)基于连通区域的图像分割;3)基于印章结构特征的图像区域过滤;4)在输入图像中提取印章图像。 所述步骤1)的对输入图像进行颜色分层,包括以下步骤i)将所述输入图像从RGB颜色空间转换到CIE Lab颜色空间;ii)对转换后的输入图像进行颜色分层,得到各颜色层图像。 所述步骤2)的基于连通区域的图像分割,包括以下步骤a)使用图像滤波方法对所述各颜色层图像进行噪声处理;b)对颜色层图像进行基于数学形态学的区域合并,形成孤立图像的连通区域;c)基于所述连通区域外接矩形的图像分割。 所述步骤3)的基于印章结构特征的图像区域过滤,包括以下步骤I)利用印章轮廓模板过滤分割后的图像区域;II)利用边缘检测算法基于印章内部结构特征过滤印章图像区域。 所述步骤2)中连通区域的计算方法,可使用种子填充算法、扫描线填充算法或边填充算法。 所述步骤3)中的印章轮廓模板包括矩形模板、椭圆形模板、葫芦形、瓦当形或刀形。 本专利技术由于采取以上技术方案,其具有以下优点1、本专利技术利用基于机器学习的中国书画颜色分层分析模型,实现了书画作品基于色层的同质区域粒度级别的图像分割,使一幅作品中的不同形状、颜色和大小的印章分别归属到不同的色层,并形成相对孤立的图像区域,因此可以对全部印章图像同时进行提取。2、本专利技术在书画颜色分层的基础上提出了一种基于印章外部轮廓模板和内部结构复杂度的书画印章提取方法,该提取方法能够从整幅书画作品或书画作品局部图像中准确地自动提取出印章图像的全部信息,据此可以实现一个利用印章图像作为关键信息的基于内容的中国书画图像检索和语义标注系统,克服了现有提取方法中由于印章颜色、钤盖位置及其背景变化复杂而导致的印章提取困难的缺陷,为中国书画作品的检索、鉴定以及分类等奠定了基础。 附图说明 图1是本专利技术的流程示意图 图2是本专利技术的基于书画图像颜色分层模型分层前的图像 图3是本专利技术的基于书画图像颜色分层模型分层后红色图层的二值图 图4是本专利技术的基于书画图像颜色分层模型分层后黄色图层的二值图 图5是本专利技术的基于书画图像颜色分层模型分层后蓝色图层的二值图 图6是本专利技术的基于书画图像颜色分层模型分层后绿色图层的二值图 图7是本专利技术的基于书画图像颜色分层模型分层后白色图层的二值图 本文档来自技高网
...

【技术保护点】
一种基于结构特征的中国书画印章图像自动提取方法,其步骤包括: 1)对输入图像进行颜色分层; 2)基于连通区域的图像分割; 3)基于印章结构特征的图像区域过滤; 4)在输入图像中提取印章图像。

【技术特征摘要】

【专利技术属性】
技术研发人员:娄海涛胡正坤鲍泓张南王迪菲王真真
申请(专利权)人:北京联合大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1