当前位置: 首页 > 专利查询>浙江大学专利>正文

基于空间约束特征选择及其组合的中国剪纸识别方法技术

技术编号:3991596 阅读:213 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于空间约束特征选择及其组合的中国剪纸识别方法。包括如下步骤:1)采用空间金字塔匹配和上下文相关直方图相结合方法提取样本初始特征,形成样本候选特征;2)利用基于AdaBoost的特征选择和组合技术对候选特征进行处理,得到区别性特征;3)通过每一类中所有组合特征的中心特征向量、区别性特征以及定义其上的距离计算公式来表征该类;4)计算测试集样本在区别性特征上与各类别中心特征的距离,得到剪纸作品分类识别结果。本发明专利技术有效地将空间金字塔匹配和上下文相关直方图这两种方法结合起来,克服其在表达图像形状上的局限性,提取和形成具有区别性的剪纸图像形状特征,并在此基础之上实现剪纸作品分类识别。

【技术实现步骤摘要】

本专利技术涉及图像识别领域,尤其涉及一种基于空间约束特征选择及其组合的中国 剪纸识别方法。
技术介绍
剪纸,又名“刻纸”,是一种以纸为加工对象,以剪刀(或刻刀)为工具进行创作的 艺术。剪纸因其讲究刀法,玲珑剔透纸感语言和强调影廓造型而形成一种独特艺术形式。经 过几千年发展与积淀,剪纸作品可分为动物、肖像、人物和文字等类别。剪纸作品包含了丰富语义而难以用文字直接进行表达,大量剪纸作品经过数字化 处理后,为了发挥其共享优势,迫切需要研究针对剪纸作品的搜索技术。基于内容图像检索 Content-based Information Retrieval (CBIR)方法因其通过图像视觉特征(如颜色、纹理 和形状等)实现相似图像检索而引起广泛关注,由于存在底层特征难以表达高层语义这一 “语义鸿沟”,使得CBIR这一图像搜索方法面临很大挑战。CBIR —般采用的视觉特征包括颜色、形状、纹理以及他们的组合。由于形状是表 现剪纸作品蕴含语义的重要特征,因此剪纸作品的形状特征提取方法成为剪纸作品识别 的关键问题。计算机视觉和模式识别(Computer Vision andPattern Recognition) 2006 年会议论文集中公布了一种提取图像形状特征及其计算相应相似度的方法——空间金字 塔匹配(Spatial Pyramid Matching, SPM)。该方法首先对图像构造尺度大小不同空间金 字塔,在空间金字塔的每一层用粒度递增的单元格去对图像进行空间划分,然后统计每一 个划分得到的图像单元格子块中视觉单词(Visual Words)出现次数,得到视觉单词直方 图。由于在单元格大小变化过程中各视觉单词出现次数随之变化,这一变化可体现图像中 形状在不同尺度空间不同,因此用直方图的交来表示每一层金字塔。2009年电气和电子 工程师协会关于计算机视觉和模式识别会议(IEEE Conference onComputer Vision and Pattern Recognition)论文集中公布了一种提出了一种基于马尔可夫稳态特性(Markov Stationary Features,MSF)白勺才目(Contextualizing Histogram,CH) 提取方法。上述两种特征提取方法都存在一定局限性,空间金字塔匹配反映了图像在不同 尺度上的相似性,上下文相关直方图则反映了图像在同一尺度上存在空间上下文约束的相 似性。
技术实现思路
本专利技术的目的是克服空间金字塔匹配和上下文相关直方图在表达图像形状上的 局限性,将其有效结合,提供一种。包括如下步骤1)采用空间金字塔匹配和上下文相关直方图相结合的方法提取样本初始特征,形 成样本候选特征;2)利用基于AdaBoost的特征选择和组合技术对样本候选特征进行处理,得到样本区别性特征;3)通过每一类中所有组合特征的中心特征向量、区别性特征以及定义其上的距离 计算公式来表征该类;4)计算测试集样本在区别性特征上与各类别中心特征的距离,得到剪纸作品分类 识别结果;所述的采用空间金字塔匹配和上下文相关直方图结合的方法提取样本初始特征, 形成样本候选特征步骤包括对于给定的M幅剪纸图像Si {1 < i < M},分别提取128维的 SIFT局部特征,进而用K-means聚类得到32个视觉单词。为了得到这些视觉单词之间存 在的空间结构性属性,对训练集样本通过采样得到3层金字塔,1代表空间金字塔的第1层 (1≥0),d代表第1层单元格的总数,d = 21 X 21,这样每幅剪纸图像总共得到(41-” /3个 子块。对于这些(f-DA个子块,在其每一个子块内,定义马尔可夫稳态特性,来计算得到 表示视觉单词之间共生关系的伴随矩阵。这样,对于每幅图像,可提取出具有空间约束的特 征维数为Z,这里Z = E x64X (4ll) /3。值得指出的是,本文在提取具有空间约束特征过程 中,是按照图像中所包含的视觉单词进行提取,而不是按照像素点颜色值进行提取。同时, 每幅图像所提取的特征维数均相同。为了消除每个特征值域变化范围不同对分类造成的影 响,给定每一类剪纸图像后,对其相应维特征进行归一化处理。所述的利用基于AdaBoost的特征选择和组合技术对样本候选特征进行处理,得 到样本区别性特征步骤包括对于第j类剪纸图像每一轮对任意两维特征进行组合,并连 同原特征一起作为候选特征。给定N类M幅剪纸图像Si{l ^ i <M},其类别标记矩阵记为 T T = {tij G {0,1} |1 ^-≤ i≤M, 1 ≤ j≤ N}其中,i和j分别用来表示第i幅剪纸图像和第j个类别;如果第i幅剪纸图像属 于第j个类别,则、=1,否则= 0。仍然以第j类剪纸图像为例来介绍其对应的区别 性特征选择过程。在训练分类器之前,用表示属于第j个类别的第i幅剪纸加权计算简 单分类器误差权重,即W = {w.jll ^ i ^ M, 1 ^ j ^ N},它表征了简单分类器对总体分类 的影响,其初始值定义如下 首先应用AdaBoost的思想,对组合出来的待选择特征V(即特征组合过程中的一 种组合特征)中各分量vik构造简单分类器,该分类器定义如下 其中sort(|vik-Cjk|)的表示分量vik与类中心欧氏距离排序后的排名。coimtap 表示第j类样本数。利用上述分类器对待选择特征V进行分类,得到分类结果集R = {rik G {0,1} |1 ≤ i ≤M, 1 ≤k≤K}每个特征分量计算训练误差定义为5 其计算过程中,每次计算需依照以下公式更新权值wu, 得到候选特征V各分量分类误差后,对其按照该分类误差进行排序,选取V中误差 最小前Z个分量构成第j类剪纸图像的一种区别性特征。所述的通过每一类中所有组合特征的中心特征向量、区别性特征以及定义其上的 距离计算公式来表征该类步骤包括通过特征组合和选择可得到每一类的区别性特征,以 此作为每一类中所有组合特征的类中心特征向量,然后选择得到的区别性特征,并利用定义其上的距离计算公式来表征该类;距离计算公式定义为 其中t为测试集样本特征向量,S为训练集样本特征向量。据此,可以计算测试集样本在判别性特征 上与各类别中心特征的距离,从而实现对剪纸作品的分类识别。所述的计算测试集样本在区别性特征上与各类别中心特征的距离,得到剪纸作品 分类识别结果步骤包括对测试集样本进行预处理,提取SIFT特征,采用K-Means聚类算法 提取视觉单词,形成样本初始特征;然后采用空间金字塔匹配和上下文相关直方图结合的方法处理样本初始特征,形成样本候选特征;利用 二距离计算公式计算测试集样本在区别性特征上与各类别中心特征的距离,其中t为测试集样本特征向量,s为 训练集样本特征向量;最终得到测试集分类识别结果,比较测试集分类结果与真实分类结本专利技术有效地将空间金字塔匹配和上下文相关直方图这两种方法结合起来,克服 其在表达图像形状上的局限性,提取和形成具有区别性的剪纸图像形状特征,并在此基础 之上实现剪纸作品分类识别。附图说明图1是本专利技术金字塔子块划分示意图。图2是剪纸作品集各类别示例图。图3是不同区别性特征维数下本专利技术与单独使用空间金字塔匹配以及单独使用 上下文相关直方图的AUC得本文档来自技高网
...

【技术保护点】
一种基于空间约束特征选择及其组合的中国剪纸识别方法,其特征在于包括如下步骤:1)采用空间金字塔匹配和上下文相关直方图相结合的方法提取样本初始特征,形成样本候选特征;2)利用基于AdaBoost的特征选择和组合技术对样本候选特征进行处理,得到样本区别性特征;3)通过每一类中所有组合特征的中心特征向量、区别性特征以及定义其上的距离计算公式来表征该类;4)计算测试集样本在区别性特征上与各类别中心特征的距离,得到剪纸作品分类识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:邵健庄越挺王霏
申请(专利权)人:浙江大学
类型:发明
国别省市:86[中国|杭州]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1