融合分类与全局索引的图像检索方法和图像检索系统技术方案

技术编号:7471033 阅读:294 留言:0更新日期:2012-07-01 20:29
本发明专利技术公开了一种融合分类与全局索引的图像检索系统,包括:下载模块、分类模型训练模块、图像分类模块、特征提取模块、记录表建立模块、索引模块、请求处理模块、检索模块、相似度获取模块、结果返回模块,下载模块用于下载图片以建立图片库,分类模型训练模块首先对图片库中的图片按照形状进行分类,对于每个分类,从图片库中挑选出具有代表性的样本图片,形成样本库。然后提取样本库中所有图片的分类底层特征描述符,并在底层特征描述符上利用支持向量机进行训练,以得到每个分类的判别式,并且所有分类的判别式形成分类模型。本发明专利技术提高了检索系统的查准率,弥补了分类错误时的查全率低下的问题,整体提高了系统的检索速度。

【技术实现步骤摘要】

本专利技术涉及基于内容的图像垂直检索领域,更具体地说,本专利技术涉及一种融合分类与全局索引的图像检索方法和图像检索系统
技术介绍
现有的基于内容的图像检索,主要的检索方式有,基于分类的检索、基于聚类的检索与基于全局索引的检索。基于分类的检索是预先把数据库中的图片分类,检索时首先获取查询图片的类别,然后再类别中检索出相似的图片;基于聚类的检索是对所有图片特征进行聚类,形成聚类中心,检索时待查询图片首先查找距离最近的聚类中心,然后在该聚类中心对应的图片集合中查找相似的图片;基于全局索引的检索是对所有图片特征建立索弓丨,待查询图片在索引上查找相似图片的集合,然后返回集合中相似的图片。然而,现有基于内容的图像检索方法存在以下问题采用聚类方式时,由于聚类与索引损失了特征向量的精度,导致查询准确率低;采用分类方式时,如果待查询图片分类错误时,查准率与查全率都会大大降低;采用索引方式时,在图像的特征向量上建立的索引, 其查询速度比较慢,会导致系统的检索耗时。
技术实现思路
本专利技术的目的在于提供一种融合分类与全局索引的图像检索方法,其检索是采用了图片的语义特征,从而提高了检索系统的查准率,并根据待查询图片的分类标号融合分类与全局索引两种检索方式,弥补了分类错误时的查全率低下的问题,且分类模型保证大部分图片采用分类方式检索,检索范围大大缩小,小部分图片采用索引的方式检索,从而整体提高了系统的检索速度。本专利技术是通过以下技术方案实现的一种融合分类与全局索引的图像检索方法,包括如下步骤a)下载图片以建立图片库,b)对图片库中的图片按照形状进行分类,对于每个分类,从图片库中挑选出具有代表性的样本图片,形成样本库。提取样本库中所有图片的分类底层特征描述符,并在底层特征描述符上利用支持向量机进行训练,以得到每个分类的判别式,并且所有分类的判别式形成分类模型,c)利用分类模型对图片库中所有图片进行分类,以得到图片的类别标号与语义特征,d)提取图片库中所有图片的颜色特征和形状特征,并将颜色特征、形状特征以及语义特征结合为特征库,e)关联特征库与图片库以及类别标号以形成记录表,f)利用局部敏感哈希方法建立特征库的索引,g)接收来自用户的图片查询请求,提取待查询图片的颜色特征和形状特征,使用分类模型对待查询图片进行处理,以得到待查询图片的类别标号与语义特征,h)判断待查询图片的类别标号是大于还是等于,i)若待查询图片的类别标号大于,则根据记录表从特征库中加载与待查询图片具有相同类别标号的特征集合,然后转入步骤k,j)若待查询图片的类别标号等于,则根据待查询图片的颜色特征、形状特征以及语义特征在索引上进行查询,以得到特征库中的特征集合,k)对特征集合与待查询图片的颜色特征、形状特征以及语义特征进行相似度计算,并根据计算得到的相似度值进行排序,以得到与记录表对应的排序结果,1)根据排序结果,从记录表中加载图片库中的图片,并把加载结果展示给用户。上述步骤C)包括子步骤提取样本库的底层特征描述符,采用卡方内核算法对底层特征描述符进行高维映射处理,以得到高维映射向量,采用支持向量机对高维映射向量进行训练,以得到样本库中每个类别的判别式fe+b,其中W、b为支持向量机训练得出的参数,X为高维映射向量。本专利技术的另一个目的在于提供一种融合分类与全局索引的图像检索系统,其检索是采用了图片的语义特征,从而提高了检索系统的查准率,并根据待查询图片的分类标号融合分类与全局索引两种检索方式,弥补了分类错误时的查全率低下的问题,且分类模型保证大部分图片采用分类方式检索,检索范围大大缩小,小部分图片采用索引的方式检索, 从而整体提高了系统的检索速度。一种融合分类与全局索引的图像检索系统,包括下载模块、分类模型训练模块、 图像分类模块、特征提取模块、记录表建立模块、索引模块、请求处理模块、检索模块、相似度获取模块、结果返回模块,下载模块用于下载图片以建立图片库,分类模型训练模块首先对图片库中的图片按照形状进行分类,对于每个分类,从图片库中挑选出具有代表性的样本图片,形成样本库。然后提取样本库中所有图片的分类底层特征描述符,并在底层特征描述符上利用支持向量机进行训练,以得到每个分类的判别式,并且所有分类的判别式形成分类模型,图像分类模块用于利用分类模型对图片库中所有图片进行分类,以得到图片的类别标号与语义特征,特征提取模块提取图片库中所有图片的颜色特征和形状特征,并将颜色特征、形状特征以及语义特征结合为特征库,记录表建立模块关联特征库与图片库中所有图片的路径以及类别标号以形成记录表,索引模块用于利用局部敏感哈希方法建立特征库的索引,请求处理模块用于接收来自用户的图片查询请求,提取待查询图片的颜色特征和形状特征,使用分类模型对待查询图片进行处理,以得到待查询图片的类别标号与语义特征,检索模块用于判断待查询图片的类别标号是大于还是等于,若待查询图片的类别标号大于,则根据记录表从特征库中加载与待查询图片具有相同类别标号的特征集合与记录表中对应的记录项,若待查询图片的类别标号等于,则根据待查询图片的颜色特征、形状特征以及语义特征在索引上进行查询,以得到特征库中的特征集合与记录表中对应的记录项,相似度获取模块用于对特征集合与待查询图片的颜色特征、形状特征以及语义特征进行相似度计算,并根据计算得到的相似度值进行排序,以得到与记录项关联的排序结果, 结果返回模块用于根据记录项中的图片路径加载图片库中的图片,并把加载结果展示给用户。图像分类模块包括分类特征描述符提取子模块、高维映射子模块以及训练子模块,分类特征描述符提取子模块用于提取样本库的底层特征描述符,高维映射子模块用于采用卡方内核算法对底层特征描述符进行高维映射处理,以得到高维映射向量,训练子模块用于采用支持向量机对高维映射向量进行训练,以得到样本库中每个类别的判别式 ffx+b,其中w、b为支持向量机训练得出的参数,χ为高维映射向量。本专利技术具有以下的优点和技术效果1、查询准确率高系统不完全依赖于图像的检索特征,采用分类模型对图像库进行了一次预分类, 同一类中的图片具有语义上的相似性。利用分类模型产生图片的语义信息,在检索时使机器判断的相似性判别更接近人的感官。整个系统的检索融入了分类模型的检索效果,使系统的查询率得到提高;2、响应速度快对图像进行分类后,每个类别里面的图像数量大大减少,加快了查询速度。分类能够保证90%以上的图像正确分类,剩余不到10%的图像在全局上采用索引方式进行检索。 从而在保证查询效果好的情况下,全面的加快了查询速度;3、查全率高分类模型的判别阈值控制严格,正确分类的图像在类别中检索其查准率与查全率可以得到保证。对于不能正确分类的部分图像,采用全局索引方式进行检索,避免了由于分类不准确造成的查准率与查全低下的问题。附图说明图1为本专利技术融合分类与全局索引的图像检索方法的流程图。图2为本专利技术方法中步骤(C)的细化流程图。图3为本专利技术融合分类与全局索引的图像检索系统的示意框图。图4为本专利技术系统中图像分类模块的细化框图。具体实施例方式以下首先对本专利技术的技术术语进行解释和说明具有代表性的样本图片能够体现图片库中某一类别的特征。语义特征图片在利用分类模型进行分类时,每个类别得到一个分值,所有类别的分值形成的向量。本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:金海郑然章勤周挺朱磊郭明瑞
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术