本发明专利技术公开了一种保持物体几何形状信息的图像检索系统及方法,该系统包括:图像导入接口、图像检索客户端、接收系统管理命令的管理员接口、执行管理员请求的系统管理模块、将图像抽象为带权图的图像建模模块、挖掘视觉模式的图像频繁模式挖掘模块、将检索项与记录进行比对和匹配的图像检索模块和基于HBase图像数据库的数据存储、访问和管理服务模块。保持物体几何信息的图像建模能有效把握各种物体特征间的几何相对位置信息,使系统的查全率和查准率均比现有的模型有较大提升;结合HBase的布隆过滤器和频繁子图索引技术的使用提高了系统的响应速度,支持海量图片的在线查找。
【技术实现步骤摘要】
本专利技术涉及图像检索领域,特别涉及。
技术介绍
图像检索通常被定义为以特定的检索项,如关键词,语音,图像等,在已有图像库中检索符合检索项要求的图片。 在信息检索的一开始,图像检索已经吸引了大量用户的参与。图像检索的目标为如何根据检索项,快速返回需要检索的图片。根据检索项的不同,主流的图片检索技术主要有基于关键词和基于图像的图像检索技术。现有的基于关键词的图像检索技术发展相对成熟,主要有Google、Baidu和Bing等大型搜索网站推出的图像检索技术; 相比之下,基于图像的图像检索是刚刚起步的新兴领域,但其可观的应用前景引发了国内外的研究热潮,并取得了一定的研究成果。主要包括IBM的QBIC、VIRAGE的VIR和Excalibur的RetrievalWare等一批具备一定实用价值的图像检索系统。基于图像的图像检索技术与基于关键词的图像检索技术具有较大差别。基于图像的图像检索技术一般没有为图像打标签这个步骤,而是直接依据视觉特征或语义特征等图像本身具备的内容进行检索。为了保证检索的精度,北京工业大学、浙江大学、西北工业大学和三星电子等高校和企业已经开展相关研究工作,一些可行的图像检索方法被相应提出。现有基于图像的图像检索系统主要存在一下几个方面的不足:A)、局限于局部特征信息,缺乏对物体形状信息的描述。虽然大部分图像检索系统都采用了颜色直方图、SIFT特征或SURF特征等各种特征描述,但是这些特征都是图片信息的孤立描述,缺乏有效的整合,尤其是缺乏对图片中各个特征的相对位置的描述。B)、在大规模数据库上的可用性弱。海量图像数据面临存储空间的有效利用和管理等问题,同时随着数据规模的日益膨胀,检索速度存在瓶颈。C)、缺乏有效索引机制。当前基于视觉特征的图像检索系统大多在提取的颜色、纹理、形状的基础上直接建立索引。对于这些高维的底层特征,传统的索引机制不再有效,性能急剧下降,甚至不如顺序扫描或穷举搜索,有维度灾难的危险。
技术实现思路
为了克服现有技术的不足,本专利技术提出了。提供一种更为有效和完整的图像描述方法;使得检索精度更高,系统性能更好,实用性更强。为实现上述目的,本专利技术的技术方案为 一种保持物体几何信息的图像检索系统,包括 图像导入接口,用于将图像批量插入;图像检索客户端,用于接收用户的图像检索查询请求和呈现查询结果;提供Web在线浏览、检索和客户端程序等多种渠道,对用户需求进行分析和转化,形成可以检索索引数据库的提问; 管理员接口,用于接收管理员提交的系统管理命令,还包括管理员设置的参数等; 系统管理模块,用于执行管理员接口接收到的请求,依据命令对系统进行一些设置操作; 基于带权图的图像建模模块,用于将图像抽象为带权图的图结构表示为后续的模式挖掘做准备; 图像频繁模式挖掘模块,用于挖掘图结构数据集范围内的频繁模式,识别具有显著语义特性的视觉模式; 图像检索模块,用于将检索项与预先建立数据库中的记录进行比对和匹配;获取查询 图像的图结构表示,并以此作为索引检索数据库中的项,根据预先建立好的相似性度量方法得到每一项相对于检索项的相似度,最后按照相似度降序排列各项,并返回结果至图像检索客户端; 基于HBase图像数据库的数据存储、访问和管理服务模块,用于接收以查询图像为目的的数据库操作和存储图片。所述基于带权图的图像建模模块分别与图像导入接口和图像检索客户端发生交互。由于带权图是索引和匹配的基本单位。图像导入接口接收的是即将被检索的项,而图像检索客户端接收的则是查询图像原型,即检索的依据。换言之,用户提交的示例图像和预先建立的图像数据库中的图像都需要用带权图模型加以描述,才能执行下一步的操作。所述基于带权图的图像建模模块以图像提取的Surf特征点为图像的顶点;对Surf特征点进行量化和聚类得到的视觉单词作为顶点的标号;采用k近邻法建立每个顶点与其k个近邻间的无向边,再根据两点之间的欧式距离为边分配权值。所述顶点的标号为顶点的分类号,是计算顶点频度的依据;而连接顶点的无向边表示Surf特征点之间的空间几何关系;边的权值等于欧式距离的倒数的向上取整,即权值与欧式距离成反比,这是因为相距越近的点被认为属于同一视觉模式的可能性越大,在检索匹配时往往作为一个整体被优先考虑。所述图像检索模块的操作对象为基于带权图的图像建模模块抽象得到的带权图;图像检索模块采用基于图编辑距离的相似度量方法对查询图和检索图进行匹配,即图像检索模块的主要的操作是在查询图与检索图之间进行匹配,为了减少噪声和形变给匹配带来的负面影响,使用基于图编辑距离的相似度量方法提高容错性。所述图像频繁模式挖掘模块根据顶点特征描述识别出在图结构数据集范围内频繁出现的模式,所述频繁是指出现次数不小于最小支持度阈值。图结构数据集范围内频繁出现的模式是一组公共子图结构,与图像本身及其分散的特征点相比,表达上较紧凑且语义层次较高。所述检基于HBase图像数据库的数据存储、访问和管理服务模块包括面向HBase图像数据库的图像查询接口和基于HBase云存储平台的图像数据库; 面向HBase图像数据库的图像查询接口,用于接收以查询图像为目的的数据库操作;支持使用布隆过滤器进行快速查询预筛选和利用频繁子图对带权图进行索引;基于HBase云存储平台的图像数据库,用于存储图片,另外整合并提供了快速存取、有效索引等机制。本专利技术的另一目的是提出一种用于图像检索系统的图像检索方法,包括以下步骤 51)通过图像导入接口将图像数据批量导入; 52)利用基于带权图的图像建模模块将导入的图像分别抽象化为图结构表示; 53)利用图像频繁模式挖掘模块挖掘图结构表示数据范围内的频繁模式; 54)根据频繁模式建立索引结构; 55)通过图像检索客户端读取用户提交的查询图像; 56)利用基于带权图的图像建模模块将查询图像分别抽象为带权 57)将查询图像的带权图与索引结构中的索引项匹配,得到查询图像中含有的若干频繁模式,从而获得含有这些频繁模式的原图像列表;根据与索引结构的相似性排序图像得到图像列表; 58)返回已被排序的图像列表到图像客户端供用户直接查看; 步骤S3)包括以下步骤 531)图像频繁模式挖掘模块扫描图集;根据顶点分类号计算顶点的支持度,忽略支持度小于最小支持度阈值的顶点;所述支持度不小于最小支持度阈值的顶点为频繁点,将两个频繁点和一条边组成的频繁一边图作为初始子 532)将包含k条边的频繁子图作为种子图,添加一条边对其进行扩展,生成包含k++条边的候选子图,计算候选子图的支持度,若候选子图的支持度小于最小支持度阈值,将该候选子图舍弃;否则将候选子图作为含k++条边的频繁子图插入频繁子图集中; 533)将步骤S32)挖掘所得的含k++条边的频繁子图作为新的种子图,重复步骤S32); 534)若由k条边频繁子图扩展所得的所有k++条边候选子图均被考虑过,回溯到其它k条边的频繁子图继续扩展; 535)重复步骤S32)、S33)、S34),直到没有新的频繁子图被发现为止。保持物体几何信息的图像建模能有效把握各种物体特征间的几何相对位置信息,系统的查全率和查准率均比现有的模型有较大提升;结合HBase的布隆过滤器的使用,频繁子图索引技术提高本文档来自技高网...
【技术保护点】
一种保持物体几何信息的图像检索系统,其特征在于包括:图像导入接口,用于将图像批量插入;图像检索客户端,用于接收用户的图像检索查询请求和呈现查询结果;管理员接口,用于接收管理员提交的系统管理命令;系统管理模块,用于执行管理员接口接收到的请求;基于带权图的图像建模模块,用于将图像抽象为带权图的图结构表示;图像频繁模式挖掘模块,用于挖掘图结构数据集范围内的频繁模式,识别具有显著语义特性的视觉模式;图像检索模块,用于将检索项与预先建立数据库中的记录进行比对和匹配;基于HBase图像数据库的数据存储、访问和管理服务模块,用于接收以查询图像为目的的数据库操作和存储图片。
【技术特征摘要】
【专利技术属性】
技术研发人员:蔡瑞初,郝志峰,曾燕妮,温雯,
申请(专利权)人:广东工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。