一种基于社区分析的图像索引并行构建方法技术

技术编号:11738454 阅读:103 留言:0更新日期:2015-07-15 20:32
本发明专利技术公开了一种基于社区分析的图像索引并行构建方法,采用并行K均值聚类算法对图像块实现聚类,图像采用由一系列的视觉关键词构成的特征聚类向量表示,在图像检索时能避免线性扫描海量、高维和动态的特征数据库。采用向量空间模型及语言模型计算每个图像对的语义相似度,构建图像的语义相似度社会网络,在此基础上,基于大规模社区分析方法构建海量图像的语义索引。在索引构建中采用高维聚类索引空间的某些有意义的子空间计算图像间的相似度,从而克服聚类索引“维度灾难”的问题,结合图像块物理特征索引与图像全局层次的语义索引,提升海量图像检索的速度和效果。

【技术实现步骤摘要】

本专利技术涉及图像查询
,具体地是涉及。
技术介绍
从人类的认知角度看,人类对图像的描述和理解主要是在语义层次上进行。而图像的底层物理特征(如色彩、纹理、形状、结构等)难于表达图像高层语义内容,图像表达的数字阵列与通常可以被人类所接受的概念化内容之间存在着语义鸿沟。如果不对原始图像进行预处理,仅仅根据整幅图像的底层物理特征进行检索,图像中将包含了大量不相关的信息。这些不相关的信息直接影响检索的准确性,即使采用相关反馈技术也难以取得比较令人满意的检索结果。因此,本专利技术的专利技术人亟需构思一种新技术以改善其问题。
技术实现思路
为了解决上述不足,本专利技术提供了。为解决上述技术问题,本专利技术的技术方案是:,包括如下步骤:S1:采用并行K均值聚类算法对目标图像实现聚类,所述目标图像由多个视觉关键词构成的特征聚类向量表示;S2:对聚类得到的每个类分别建立索引;S3:进行图像查询。进一步地,所述步骤SI具体包括:Sll:提取目标图像和图像数据库中每幅图像的颜色特征和纹理特征;S12:对描述图像内容的高维特征进行降维,得到特征子集;S13:结合网格的样本密度,对特征子集构成的数据集进行聚类。进一步地,所述步骤S3具体包括:S31:将目标图像中提取的降维后的特征子集与所述步骤SI最终所得到的各聚类中心进行匹配,选择最相似的索引树;S32:在最相似的索引树中,根据目标图像的所述颜色特征和纹理特征进行检索,得到相似性匹配结果。进一步地,所述步骤S13具体包括:S131:将降维后的低维数据空间划分成固定大小的网格;S132:计算每个网格中落入的样本数目得到每个格点的样本密度;S133:将格点按照其样本密度排序;S134:根据排序结果得到初始聚类的分类数和各分类的初始中心;S135:用K均值方法来模拟数据点的分布,得到最终的聚类结果。进一步地,所述步骤S12中对高维图像特征进行降维时,选择全局颜色矩作为表征图像内容的特征向量。进一步地,选择全局颜色矩是选取颜色的一阶矩、二阶矩和三阶矩作为表征图像的特征向量。采用上述技术方案,本专利技术至少包括如下有益效果:本专利技术所述的基于社区分析的图像索引并行构建方法,采用并行K均值聚类算法对图像块实现聚类,图像采用由一系列的视觉关键词构成的特征聚类向量表示,在图像检索时能避免线性扫描海量、高维和动态的特征数据库。采用向量空间模型及语言模型计算每个图像对的语义相似度,构建图像的语义相似度社会网络,在此基础上,基于大规模社区分析方法构建海量图像的语义索引。在索引构建中采用高维聚类索引空间的某些有意义的子空间计算图像间的相似度,从而克服聚类索引“维度灾难”的问题,结合图像块物理特征索引与图像全局层次的语义索引,提升海量图像检索的速度和效果。【附图说明】图1为本专利技术所述的基于社区分析的图像索引并行构建方法的流程图。【具体实施方式】下面结合附图和实施例对本专利技术进一步说明。如图1所示,为符合本专利技术的,包括如下步骤:S1:采用并行K均值聚类算法对目标图像实现聚类,所述目标图像由多个视觉关键词构成的特征聚类向量表示;S2:对聚类得到的每个类分别建立索引;S3:进行图像查询。进一步地,所述步骤SI具体包括:Sll:提取目标图像和图像数据库中每幅图像的颜色特征和纹理特征;S12:对描述图像内容的高维特征进行降维,得到特征子集;S13:结合网格的样本密度,对特征子集构成的数据集进行聚类。进一步地,所述步骤S3具体包括:S31:将目标图像中提取的降维后的特征子集与所述步骤SI最终所得到的各聚类中心进行匹配,选择最相似的索引树;S32:在最相似的索引树中,根据目标图像的所述颜色特征和纹理特征进行检索,得到相似性匹配结果。进一步地,所述步骤S13具体包括:S131:将降维后的低维数据空间划分成固定大小的网格;S132:计算每个网格中落入的样本数目得到每个格点的样本密度;S133:将格点按照其样本密度排序;S134:根据排序结果得到初始聚类的分类数和各分类的初始中心;S135:用K均值方法来模拟数据点的分布,得到最终的聚类结果。进一步地,所述步骤S12中对高维图像特征进行降维时,选择全局颜色矩作为表征图像内容的特征向量。进一步地,选择全局颜色矩是选取颜色的一阶矩、二阶矩和三阶矩作为表征图像的特征向量。本实施例采用并行K均值聚类算法对图像块实现聚类,图像采用由一系列的视觉关键词构成的特征聚类向量表示,在图像检索时能避免线性扫描海量、高维和动态的特征数据库。采用向量空间模型及语言模型计算每个图像对的语义相似度,构建图像的语义相似度社会网络,在此基础上,基于大规模社区分析方法构建海量图像的语义索引。在索引构建中采用高维聚类索引空间的某些有意义的子空间计算图像间的相似度,从而克服聚类索弓I “维度灾难”的问题,结合图像块物理特征索引与图像全局层次的语义索引,提升海量图像检索的速度和效果。本专利技术是参照根据本专利技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本专利技术的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。显然,本领域的技术人员可以对本专利技术进行各种改动和变型而不脱离本专利技术的精神和范围。这样,倘若本专利技术的这些修改和变型属于本专利技术权利要求及其等同技术的范围之内,则本专利技术也意图包含这些改动和变型在内。【主权项】1.,其特征在于,包括如下步骤: 51:采用并行K均值聚类算法对目标图像实现聚类,所述目标图像由多个视觉关键词构成的特征聚类向量表示; 52:对聚类得到的每个类分别建立索引; 53:进行图像查询。2.如权利要求1所述的基于社区分析的图像索引并行构建方法,其特征在于,所述步骤SI具体包括: 511:提取目标图像和图像数据库中每幅图像的颜色特征和纹理特征; 512:对描述图像内容的高维特征进行降维,得到特征子集; 513:结合网格的样本密度,对特征子集构成的数据集进行聚类。3.如权利要求1所述的基于社区分析的图像索引并行构建方法,其特征在于,所述步骤S3具体包括: 531:将目标图像中提取的降维后的特征子集与所述步骤SI最终所得到的各聚类中心进行匹配,本文档来自技高网...

【技术保护点】
一种基于社区分析的图像索引并行构建方法,其特征在于,包括如下步骤:S1:采用并行K均值聚类算法对目标图像实现聚类,所述目标图像由多个视觉关键词构成的特征聚类向量表示;S2:对聚类得到的每个类分别建立索引;S3:进行图像查询。

【技术特征摘要】

【专利技术属性】
技术研发人员:束兰黄裕新
申请(专利权)人:苏州搜客信息技术有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1