基于计算机系统的图片相似度计算方法及其系统技术方案

技术编号:14061251 阅读:67 留言:0更新日期:2016-11-27 18:09
本发明专利技术涉及数据处理,公开了一种基于计算机系统的图片相似度计算方法及其系统。本发明专利技术中,通过将相应于各视觉词的图片标识列表中的图片标识两两配对来获取至少具有一个相似特征的图片对,并对这些图片对进行相似度计算,可以提高大规模图片间相似度的计算效率,并且该方法适用于分布式计算系统,使得海量图片间相似度的计算成为可能。此外,在获取和合并图片标识对的同时,对相应于各图片标识对的两个图片进行相似度计算,可以进一步提高计算效率。

【技术实现步骤摘要】

本专利技术涉及数据处理,特别涉及基于计算机系统的图片相似度计算方法及其系统
技术介绍
基于内容的图像间相似性计算在许多场景下都有应用,常见的比如图像聚类、图像检索以及基于图像的个性化推荐等。上述场景都涉及到在离线处理阶段,对图库中的每一张图片,计算它与其它图片之间的相似性(一般采用提取局部特征并通过L2距离来衡量)。但是,本专利技术的专利技术人发现,该问题的解决存在几个难点与挑战:1)时间复杂度的问题:对于包含N张图片的图库来说,时间复杂度为O(N2);随着图库中图片数量的增长,时间复杂度的增长非常快,这对于实际工业应用中是非常不适合的。2)空间复杂度的问题:上述O(N2)的时间复杂度仅存在于数据量较小的情况(即所有图片的特征都能加载到计算机的内存中)。对于海量图片相似性计算,所有提取到的特征无法一次性全部加载进内存中,因此会涉及到大量的数据交换以及磁盘IO(输入输出)的问题,实际的时间复杂度会远大于O(N2)。3)数据结构的问题:因为要求是海量数据集合下,每张图片与其它的图像都计算一次相似度,所以这个问题很难直接使用现有的分布式系统来做并行化处理。
技术实现思路
本专利技术的目的在于提供一种基于计算机系统的图片相似度计算方法及其系统,提高了大规模图片间相似度的计算效率并且适用于分布式系统。为解决上述技术问题,本专利技术的实施方式公开了一种基于计算机系统的图片相似度计算方法,方法包括以下步骤:提取图片的至少一个特征,并将特征量化为视觉词;为每一视觉词建立倒排索引记录,倒排索引记录包含图片标识;获取每一倒排索引记录中的图片标识列表,并将图片标识列表中的图片标识两两配对;在所有图片标识对中合并相同的图片标识对;对于经合并的各图片标识对计算相应的两个图片之间的相似度。本专利技术的实施方式还公开了一种基于计算机系统的图片相似度计算系统,系统包括:量化单元,用于提取图片的至少一个特征,并将特征量化为视觉词;倒排索引单元,用于为每一视觉词建立倒排索引记录,倒排索引记录包含图片标识;配对单元,用于获取每一倒排索引记录中的图片标识列表,并将图片标识列表中的图片标识两两配对;合并单元,用于在所有图片标识对中合并相同的图片标识对;以及计算单元,用于对于经合并的各图片标识对计算相应的两个图片之间的相似度。本专利技术实施方式与现有技术相比,主要区别及其效果在于:在本专利技术中,通过将相应于各视觉词的图片标识列表中的图片标识两两
配对来获取至少具有一个相似特征的图片对,并对这些图片对进行相似度计算,可以提高大规模图片间相似度的计算效率,并且该方法适用于分布式计算系统,使得海量图片间相似度的计算成为可能。进一步地,在获取和合并图片标识对的同时,对相应于各图片标识对的两个图片进行相似度计算,可以进一步提高计算效率。进一步地,预先存储相应于各图片标识的模,从而在进行相似度计算时使用,以提高计算效率。附图说明图1是本专利技术第一实施方式中一种基于计算机系统的图片相似度计算方法的流程示意图;图2是本专利技术第一实施方式中MapReduce框架的结构示意图;图3是本专利技术第一实施方式中在MapReduce框架下统计词频的流程图;图4是本专利技术第二实施方式中一种基于MapReduce建立倒排索引的示意图;图5是本专利技术第二实施方式中一种基于MapReduce计算图片相似度的示意图;图6是本专利技术第三实施方式中一种基于计算机系统的图片相似度计算系统的结构示意图。具体实施方式在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本领域的普通技术人员可以理解,即使没有这些技术细节和基于
以下各实施方式的种种变化和修改,也可以实现本申请各权利要求所要求保护的技术方案。为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的实施方式作进一步地详细描述。本专利技术第一实施方式涉及一种基于计算机系统的图片相似度计算方法。图1是该基于计算机系统的图片相似度计算方法的流程示意图。如图1所示,该方法包括以下步骤:在步骤101中,提取图片的至少一个特征,并将特征量化为视觉词。可以理解,可以采用BoW模型(Bag-of-words model,中文一般称为“文档向量模型”)对图片特征进行量化。视觉词可以由部分图片来表示,该部分图片携带有颜色、形状、纹理、或是像素变化等特征信息。BoW模型最早出现在NLP(自然语言处理)和IR(信息检索)领域。该模型忽略掉文本的语法和语序,用一组无序的单词(words)来表达一段文字或一个文档。近年来,BoW模型被广泛应用于计算机视觉中。与应用于文本的BoW类比,图像的特征(feature)被当作视觉词(Visual Word)。最早是Fei-fei Li提出了用BoW模型表达图像的方法。他们认为,图像可以类比为文档(document),图像中的单词(words)可以定义为一个图像块(image patch)的特征向量。那么图像的BoW模型即是“图像中所有图像块的特征向量得到的直方图”。一般来说,建立BoW模型主要分为如下几个步骤:1.特征提取假设有N张图像,第i张图像可由n(i)个image patch组成,也即可以由n(i)个特征向量表达。则总共能得到sum(n(i))个特征向量(即单词)。特征向量可以根据特征问题自行设计,常用特征有Color histogram(颜色直方图),SIFT(Scale-invariant feature transform,简称“尺度不变特征转换”),LBP(Local Binary Patterns,简称“局部二值模式”)等。2.生成字典/码本(codebook)在特征向量数量较多时,对上一步得到的特征向量进行聚类(可以使用K-means、x-means、层次聚类等聚类方法),得到K个聚类中心,用聚类中心构建码本。可以理解,在某些特定情况下,也可以不对特征向量进行聚类。3.根据码本生成直方图对每张图片,通过最近邻计算该图片的每个“单词”应该属于codebook中的“哪一类”单词,从而得到该图片对应于该码本的BoW表示。由上可以看到,在使用BoW模型对图片特征进行量化时,在步骤101前还包括以下步骤:提取训练样本中的图片的至少一个特征;将从上述训练样本中的图片提取的特征进行聚类,以形成多个聚类中心,并为每个聚类中心设置唯一的视觉词。这些视觉词的集合为视觉词典。当然,可以理解,在本专利技术的其他实施方式中,也可以采用其他图片量化模型对图片特征进行量化。此后进入步骤102,为每一视觉词建立倒排索引记录,倒排索引记录包含图片标识。此后进入步骤103,获取每一倒排索引记录中的图片标识列表,并将图片标识列表中的图片标识两两配对。此后进入步骤104,在所有图片标识对中合并相同的图片标识对。此后进入步骤105,对于经合并的各图片标识对计算相应的两个图片之间的相似度。可以理解,在本专利技术的各个实施方式中,可以使用余弦相似度、结构相似度或其他相似度算法来计算图片相似度。此后结束本流程。在本实施方式的方法中,通过将相应于各视觉词的图片标识列表中的图片标识两两配对来获取至少具有一个相似特征的图片对,并对这些图片对进行相似度计算,可以提高大规模图片间相似度的计算效率,并且该方法适用于分布式计算系统,使得海量图片间相似本文档来自技高网
...
基于计算机系统的图片相似度计算方法及其系统

【技术保护点】
一种基于计算机系统的图片相似度计算方法,其特征在于,所述方法包括以下步骤:提取图片的至少一个特征,并将所述特征量化为视觉词;为每一视觉词建立倒排索引记录,所述倒排索引记录包含图片标识;获取每一倒排索引记录中的图片标识列表,并将所述图片标识列表中的图片标识两两配对;在所有图片标识对中合并相同的图片标识对;对于经合并的各图片标识对计算相应的两个图片之间的相似度。

【技术特征摘要】
1.一种基于计算机系统的图片相似度计算方法,其特征在于,所述方法包括以下步骤:提取图片的至少一个特征,并将所述特征量化为视觉词;为每一视觉词建立倒排索引记录,所述倒排索引记录包含图片标识;获取每一倒排索引记录中的图片标识列表,并将所述图片标识列表中的图片标识两两配对;在所有图片标识对中合并相同的图片标识对;对于经合并的各图片标识对计算相应的两个图片之间的相似度。2.根据权利要求1所述的基于计算机系统的图片相似度计算方法,其特征在于,每一视觉词的倒排索引记录还包含所述图片标识相应于该视觉词的权重值;所述“获取每一倒排索引记录中的图片标识列表,并将所述图片标识列表中的图片标识两两配对”的步骤中,将各图片标识对中的两个图片标识的权重值相乘,作为各图片标识对相应于各视觉词的权重值;所述“在所有图片标识对中合并相同的图片标识对”的步骤中,在合并相同的图片标识对时,将相同的图片标识对相应于各视觉词的各权重值相加;所述“对于经合并的各图片标识对计算相应的两个图片之间的相似度”的步骤中,对于经合并的各图片标识对,将相加后的各权重值进行归一化处理,以得到相应的两个图片之间的相似度。3.根据权利要求2所述的基于计算机系统的图片相似度计算方法,其特征在于,所述“对于经合并的各图片标识对计算相应的两个图片之间的相似度”的步骤中,使用预先存储的相应于各图片标识的模进行归一化处理。4.根据权利要求1所述的基于计算机系统的图片相似度计算方法,其特征在于,所述“提取图片的至少一个特征,并将所述特征量化为视觉词”的步骤前还包括以下步骤:提取训练样本中的图片的至少一个特征;将从所述训练样本中的图片提取的特征进行聚类,以形成多个聚类中心,并为每个聚类中心设置唯一的视觉词。5.根据权利要求1至4中任一项所述的基于计算机系统的图片相似度计算方法,其特征在于,所述方法在MapReduce框架下实现,在Map阶段实施所述“获取每一倒排索引记录中的图...

【专利技术属性】
技术研发人员:薛晖猛安夏雷
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1