The present invention proposes an optimal image set selection method for group image insertion, aiming at selecting the image set with the highest similarity to the image to be inserted. The implementation steps are as follows: extracting SIFT features of training image; establishing visual dictionary; extracting SIFT features of each image in each image set of group image; and acquiring each image in each image set. The visual word histogram of the set, the visual word histogram of the image to be inserted, the similarity of each image set between the image to be inserted and the group image are calculated, and the optimal insertion image set is selected. The invention discovers the relationship between the image to be inserted and the image set, and can select the image set with the highest similarity for the image added to the group image, and can be used for inserting the image in the scene of cloud group image management and image database management.
【技术实现步骤摘要】
一种用于群体图像插入的最优图像集选取方法
本专利技术属于图像编码
,涉及一种最优图像集选取方法,具体涉及一种用于群体图像插入的基于词包模型的最优图像集选取方法,可用于云端群体图像管理以及图像数据库管理的场景中向群体图像中插入图像的情况,可以为待插入的图像选取出与其相似度最高的图像集。
技术介绍
在最近十年中.随着互联网相关产业的飞速发展,数字图像等多媒体内容也呈现出爆炸式的增长。据全球最大社交网络服务公司Facebook报告,其存储的照片己经超过二千二百亿张,并正以每天三亿张的速度增加。规模巨大的图像视频数据为带宽存储等方面带来了极大的压力。为此,研究者一直在努力改进数字图像压缩技术。相同场景下拍摄的很多图片具有很大的相似性,但他们的单独采用JPEG或JPEG-2000对图像进行编码,将会造成存储空间大、编码效率不够高。因此,对于相似图像的压缩存储很有必要。群体图像编码利用存在于群体图像之间的相关性,通过一系列处理从而得到伪视频序列,最后通过该序列进行视频压缩编码的方法可以获得更高的图像压缩比。群体图像中存在多个图像集,每个图像集中包含多张图像,每个图像集中的图像具有一定的相似性,会整体进行编码。因此群体图像对于图像的添加缺少了灵活性,需要进行图像集的管理。对于向群体图像中添加图像来说,首先需要找到与添加图像相似度最高的图像集。目前一般通过人眼进行主观判断,效率较低。词包模型最初被应用于文本信息检索领域中,忽略文档中单词的位置信息和语义信息,统计单词在文档中出现的频率,利用构建的单词分布直方图来描述文档的语义内容,通过文档到数值向量的转化将文本语言的 ...
【技术保护点】
1.一种用于群体图像插入的最优图像集选取方法,其特征在于,包括如下步骤:(1)提取多张训练图像的SIFT特征:从图像样本库中选取多张训练图像,并提取每张训练图像的SIFT特征,得到训练图像的SIFT特征向量集合;(2)建立视觉词典:对训练图像的SIFT特征向量集合中的SIFT特征向量进行聚类,得到多个聚类簇,并将每个聚类簇的聚类中心作为一个视觉单词,得到由多个视觉单词组成的视觉词典;(3)提取群体图像每个图像集中各图像的SIFT特征:分别提取群体图像中每个图像集中各图像的SIFT特征,得到每个图像集的SIFT特征向量集合;(4)获取每个图像集的视觉单词直方图:(4a)对每个图像集的SIFT特征向量集合中的各SIFT特征向量进行最近邻搜索,得到每个SIFT特征向量在视觉词典中对应的距离最近的视觉单词;(4b)统计每个视觉单词在图像集SIFT特征向量集合中出现的次数,并将每个视觉单词出现的次数作为被统计的SIFT特征向量集合对应的图像集的视觉单词直方图;(5)获取待插入图像的视觉单词直方图:(5a)提取待插入图像的SIFT特征,得到待插入图像的SIFT特征向量集合,并对待插入图像中的每个S ...
【技术特征摘要】
1.一种用于群体图像插入的最优图像集选取方法,其特征在于,包括如下步骤:(1)提取多张训练图像的SIFT特征:从图像样本库中选取多张训练图像,并提取每张训练图像的SIFT特征,得到训练图像的SIFT特征向量集合;(2)建立视觉词典:对训练图像的SIFT特征向量集合中的SIFT特征向量进行聚类,得到多个聚类簇,并将每个聚类簇的聚类中心作为一个视觉单词,得到由多个视觉单词组成的视觉词典;(3)提取群体图像每个图像集中各图像的SIFT特征:分别提取群体图像中每个图像集中各图像的SIFT特征,得到每个图像集的SIFT特征向量集合;(4)获取每个图像集的视觉单词直方图:(4a)对每个图像集的SIFT特征向量集合中的各SIFT特征向量进行最近邻搜索,得到每个SIFT特征向量在视觉词典中对应的距离最近的视觉单词;(4b)统计每个视觉单词在图像集SIFT特征向量集合中出现的次数,并将每个视觉单词出现的次数作为被统计的SIFT特征向量集合对应的图像集的视觉单词直方图;(5)获取待插入图像的视觉单词直方图:(5a)提取待插入图像的SIFT特征,得到待插入图像的SIFT特征向量集合,并对待插入图像中的每个SIFT特征向量进行最近邻搜索,得到多个SIFT特征向量在视觉词典中对应的距离最近的视觉单词;(5b)统计每个视觉单词在待插入图像的SIFT特征向量集合中出现的次数,并将其作为待插入图像的视觉单词直方图;(6)计算待插入图像与群体图像中每个图像集的相似性:采用余弦相似度计算待插入图像视觉单词直方图与每个图像集视觉单词直方图之间的余弦值,并将每一个余弦值作为待插入图像与余弦值对应的图像集的相似性,得到多个...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。