【技术实现步骤摘要】
本专利技术属于图像处理
,具体涉及一种图像检索技术,可以用于大规模商品图像的检索管理和图像搜索引擎等以图搜图领域。
技术介绍
在Web2.0时代,尤其是随着Flickr、Facebook等社交网站的流行,图像、视频、音频、文本等异构数据每天都在以惊人的速度增长。例如,图像共享网站Flick截止到2014年12月份,总共上传的图片总量已经达到42.5亿,Facebook注册用户超过10亿,每月上传超过10亿的图片。如何更好地建立有效的检索机制,在浩瀚的图像库中实现方便、快速、准确地查询并检索到用户所需的图像信息,成为多媒体信息检索领域亟待解决的问题。从图像检索的发展方向看,可以分为基于文本的图像检索(TBIR)和基于内容的图像检索(CBIR):基于文本的图像检索(TBIR)需要人工对图像中的语义内容进行手动标注,然后采用传统数据库技术或文本信息检索技术对图像的语义关键词进行存储、索引和检索。这种方法虽然成熟的数据库检索技术做支持,检索速度比较快,但随着图像数据规模的迅速增大,人工标注方法逐渐暴露出效率低下以及人工标注的主观性和不一致性等缺陷。基于内容的图像检索(CBIR)利用图像自身包含的丰富视觉信息,并且充分利用了计算机处理能力强以及长于处理重复任务的优点,克服了基于文本的图像检索在大数据时代的局限性。基于内容的图像检索过程大致分为三个步骤:①对图像库中图像提取颜色、轮廓、纹理、关键点等底层特征,生成高维特征描述子;②采用倒排文档、基于树结构或哈希等将生成的描述子建立有效的索引结构;③对用户输入的图像提取特征生成查询向量,在前面建立的索引结构中查找 ...
【技术保护点】
一种基于潜在语义最小哈希的图像检索方法,其特征在于:包括以下步骤:1】划分数据集:在数据集中随机抽取部分图像作为测试集,其余图像作为训练集;2】构建基于潜在语义最小哈希模型:2.1】使用卷积网络模型对测试集和训练集中的每一幅图像提取卷积网络特征,并对提取的卷积网络特征做L2规范化;训练集对应生成训练特征向量集Xtrain,测试集对应生成测试特征向量集Xtest;对Xtrain和Xtest进行统一的中心化处理;2.2】对中心化处理后的训练特征向量集Xtrain进行矩阵分解得到其潜在语义表示,同时在量化编码时对其作量化误差最小化限制;构造的潜在语义最小哈希模型为:argminT=||X-VU||F2+λ||Y-VT||F2+γ1||V||F2+γ2||U||F2]]>TTT=I其中,X为特征向量集,λ、γ1和γ2为权重参数,U为X经过矩阵分解后的基,V为X分解后得到的X的潜在语义表示变量,Y为X经过哈希编码后的哈希序列;3】求解变换矩阵T:将Xtrain代入X后,使用交替迭代方法求解所述潜在语义最小哈希模型,生成变换矩阵T;计算Y=sgn(VT),得到 ...
【技术特征摘要】
1.一种基于潜在语义最小哈希的图像检索方法,其特征在于:包括以下步骤:1】划分数据集:在数据集中随机抽取部分图像作为测试集,其余图像作为训练集;2】构建基于潜在语义最小哈希模型:2.1】使用卷积网络模型对测试集和训练集中的每一幅图像提取卷积网络特征,并对提取的卷积网络特征做L2规范化;训练集对应生成训练特征向量集Xtrain,测试集对应生成测试特征向量集Xtest;对Xtrain和Xtest进行统一的中心化处理;2.2】对中心化处理后的训练特征向量集Xtrain进行矩阵分解得到其潜在语义表示,同时在量化编码时对其作量化误差最小化限制;构造的潜在语义最小哈希模型为: arg min T = | | X - VU | | F 2 + λ | | Y - VT | | F 2 + γ 1 | | V | | F 2 + γ 2 | | U | | F 2 ]]>TTT=I其中,X为特征向量集,λ、...
【专利技术属性】
技术研发人员:李学龙,卢孝强,袁勇,
申请(专利权)人:中国科学院西安光学精密机械研究所,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。