【技术实现步骤摘要】
一种多场景下的物品检索方法及系统
[0001]本专利技术涉及图像处理
,特别是涉及一种多场景下的物品检索方法及系统。
技术介绍
物品检索旨在利用计算机或者机器人对摄像机拍摄的图像进行处理、分析和理解,以识别各种不同模式的目标和对象,是计算机视觉领域的重要研究课题。
[0002]多场景包括如易混淆样本场景、多标签样本场景和零样本场景,如多标签样本场景为一个图像有多个类别标签,此时判断是否同类的标准为两幅图像至少存在一个同类;零样本场景为测试集中的类别不包含训练集中的类别,如训练集中有狗、老鼠、马、羊四个类别,测试集中有猫、蛇等其他类别,这需要在训练模型时学习通用的分类知识,从而达到即使没见过这个类别也能判断出该类别不属于某些已知类别。诸如此类的难学习的样本场景,被称为困难样本场景。
[0003]如今,已经可以使用机器人来收集真实环境的图像,并通过训练得到一个分类器。对于简单的图像而言,很容易为其学到一个合适的特征表示,以将其与不同语义的样本区分开来;而在困难样本场景中,如易混淆样本场景和多标签样本场景,由于包含难以学习的图像 ...
【技术保护点】
【技术特征摘要】
1.一种多场景下的物品检索方法,其特征在于,包括:对获取的图像训练集采用哈希学习提取图像特征,并对预构建的物品检索模型进行训练;当图像在困难样本场景下时,在哈希学习中引入自适应优化的相似矩阵,所述相似矩阵通过图像转移矩阵进行优化,以优化后的相似矩阵和图像类别标签,构建自适应相似矩阵目标函数;根据图像转移矩阵构建图像与哈希码间的量化损失目标函数;将自适应相似矩阵目标函数和量化损失目标函数进行非线性哈希映射后,得到模型目标函数;当图像在零样本场景下,在哈希学习中引入用于约束哈希码生成的非对称比例相似矩阵,以图像类别标签为监督信息,结合哈希码的平衡和去相关约束构建目标函数,将目标函数进行非线性哈希映射后,得到模型目标函数;基于模型目标函数训练物品检索模型,对待检索的目标物品图像基于训练后的物品检索模型得到检索结果。2.如权利要求1所述的一种多场景下的物品检索方法,其特征在于,所述自适应相似矩阵目标函数为:其中,1
n
是nx1的全1向量,n是样本个数;s
ij
是图像x
i
和图像x
j
的相似性权重,s
i
是第i个元素为s
ij
的向量,W是图像与哈希码间的转移矩阵;S是相似性矩阵;y
i
、y
i
是类别标签;、为正参数。3.如权利要求1所述的一种多场景下的物品检索方法,其特征在于,所述量化损失目标函数为:其中,W是图像与哈希码间的转移矩阵,P是图像与非线性哈希间的转移矩阵,X为图像训练集,B为哈希码,和是正参数,k是哈希码长度,n是样本个数,||.||
F
是f范数。4.如权利要求1所述的一种多场景下的物品检索方法,其特征在于,所述非线性哈希映射为通过核函数将目标函数进行扩展,扩展为非线性哈希,即:其中,是非线性映射,d是图像x
n
的特征维度,是映射后的维度,X为图像训练集,n是样本个数。5.如权利要求1所述的一种多场景下的物品检索方法,其特征在于,在困难样本场景下的模型目标函数为:
其中,n是样本个数,W是图像与哈希码间的转移矩阵,P是图像与非线性哈希间的转移矩阵;X为图像训练集,B为哈希码,1
n
是nx1的全1向量,s
ij
是图像x
i
和图像x
j
的相似性权重,s
i
...
【专利技术属性】
技术研发人员:聂秀山,史洋,郭杰,刘兴波,尹义龙,
申请(专利权)人:山东建筑大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。