【技术实现步骤摘要】
基于监督语义耦合一致的跨模态哈希检索方法及系统
本专利技术属于电子商务,多媒体智能及数据挖掘
,特别涉及一种基于监督语义耦合一致的跨模态哈希检索方法及系统。
技术介绍
随着网络智能媒体技术的快速发展,信息检索也呈现多元化形态,而多元化检索的需求不仅仅涉及到传统单一模态情景下的内容检索,也涉及到多模态之间互相关的内容检索,通过多模态信息检索能够更加全面的展现检索内容所包含的数据信息。如:可利用检索的文本信息,产生对应语义相关性的图像信息、视频信息、语音信息等各种模态数据信息。而不同模态之间的信息关联性需在检索前,进行相应的信息挖掘,从而诞生了通过利用一种模态的信息内容来搜索与之关联的其他模态数据的方法,称为跨模态检索技术。为了能够将各模态下的信息建立相互关联性,通过构建一种公共子空间的方式,通过利用投影映射转换将各个模态下的数据特征信息进行相似性度量,实现各个模态下关联度较大的特征具有内联性,既而有效解决跨模态数据信息的检索。如:论文“RasiwasiaN,PereiraJC,CovielloE,etal.ANewApproachtoCross-ModalMultimediaRetrieval.”中提出了一种相关分析CCA方法,通过构建投影矩阵进行最大化度量各个模态数据特征信息间的相似性;论文“PutthividhyaD,AttiasHT,NagarajanSS.Topicregressionmulti-modalLatentDirichletAllocationforimageannotation.”中 ...
【技术保护点】
1.一种基于监督语义耦合一致的跨模态哈希检索方法,其特征在于,所述方法包括以下步骤:/n步骤1,提取各模态数据库中模态样本数据的特征,构建样本库集合;/n步骤2,求取样本库集合中各模态样本的哈希编码;/n步骤3,提取待检索模态数据的特征,并根据该特征求取待检索模态数据的哈希编码;/n步骤4,对比待检索模态数据的哈希编码与各模态样本的哈希编码,对比结果符合预设条件的模态样本即作为待检索模态数据的检索结果。/n
【技术特征摘要】 【专利技术属性】
1.一种基于监督语义耦合一致的跨模态哈希检索方法,其特征在于,所述方法包括以下步骤:
步骤1,提取各模态数据库中模态样本数据的特征,构建样本库集合;
步骤2,求取样本库集合中各模态样本的哈希编码;
步骤3,提取待检索模态数据的特征,并根据该特征求取待检索模态数据的哈希编码;
步骤4,对比待检索模态数据的哈希编码与各模态样本的哈希编码,对比结果符合预设条件的模态样本即作为待检索模态数据的检索结果。
2.根据权利要求1所述的基于监督语义耦合一致的跨模态哈希检索方法,其特征在于,步骤1所述提取各模态数据库中模态样本数据的特征,构建样本库集合,具体包括:
步骤1-1,针对每一模态,构建其对应的数据特征提取模型,并对该模型进行训练;
步骤1-2,利用训练后的模型提取对应模态样本数据的特征;
步骤1-3,根据提取的特征构建样本库集合{P_marry,Q_marry,Y_marry},其中P_marry=[p1,p2,p3…,ps]为第一模态数据特征矩阵,Q_marry=[q1,q2,q3…,qs]为第二模态数据特征矩阵,Y_marry=[y1,y2,y3…,ys]为标签数据特征矩阵。
3.根据权利要求2所述的基于监督语义耦合一致的跨模态哈希检索方法,其特征在于,步骤2所述求取样本库集合中各模态样本的哈希编码,具体包括:
步骤2-1,构建各模态对应的线性分离器损失函数;
针对第一模态数据特征矩阵中的样本pi,假设其转化后的哈希二位码为以及对应的标签为yi,由此构建第一模态线性分离器损失函数:
式中,为样本库集合中第一模态样本数据对应的哈希编码矩阵,k为哈希码的位数,W1为第一模态的线性分离器,μ为第一模态线性分离器的正则化参数;
针对第二模态数据特征矩阵中的样本qi,假设其转化后的哈希二位码为以及对应的标签为yi,由此构建第二模态线性分离器损失函数:
式中,为样本库集合中第二模态样本数据对应的哈希编码矩阵,k为哈希码的位数,W2为第二模态的线性分离器,μ为第二模态线性分离器的正则化参数;
步骤2-2,定义第一模态和第二模态的邻近区域相似性矩阵分别为和
式中,Nm(p)为第一模态特征数据p的m近邻集合,Nm(q)为第二模态特征数据q的m近邻集合;
由此构建模态近邻约束损失函数:
式中,ν为模态近邻约束损失函数的约束平衡参数;
步骤2-3,利用矩阵运算将模态近邻约束损失函数转换为:
式中,tr(·)为矩阵的迹,
步骤2-4,利用映射矩阵F1、F2分别将第一模态和第二模态特征转换为对应的哈希编码矩阵:
B1=F1P_marry,B2=F2Q_marry
由此构建各个模态相互间的耦合语义一致性损失函数:
式中,λ、θ均为耦合语义一致性损失函数的平衡参数;
步骤2-5,结合上述步骤2-1至步骤2-4,构建全局损失函数:
步骤2-6,求解所述全局损失函数,获取参数B1,B2,F1,F2,W1,W2的值;
步骤2-7,进一步求取符号函数sign(B1)和sign(B2),分别获得样本库集合中第一模态、第二模态对应的离散哈希编码矩阵。
4.根据权利要求3所述的基于监督语义耦合一致的跨模态哈希检索方法,其特征在于,步骤2-7求解所述全局损失函数,获取参数B1,B2,F1,F2,W1,W2的值,采用的求解方式为:求解某一参数时,固定其余参数,进行迭代更新优化求解,直至收敛。
5.根据权利要求3或4所述的基于监督语义耦合一致的跨模态哈希检索方法,其特征在于,步骤3所述提取待检索模态数据的特征,并根据该特征求取待检索模态数据的哈希编码,具体过程包括:
假设待检索模态数据的特征为d,根据步骤2-7获得的F1或F2求取待检索模态数据的哈希编码:
B=F1d或F2d
之后进一步求取待检索模态数据的离散哈希编码:
b=sign(B)=sign(F1d)或sign(F2d)。
技术研发人员:杨帆,丁晓剑,刘禹锋,刘健,曹杰,
申请(专利权)人:南京财经大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。