【技术实现步骤摘要】
多模态数据匹配度计算和计算模型训练的方法、相关装置
[0001]本公开涉及深度学习、图像处理和计算机视觉等人工智能
,尤其涉及一种多模态数据匹配度计算模型的训练和多模态数据匹配度计算方法,以及以对应的装置、电子设备、计算机可读存储介质及计算机程序产品。
技术介绍
[0002]跨模态匹配目的在于为不同模态的数据之间建立语义关联,其中某一模态数据作为查询项,对与其具有相同或相近语义的其他模态数据进行匹配。其中,作为互联网中最为广泛存在的两类信息,图像和文本之间的跨模态检索,即图像
‑
文本匹配,也被普遍认为是跨模态检索中的核心任务。
技术实现思路
[0003]本公开实施例提出了一种多模态数据匹配度计算模型的训练、多模态数据匹配度计算方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
[0004]第一方面,本公开实施例提出了一种多模态数据匹配度计算模型的训练方法,包括:获取模态不同的第一样本数据和第二样本数据;构建包括语义困惑度参数的对比学习损失函数,该语义困惑度参数基于该第一样本数据和该第二样本数据间的语义特征距离确定;利用该对比学习损失函数,以对比学习的方式训练初始多模态数据匹配度计算模型,得到目标多模态数据匹配度计算模型。
[0005]第二方面,本公开实施例提出了一种多模态数据匹配度计算模型的训练装置,包括:样本数据获取单元,被配置成获取模态不同的第一样本数据和第二样本数据;损失函数构建单元,被配置成构建包括语义困惑度参数的对比学习损失函数,该语义困惑度参 ...
【技术保护点】
【技术特征摘要】
1.一种多模态数据匹配度计算模型的训练方法,包括:获取模态不同的第一样本数据和第二样本数据;构建包括语义困惑度参数的对比学习损失函数,所述语义困惑度参数基于所述第一样本数据和所述第二样本数据间的语义特征距离确定;利用所述对比学习损失函数,以对比学习的方式训练初始多模态数据匹配度计算模型,得到目标多模态数据匹配度计算模型。2.根据权利要求1所述的方法,还包括:获取多个所述第一样本数据和多个所述第二样本数据;将各所述第一样本数据的语义特征存入第一记忆银行、将各所述第二样本数据的语义特征存入第二记忆银行;分别对所述第一记忆银行和所述第二记忆银行的编码器进行动量更新,并从完成动量更新的第一记忆银行中提取第一语义特征、从完成动量更新的第二记忆银行中提取第二语义特征;基于所述第一语义特征与所述第二语义特征的语义特征距离,确定所述语义困惑度参数。3.根据权利要求2所述的方法,其中,所述将各所述第一样本数据的语义特征存入第一记忆银行、将各所述第二样本数据的语义特征存入第二记忆银行,包括:将至少两个所述第一样本数据以集合的形式存入所述第一记忆银行、将至少两个所述第二样本数据以集合的形式存入所述第二记忆银行。4.根据权利要求1所述的方法,其中,所述构建包括语义困惑度参数的对比学习损失函数,包括:获取对比学习方式中用以监督模型训练的初始对比学习损失函数;利用所述第一样本数据与所述第二样本数据间的语义特征的余弦关系表征所述语义困惑度参数;基于所述初始对比学习损失函数与所述语义困惑度参数构建所述对比学习损失函数。5.根据权利要求2或3所述的方法,还包括对所述对比学习损失函数中的以下至少一项施加约束:所述第一样本数据、所述第二样本数据、基于所述第一记忆银行得到的第一样本数据的语义特征、基于所述第二记忆银行得到的第二样本数据的语义特征。6.根据权利要求1所述的方法,其中,所述第一样本数据包括样本图像数据,所述第二样本数据包括样本文本数据。7.一种多模态数据匹配度计算方法,包括:获取模态不同的第一数据和第二数据构成的待测数据对;调用预设的多模态数据匹配度计算模型处理所述待测数据对,得到所述待测数据对的语义匹配度;其中,所述多模态数据匹配度计算模型基于对比学习损失函数以对比学习的方式训练得到,所述对比学习损失函数包含有语义困惑度参数,所述语义困惑度参数基于模态不同的第一样本数据和第二样本数据间的语义特征距离确定。8.根据权利要求7所述的方法,其中,所述第一数据包括图像数据,所述第二数据包括文本数据。
9.一种多模态数据匹配度计算模型的训练装置,包括:样本数据获取单元,被配置成获取模态不同的第一样本数据和第二样本数据;损失函数构建单元,被配置成构建包括语义困惑度参数的对比学习损失函数,所述语义困惑度参数基于所述第一样本数据和所述第二样本数据间的语义特征距离确定;多模态数据匹配度计算模型的训练单元,被配置成利用所述对比学习损失函数,以对比学习的方式训练初始多模态数据匹配度计算模型,得到目标多模态数据匹配度计算模型。10.根据权利要求9所述的装置,还包括:样本数据批量获取单元,被配置成获取多个所述第一样本数据和多个所述第二样本数据;记忆银行存入单元,被配置成将各所述第一样本数据的语义特征存入第一...
【专利技术属性】
技术研发人员:汪浩然,何栋梁,李甫,丁二锐,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。