【技术实现步骤摘要】
基于多模态训练的信息匹配方法、装置、电子设备及介质
[0001]本专利技术涉及人工智能领域,尤其涉及一种基于多模态训练的信息匹配方法、装置、电子设备及存储介质。
技术介绍
[0002]随着社会发展和科技进步,大量不同模态种类的信息也涌现出来,在金融科技领域中,与电子交易和电子商务相关的信息有文本信息、图像信息、视频信息和音频信息,而传播最为广泛的还是文本信息和图像信息,因此,如何根据文本信息得到与之匹配的图像信息或者根据图像信息得到与之匹配的文本信息成为关键。
[0003]现有的信息匹配方法通常是通过执行跨模态对齐方法实现的,这种方法会忽略每个模态中的数据潜力,同时对于一些相似语义的文本或者相似形状的图形无法准确的区分,因此导致进行信息匹配的准确度较低,故亟待提出一种准确度更高的信息匹配方法。
技术实现思路
[0004]本专利技术提供一种基于多模态训练的信息匹配方法、装置、电子设备及存储介质,其主要目的在于提高信息匹配的准确度。
[0005]为实现上述目的,本专利技术提供的一种基于多模态训练的信息匹配方法,包括:
[0006]获取图文样本数据集,将所述图文样本数据集输入至预构建的多模态预训练模型中,得到多个文本特征向量和多个图像特征向量;
[0007]分别计算多个所述文本特征向量之间的文本对比损失值及多个图像特征向量之间的图像对比损失值,根据所述文本对比损失值和所述图像对比损失值构建样本损失函数;
[0008]提取所述图像特征向量中的全局图像特征向量和局部图像特 ...
【技术保护点】
【技术特征摘要】
1.一种基于多模态训练的信息匹配方法,其特征在于,所述方法包括:获取图文样本数据集,将所述图文样本数据集输入至预构建的多模态预训练模型中,得到多个文本特征向量和多个图像特征向量;分别计算多个所述文本特征向量之间的文本对比损失值及多个图像特征向量之间的图像对比损失值,根据所述文本对比损失值和所述图像对比损失值构建样本损失函数;提取所述图像特征向量中的全局图像特征向量和局部图像特征向量,根据所述全局图像特征向量和所述局部图像特征向量构建图像损失函数,提取所述文本特征向量中的全局文本特征向量和局部文本特征向量,根据所述全局文本特征向量和所述局部文本特征向量构建文本损失函数;根据所述图像损失函数和所述文本损失函数构建模态信息损失函数,并利用所述模态信息损失函数和所述样本损失函数对所述多模态预训练模型进行模型训练,得到训练好的标准多模态模型;获取待匹配信息,将所述待匹配信息输入至所述标准多模态模型中,得到信息匹配结果。2.如权利要求1所述的基于多模态训练的信息匹配方法,其特征在于,所述将所述图文样本数据集输入至预构建的多模态预训练模型中,得到多个文本特征向量和多个图像特征向量,包括:识别所述图文样本数据集中样本数据的数据类型,并根据所述数据类型对所述图文样本数据集进行数据分类,得到图像样本数据集和文本样本数据集;将所述图像样本数据集中的图像样本数据输入至所述多模态预训练模型中的图像侧,得到多个图像特征向量;将所述文本样本数据集中的文本样本数据输入至所述多模态预训练模型中的文本侧,得到多个文本特征向量。3.如权利要求2所述的基于多模态训练的信息匹配方法,其特征在于,所述将所述图像样本数据集中的图像样本数据输入至所述多模态预训练模型中的图像侧,得到多个图像特征向量,包括:利用所述多模态预训练模型中的图像侧对所述图像样本数据进行全局特征提取,得到全局图像特征向量,并将所述全局图像特征向量作为第一类图像特征向量;对所述图像样本数据进行局部特征提取,得到局部图像特征向量,并将所述局部图像特征向量作为第二类图像特征向量;将所述第一类图像特征向量和所述第二类图像特征向量进行拼接处理,并对拼接处理后的向量进行维度变换,得到图像特征向量;遍历所述图像样本数据集中的多条图像样本数据进行数据处理,得到多个图像特征向量。4.如权利要求1所述的基于多模态训练的信息匹配方法,其特征在于,所述计算多个所述文本特征向量之间的文本对比损失值,包括:识别多个文本特征向量中的正文本向量和负文本向量,并选取任意一个正文本向量作为目标正文本向量,选取与所述目标正文本向量对应的负文本向量作为目标负文本向量;将所述目标正文本向量和所述目标负文本向量输入至预设的文本对比损失函数公式
中,得到文本对比损失值。5.如权利要求4所述的基于多模态训练的信息匹配方法,其特征在于,所述预设的文本对比损失函数公式为:其中,L
nce
(T
+
,T
‑
)为文本对比损失函数...
【专利技术属性】
技术研发人员:刘羲,蒋恒智,舒畅,陈又新,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。