信息的匹配方法及装置制造方法及图纸

技术编号:30830417 阅读:19 留言:0更新日期:2021-11-18 12:42
本发明专利技术涉及人工智能技术领域,揭露一种信息的匹配方法,包括:获取不同模态表征的对象信息;针对每种模态表征的对象信息,调用相应模态表征下预先训练的特征取模型进行特征提取,得到具有不同模态属性的嵌入式向量,特征提取模型使用加性角度间隔损失函数进行训练,用于从模态表征的对象信息中提取具有模态属性的嵌入式向量;利用邻近向量混合算法,对具有不同模态属性的嵌入式向量进行更新,得到融合有相邻向量特征的对象信息向量;计算融合有相邻向量特征的对象信息向量之间的相似度,并根据相似度计算结果确定对象信息之间的匹配程度。本发明专利技术能够结合对象信息在不同模态表征下的嵌入式向量进行对象信息匹配,提高匹配到对象信息的准确率。对象信息的准确率。对象信息的准确率。

【技术实现步骤摘要】
信息的匹配方法及装置


[0001]本专利技术涉及人工智能
,尤其是涉及到信息的匹配方法、装置、计算机设备及计算机存储介质。

技术介绍

[0002]随着互联网的不断发展,人们每天产生与接收的信息量成爆炸式增长,无形中造成了信息过载的问题。在大量数据集中寻找相似重复的数据是许多网络平台的重要业务,以网络平台中对象为例,商家可以在网络平台上传对象的图片以及简短的对象文字表述。但是不同商家对同一对象所上传的图片可能差异很大,文字描述也存在很大的区别,使得相似对象信息从图片和文字描述方面上很难被辨别,不利于对对象信息进行相似匹配。
[0003]目前,针对对象信息的匹配主要包括图片匹配和文字描述匹配两种,基于给定的目标对象信息,图片匹配通常使用局部敏感哈希算法对近似的图片进行检测,进而匹配出与目标对象相似的图片,然而,该方式仅从图片本身出发,并未考虑图片中对象的本质,使得匹配到的对象信息准确率较低;文字描述匹配通常使用短文本匹配算法,加入余弦相似度或文本编辑距离等对近似的文字描述进行检索,然而,该方式一般应用于用于信息检索或问答场景,针对标签短语拼凑的文字描述,使得匹配到的对象信息准确率较低。

技术实现思路

[0004]有鉴于此,本专利技术提供了一种信息的匹配方法、装置、计算机设备及计算机存储介质,主要目的在于解决现有技术中基于图片和文字描述匹配得到的对象信息准确率较低的问题。
[0005]依据本专利技术一个方面,提供了一种信息的匹配方法,该方法包括:
[0006]获取不同模态表征的对象信息;
[0007]针对每种模态表征的对象信息,调用相应模态表征下预先训练的特征取模型进行特征提取,得到具有不同模态属性的嵌入式向量,所述特征提取模型使用加性角度间隔损失函数进行训练,用于从模态表征的对象信息中提取具有模态属性的嵌入式向量;
[0008]利用邻近向量混合算法,对所述具有不同模态属性的嵌入式向量进行更新,得到融合有相邻向量特征的对象信息向量;
[0009]计算所述融合有相邻向量特征的对象信息向量之间的相似度,并根据相似度计算结果确定对象信息之间的匹配程度。
[0010]在本专利技术另一实施例中,在所述针对每种模态表征的对象信息,调用相应模态表征下预先训练的特征取模型进行特征提取,得到具有不同模态属性的嵌入式向量之前,所述方法还包括:
[0011]利用网络模型分别对不同模态表征的对象信息样本集进行处理,得到不同模态表征下对象信息的嵌入式向量,所述对象信息样本集中携带有对象类别标签;
[0012]针对不同模态表征的对象信息样本,使用加性角度间隔损失函数对所述嵌入式向
量与权重矩阵点乘得到的角度进行扰动,并根据扰动后的角度输出的目标特征向量;
[0013]使用分类函数对所述目标特征向量进行对象信息的类别标签预测,构建每种模态表征下的特征提取模型。
[0014]在本专利技术另一实施例中,所述利用网络模型分别对不同模态表征的对象信息样本集进行处理,得到不同模态表征下对象信息的嵌入式向量,具体包括:
[0015]将所述不同模态表征的对象信息样本集进行向量化,得到不同模态表征的对象向量;
[0016]利用网络模型的池化层分别对所述不同模态表征的对象向量进行特征聚合,得到不同模态表征的对象特征向量;
[0017]基于样本维度的批标准化和基于特征维度的正则化对特征聚类的对象特征向量进行标准化处理,得到不同模态表征下对象信息的嵌入式向量。
[0018]在本专利技术另一实施例中,所述针对不同模态表征的对象信息样本,使用加性角度间隔损失函数对所述嵌入式向量与权重矩阵点乘得到的角度进行扰动,并根据扰动后的角度输出目标特征向量,具体包括:
[0019]针对不同模态表征的对象样本信息,使用加性角度间隔损失函数将所述嵌入式向量与所述嵌入式向量正则化后的权重矩阵进行点乘,得到余弦值;
[0020]通过对所述余弦值进行反操作得到的角度加上角度间隔进行扰动,并计算扰动后角度的余弦值作为目标特征向量。
[0021]在本专利技术另一实施例中,在所述使用分类函数对所述目标特征向量进行对象信息的类别标签预测,构建每种模态表征下的特征提取模型之后,所述方法还包括:
[0022]利用预先设置的损失函数,结合对象信息预测的类别标签与对象信息样本集的类别标签对每种模态表征下的特征提取模型进行参数调整,更新所述特征提取模型。
[0023]在本专利技术另一实施例中,所述利用邻近向量混合算法,对所述具有不同模态属性的嵌入式向量进行更新,得到融合有相邻向量特征的对象信息向量,具体包括:
[0024]分别计算所述具有不同模态属性的嵌入式向量之间的距离值,若所述距离值大于预设阈值,则确定所述嵌入式向量之间具有相邻关系;
[0025]利用所述距离值映射的更新力度,对所述具有相邻关系的嵌入式向量进行至少一次更新。
[0026]在本专利技术另一实施例中,在所述计算所述融合有相邻向量特征的对象信息向量之间的相似度,并根据相似度计算结果确定对象信息之间的匹配程度之后,所述方法还包括:
[0027]响应于对目标对象信息进行相似推送或屏蔽的指令,选取与所述目标对象信息之间的匹配程度排名在预设数值之前的对象信息作为相似对象信息,向用户推送或屏蔽所述相似对象信息。
[0028]依据本专利技术另一个方面,提供了一种信息的匹配装置,所述装置包括:
[0029]获取单元,用于获取不同模态表征的对象信息;
[0030]调用单元,用于针对每种模态表征的对象信息,调用相应模态表征下预先训练的特征取模型进行特征提取,得到具有不同模态属性的嵌入式向量,所述特征提取模型使用加性角度间隔损失函数进行训练,用于从模态表征的对象信息中提取具有模态属性的嵌入式向量;
[0031]更新单元,用于利用邻近向量混合算法,对所述具有不同模态属性的嵌入式向量进行更新,得到融合有相邻向量特征的对象信息向量;
[0032]计算单元,用于计算所述融合有相邻向量特征的对象信息向量之间的相似度,并根据相似度计算结果确定对象信息之间的匹配程度。
[0033]在本专利技术另一实施例中,所述装置还包括:
[0034]处理单元,用于在所述针对每种模态表征的对象信息,调用相应模态表征下预先训练的特征取模型进行特征提取,得到具有不同模态属性的嵌入式向量之前,利用网络模型分别对不同模态表征的对象信息样本集进行处理,得到不同模态表征下对象信息的嵌入式向量,所述对象信息样本集中携带有对象类别标签;
[0035]扰动单元,用于针对不同模态表征的对象信息样本,使用加性角度间隔损失函数对所述嵌入式向量与权重矩阵点乘得到的角度进行扰动,并根据扰动后的角度输出的目标特征向量;
[0036]构建单元,用于使用分类函数对所述目标特征向量进行对象信息的类别标签预测,构建每种模态表征下的特征提取模型。
[0037]在本专利技术另一实施例中,所述处理单元包括:
[0038本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息的匹配方法,其特征在于,所述方法包括:获取不同模态表征的对象信息;针对每种模态表征的对象信息,调用相应模态表征下预先训练的特征取模型进行特征提取,得到具有不同模态属性的嵌入式向量,所述特征提取模型使用加性角度间隔损失函数进行训练,用于从模态表征的对象信息中提取具有模态属性的嵌入式向量;利用邻近向量混合算法,对所述具有不同模态属性的嵌入式向量进行更新,得到融合有相邻向量特征的对象信息向量;计算所述融合有相邻向量特征的对象信息向量之间的相似度,并根据相似度计算结果确定对象信息之间的匹配程度。2.根据权利要求1所述的方法,其特征在于,在所述针对每种模态表征的对象信息,调用相应模态表征下预先训练的特征取模型进行特征提取,得到具有不同模态属性的嵌入式向量之前,所述方法还包括:利用网络模型分别对不同模态表征的对象信息样本集进行处理,得到不同模态表征下对象信息的嵌入式向量,所述对象信息样本集中携带有对象类别标签;针对不同模态表征的对象信息样本,使用加性角度间隔损失函数对所述嵌入式向量与权重矩阵点乘得到的角度进行扰动,并根据扰动后的角度输出的目标特征向量;使用分类函数对所述目标特征向量进行对象信息的类别标签预测,构建每种模态表征下的特征提取模型。3.根据权利要求2所述的方法,其特征在于,所述利用网络模型分别对不同模态表征的对象信息样本集进行处理,得到不同模态表征下对象信息的嵌入式向量,具体包括:将所述不同模态表征的对象信息样本集进行向量化,得到不同模态表征的对象向量;利用网络模型的池化层分别对所述不同模态表征的对象向量进行特征聚合,得到不同模态表征的对象特征向量;基于样本维度的批标准化和基于特征维度的正则化对特征聚类的对象特征向量进行标准化处理,得到不同模态表征下对象信息的嵌入式向量。4.根据权利要求2所述的方法,其特征在于,所述针对不同模态表征的对象信息样本,使用加性角度间隔损失函数对所述嵌入式向量与权重矩阵点乘得到的角度进行扰动,并根据扰动后的角度输出目标特征向量,具体包括:针对不同模态表征的对象样本信息,使用加性角度间隔损失函数将所述嵌入式向量与所述嵌入式向量正则化后的权重矩阵进行点乘,得到余弦值;通过对所述余弦值进行反操作得到的角度加上角度间隔进行扰动,并计算扰动后角度的余弦值作...

【专利技术属性】
技术研发人员:谯轶轩陈浩
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1