System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 供给相关性预测模型训练方法、供给相关性预测方法及装置制造方法及图纸_技高网

供给相关性预测模型训练方法、供给相关性预测方法及装置制造方法及图纸

技术编号:40483662 阅读:4 留言:0更新日期:2024-02-26 19:16
本说明书实施例提供供给相关性预测模型训练方法、供给相关性预测方法及装置。在进行模型训练时,使用编码器层中的正常编码器对正样本数据中的供给进行供给编码以及使用动量更新编码器对负样本数据中的替换供给进行供给编码,并使用编码后的正样本数据和负样本数据来执行供给相关性预测任务和对比学习任务以得到损失函数。随后,使用所得到的损失函数更新正常编码器的模型参数,而动量更新编码器的模型参数通过动量更新机制来跟随正常编码器的模型参数的更新而更新。

【技术实现步骤摘要】

本说明书实施例通常涉及移动互联网领域,尤其涉及供给相关性预测模型训练方法、供给相关性预测方法及装置


技术介绍

1、随着移动互联网的不断发展,移动互联网应用逐步进入超级应用模式。超级应用可以合并多种移动互联网应用的功能,从而提升用户的便利性并且实现灵活的移动互联网应用生态环境。图1示出了超级应用的生态架构的示例示意图。如图1所示,超级应用可以内嵌有小程序,并且通过内嵌的小程序所提供的能力来访问移动互联网所提供的各种供给(item)(比如,内容)。在本说明书中,术语“供给”可以包括经由移动互联网提供的各种服务或物品。供给的示例例如可以包括但不限于小程序服务商所提供的小程序、商家提供的商品、用户或内容提供商发布的内容(文本内容、视频内容、音频内容)等。

2、这些供给可以是跨场景或跨应用,比如,内容带服务、直播带商品、服务带权益(优惠券/折扣)等。单供给场景下的用户行为数据稀疏,难以深层次地捕捉和表征用户兴趣或用户意图,从而需要使用其它场景或其它应用中的相关性供给来丰富用户行为数据,实现多场景联动,由此提升用户兴趣表示或用户意图表示的准确性。


技术实现思路

1、本说明书实施例提供供给相关性预测模型训练方法、供给相关性预测方法及装置。在该供给相关性预测模型训练方案中,在供给相关性预测模型中构建具有正常编码器和动量更新编码器的编码器层,并且使用正常编码器对正样本数据中的供给进行供给编码以及使用动量更新编码器来对负样本数据中的替换供给进行供给编码,并使用编码后的正样本数据和负样本数据来执行供给相关性预测任务和对比学习任务以得到损失函数。随后,使用所得到的损失函数来更新正常编码器的模型参数,而动量更新编码器的模型参数通过动量更新机制来跟随正常编码器的模型参数的更新而更新。按照这种模型训练方法,通过使用双编码器结构来将正样本数据和负样本数据的编码过程分离,并且将动量更新编码器的模型参数设置为随着正常编码器的模型参数的更新而更新,从而将基于正样本数据和负样本数据的模型优化过程分离,由此消除基于正样本数据的模型优化过程和基于负样本数据的模型优化过程之间的不利影响,进而提升所训练出的供给相关性预测模型的模型性能。

2、根据本说明书的实施例的一个方面,提供一种用于训练供给相关性预测模型的方法,包括:构建当前批次训练样本数据集,所述当前批次训练样本数据集包括正样本数据和负样本数据,每个训练样本数据包括三元组(头部供给,关系标签,尾部供给),每个正样本数据所对应的负样本数据通过使用同批次训练样本数据集中的其它正样本数据对该正样本数据进行部分供给替换而生成;将所述正样本数据的头部供给和尾部供给的供给内容提供给供给相关性预测模型的编码器层中的正常编码器来编码得到所述正样本数据的头部供给和尾部供给的供给嵌入表示,以及将所述负样本数据的替换供给的供给内容提供给所述编码层中的动量更新编码器来编码得到所述负样本数据的替换供给的供给嵌入表示;将所述正样本数据的供给对的供给嵌入表示提供给所述供给相关性预测模型的相关性预测层来预测所述正样本数据的供给对之间的相关性,以及将所述负样本数据的供给对的供给嵌入表示提供给所述相关性预测层来预测所述负样本数据的供给对之间的相关性;根据所述正样本数据的相关性预测结果确定出预测损失函数,以及根据所述正样本数据和所述负样本数据的相关性预测结果确定出对比学习损失函数;以及使用所述预测损失函数和所述对比学习损失函数来执行所述供给相关性预测模型的模型参数调整,其中,所述正常编码器的模型参数根据所述预测损失函数和所述对比学习损失函数调整,以及所述动量更新编码器的模型参数通过使用动量更新机制来跟随所述正常编码器的模型参数的更新而更新。

3、可选地,在上述方面的一个示例中,每个正样本数据所对应的负样本数据包括通过使用同批次训练样本数据集中的其它正样本数据对该正样本数据进行尾部供给替换而生成的第一负样本数据,和/或通过使用同批次训练样本数据集中的其它正样本数据对该正样本数据进行头部供给替换而生成的第二负样本数据。

4、可选地,在上述方面的一个示例中,根据所述正样本数据和所述负样本数据的相关性预测结果确定出对比学习损失函数可以包括:根据所述正样本数据和所述负样本数据的相关性预测结果,确定所述正样本数据和所述负样本数据的关系标签置信度;以及根据所述正样本数据和所述负样本数据的关系标签置信度,确定出所述对比学习损失函数。

5、可选地,在上述方面的一个示例中,所述关系标签置信度可以按照下述公式确定出:φ(m,r,c)=1-|f(m,c)-g(r)|,其中,φ(m,r,c)表示样本数据(m,r,c)的关系标签置信度,m和c分别表示样本数据中的头部供给和尾部供给,r表示关系标签,f(m,c)表示供给m和c之间的相关性预测结果,以及g(.)表示映射函数。

6、可选地,在上述方面的一个示例中,在所述负样本数据包括第一负样本数据时,所述对比学习损失函数包括根据所述正样本数据和所述负样本数据的原始关系标签置信度确定出的第一对比学习损失函数。

7、可选地,在上述方面的一个示例中,在所述负样本数据包括第二负样本数据时,所述对比学习损失函数包括根据所述正样本数据和所述负样本数据的经过先验概率加权后的关系标签置信度确定出的第二对比学习损失函数。

8、可选地,在上述方面的一个示例中,所述方法还可以包括:将所述正样本数据和所述负样本数据中的各个供给的供给嵌入表示与对应的图结构信息嵌入表示提供给所述供给相关性预测模型的表征融合层进行表征融合来得到融合有图结构信息的供给嵌入表示,各个供给的图结构信息嵌入表示通过使用供给属性信息图进行图学习来学习出,所述供给属性信息图根据供给的属性信息构建出。相应地,将所述正样本数据的供给对的供给嵌入表示提供给所述供给相关性预测模型的相关性预测层来预测所述正样本数据的供给对之间的相关性,以及将所述负样本数据的供给对的供给嵌入表示提供给所述相关性预测层来预测所述负样本数据的供给对之间的相关性可以包括:将所述正样本数据的供给对的融合有图结构信息的供给嵌入表示提供给所述供给相关性预测模型的相关性预测层来预测所述正样本数据的供给对之间的相关性,以及将所述负样本数据的供给对的融合有图结构信息的供给嵌入表示提供给所述相关性预测层来预测所述负样本数据的供给对之间的相关性。

9、根据本说明书的实施例的另一方面,提供一种用于预测供给间相关性的方法,包括:将供给对的供给内容提供给供给相关性预测模型的编码器层中的正常编码器来编码得到所述供给对中的各个供给的供给嵌入表示;以及将所述供给对中的各个供给的供给嵌入表示提供给所述供给相关性预测模型的相关性预测层来预测所述供给对之间的相关性。

10、可选地,在上述方面的一个示例中,所述方法还可以包括:将所述供给对中的各个供给的供给嵌入表示与对应的图结构信息嵌入表示提供给所述供给相关性预测模型的表征融合层进行表征融合来得到各个供给的融合有图结构信息的供给嵌入表示,各个供给的图结构信息嵌入表示通过使用供给属本文档来自技高网...

【技术保护点】

1.一种用于训练供给相关性预测模型的方法,包括:

2.如权利要求1所述的方法,其中,每个正样本数据所对应的负样本数据包括通过使用同批次训练样本数据集中的其它正样本数据对该正样本数据进行尾部供给替换而生成的第一负样本数据,和/或通过使用同批次训练样本数据集中的其它正样本数据对该正样本数据进行头部供给替换而生成的第二负样本数据。

3.如权利要求1或2所述的方法,其中,根据所述正样本数据和所述负样本数据的相关性预测结果确定出对比学习损失函数包括:

4.如权利要求3所述的方法,其中,所述关系标签置信度按照下述公式确定出:

5.如权利要求3所述的方法,其中,在所述负样本数据包括第一负样本数据时,所述对比学习损失函数包括根据所述正样本数据和所述负样本数据的原始关系标签置信度确定出的第一对比学习损失函数。

6.如权利要求3所述的方法,其中,在所述负样本数据包括第二负样本数据时,所述对比学习损失函数包括根据所述正样本数据和所述负样本数据的经过先验概率加权后的关系标签置信度确定出的第二对比学习损失函数。

7.如权利要求1所述的方法,还包括:

8.一种用于预测供给间相关性的方法,包括:

9.如权利要求8所述的方法,还包括:

10.一种用于训练供给相关性预测模型的装置,包括:

11.如权利要求10所述的装置,其中,针对每个正样本数据,所述训练样本数据构建单元通过使用同批次训练样本数据集中的其它正样本数据对该正样本数据进行尾部供给替换而生成第一负样本数据,和/或通过使用同批次训练样本数据集中的其它正样本数据对该正样本数据进行头部供给替换而生成第二负样本数据。

12.如权利要求10或11所述的装置,其中,所述损失函数确定单元包括:

13.如权利要求12所述的装置,其中,在所述负样本数据包括第一负样本数据时,所述对比学习损失函数确定模块根据所述正样本数据和所述负样本数据的原始关系标签置信度确定出第一对比学习损失函数,和/或在所述负样本数据包括第二负样本数据时,所述对比学习损失函数确定模块根据所述正样本数据和所述负样本数据的经过先验概率加权后的关系标签置信度确定出第二对比学习损失函数。

14.如权利要求10所述的装置,还包括:

15.一种用于预测供给间相关性的装置,包括:

16.如权利要求15所述的装置,还包括:

17.一种用于训练供给相关性预测模型的装置,包括:

18.一种用于预测供给间相关性的装置,包括:

...

【技术特征摘要】

1.一种用于训练供给相关性预测模型的方法,包括:

2.如权利要求1所述的方法,其中,每个正样本数据所对应的负样本数据包括通过使用同批次训练样本数据集中的其它正样本数据对该正样本数据进行尾部供给替换而生成的第一负样本数据,和/或通过使用同批次训练样本数据集中的其它正样本数据对该正样本数据进行头部供给替换而生成的第二负样本数据。

3.如权利要求1或2所述的方法,其中,根据所述正样本数据和所述负样本数据的相关性预测结果确定出对比学习损失函数包括:

4.如权利要求3所述的方法,其中,所述关系标签置信度按照下述公式确定出:

5.如权利要求3所述的方法,其中,在所述负样本数据包括第一负样本数据时,所述对比学习损失函数包括根据所述正样本数据和所述负样本数据的原始关系标签置信度确定出的第一对比学习损失函数。

6.如权利要求3所述的方法,其中,在所述负样本数据包括第二负样本数据时,所述对比学习损失函数包括根据所述正样本数据和所述负样本数据的经过先验概率加权后的关系标签置信度确定出的第二对比学习损失函数。

7.如权利要求1所述的方法,还包括:

8.一种用于预测供给间相关性的方法,包括:

9.如权利要求8所述的方法,还包...

【专利技术属性】
技术研发人员:田雨露顾嘉扬胡余润钟文亮
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1