资源交互预测模型训练方法和装置和资源推荐方法和装置制造方法及图纸

技术编号:33926903 阅读:18 留言:0更新日期:2022-06-25 21:52
本公开提供一种资源交互预测模型训练方法和装置以及资源推荐方法和装置。所述资源交互预测模型包括特征提取网络和交互预测网络,所述训练方法包括:获取第一用户的账户信息和与目标资源的交互数据;基于账户信息和特征信息,利用特征提取网络得到与第一用户和目标资源对应的特征向量;基于特征向量利用交互预测网络,得到第一用户对目标资源的预测交互次数;基于特征向量利用操作预测网络,得到第一用户对目标资源的预测操作标签数据;基于实际交互次数、预测交互次数、实际操作标签数据和预测操作标签数据,更新资源交互预测模型的参数。数。数。

【技术实现步骤摘要】
资源交互预测模型训练方法和装置和资源推荐方法和装置


[0001]本公开涉及数据处理
,尤其涉及一种资源推荐方法和装置以及资源交互预测模型的训练方法和装置。

技术介绍

[0002]目前,在资源平台上投放推荐信息的客户通常以用户完成与所推荐资源的交互作为目标,即期望在向用户投放推荐信息后能够实现用户对所推荐资源的交互。
[0003]对于资源平台,提高对用户资源交互行为的预测准确率,有利于用户对客户所推荐资源的关注和交互。因此,如何更加提高用户与推荐资源的交互行为成为亟待解决的问题。

技术实现思路

[0004]本公开提供一种资源推荐方法和资源推荐装置以及资源交互预测模型的训练方法和装置,以至少解决上述提及的问题。
[0005]根据本公开实施例的第一方面,提供一种资源交互预测模型的训练方法,所述资源交互预测模型可包括特征提取网络和交互预测网络,所述训练方法可包括:获取第一用户的账户信息和与目标资源的交互数据,其中,所述交互数据包括所述目标资源的特征信息、第一用户对所述目标资源的实际交互次数和与第一用户的交互行为相关联的实际操作标签数据;基于所述账户信息和所述特征信息,利用所述资源交互预测模型的所述特征提取网络得到与第一用户和所述目标资源对应的特征向量;基于所述特征向量利用所述资源交互预测模型的所述交互预测网络,得到第一用户对所述目标资源的预测交互次数;基于所述特征向量利用操作预测网络,得到第一用户对所述目标资源的预测操作标签数据;基于所述实际交互次数、所述预测交互次数、所述实际操作标签数据和所述预测操作标签数据,更新所述资源交互预测模型的参数。
[0006]可选地,基于所述特征向量利用所述交互预测网络,得到第一用户对所述目标资源的预测交互次数,可包括:基于所述特征向量利用所述交互预测网络,得到第一用户对所述目标资源的预设种类的交互次数的概率;基于所述预设种类的交互次数的概率确定第一用户对所述目标资源的预测交互次数。
[0007]可选地,基于所述实际交互次数、所述预测交互次数、所述实际操作标签数据和所述预测操作标签数据,更新所述资源交互预测模型的参数,可包括:基于所述实际交互次数和所述预测交互次数来构造第一损失函数,并且通过使由第一损失函数计算的损失最小化来调整所述资源交互预测模型的所述特征提取网络和所述交互预测网络的参数;基于所述实际操作标签数据和所述预测操作标签数据来构造第二损失函数,并且通过使由第二损失函数计算的损失最小化来调整所述操作预测网络和所述资源交互预测模型的所述特征提取网络的参数。
[0008]可选地,所述操作标签数据可包括以下中的至少一个:第一用户对所述目标资源
的资源链接的实际操作标签、对包括所述目标资源的资源列表的实际操作标签、对所述目标资源的实际浏览标签和对第二用户的实际关注标签。
[0009]可选地,所述账户信息可包括第一用户在第二用户推荐包括所述目标资源的资源时的实时行为数据以及第一用户的长周期行为数据中的至少一个。
[0010]根据本公开实施例的第二方面,提供一种资源推荐方法,可包括:获取第一用户的账户信息和在第二用户推荐资源时的目标资源信息;基于所述账户信息和所述目标资源信息利用资源交互预测模型来预测第一用户与所述目标资源的交互次数;在预测的交互次数满足预设条件的情况下,确定向第一用户发送关于所述目标资源的资源推荐信息,其中,所述资源交互预测模型基于上述所述的训练方法被获得。
[0011]根据本公开实施例的第三方面,提供一种资源交互预测模型的训练装置,所述资源交互预测模型可包括特征提取网络和交互预测网络,所述训练装置可包括:获取模块,被配置为获取第一用户的账户信息和与目标资源的交互数据,其中,所述交互数据包括所述目标资源的特征信息、第一用户对所述目标资源的实际交互次数和与第一用户的交互行为相关联的实际操作标签数据;训练模块,被配置为:基于所述账户信息和所述特征信息,利用所述资源交互预测模型的所述特征提取网络得到与第一用户和所述目标资源对应的特征向量;基于所述特征向量利用所述资源交互预测模型的所述交互预测网络,得到第一用户对所述目标资源的预测交互次数;基于所述特征向量利用操作预测网络,得到第一用户对所述目标资源的预测操作标签数据;基于所述实际交互次数、所述预测交互次数、所述实际操作标签数据和所述预测操作标签数据,更新所述资源交互预测模型的参数。
[0012]可选地,训练模块可被配置为:基于所述特征向量利用所述交互预测网络,得到第一用户对所述目标资源的预设种类的交互次数的概率;基于所述预设种类的交互次数的概率确定第一用户对所述目标资源的预测交互次数。
[0013]可选地,训练模块可被配置为:基于所述实际交互次数和所述预测交互次数来构造第一损失函数,并且通过使由第一损失函数计算的损失最小化来调整所述资源交互预测模型的所述特征提取网络和所述交互预测网络的参数;基于所述实际操作标签数据和所述预测操作标签数据来构造第二损失函数,并且通过使由第二损失函数计算的损失最小化来调整所述操作预测网络和所述资源交互预测模型的所述特征提取网络的参数。
[0014]可选地,所述操作标签数据可包括以下中的至少一个:第一用户对所述目标资源的资源链接的实际操作标签、对包括所述目标资源的资源列表的实际操作标签、对所述目标资源的实际浏览标签和对第二用户的实际关注标签。
[0015]可选地,所述账户信息可包括第一用户在第二用户推荐包括所述目标资源的资源时的实时行为数据以及第一用户的长周期行为数据中的至少一个。
[0016]根据本公开实施例的第四方面,提供一种资源推荐装置,可包括:获取模块,被配置为获取第一用户的账户信息和在第二用户推荐资源时的目标资源信息;预测模块,被配置为基于所述账户信息和所述目标资源信息利用资源交互预测模型来预测第一用户与所述目标资源的交互次数;处理模块,被配置为在预测的交互次数满足预设条件的情况下,确定向第一用户发送关于所述目标资源的资源推荐信息,其中,所述资源交互预测模型基于上述所述的训练方法被获得。
[0017]根据本公开实施例的第五方面,提供一种电子设备,所述电子设备可包括:至少一
个处理器;至少一个存储计算机可执行指令的存储器,其中,所述计算机可执行指令在被所述至少一个处理器运行时,促使所述至少一个处理器执行如上所述的资源推荐方法或训练方法。
[0018]根据本公开实施例的第六方面,提供一种计算机可读存储介质,存储有指令,当所述指令被至少一个处理器运行时,促使所述至少一个处理器执行如上所述的资源推荐方法或训练方法。
[0019]根据本公开实施例的第七方面,提供一种计算机程序产品,所述计算机程序产品中的指令被电子装置中的至少一个处理器运行以执行如上所述的资源推荐方法或训练方法。
[0020]本公开的实施例提供的技术方案至少带来以下有益效果:
[0021]通过考虑与资源交互行为相关的其他信息(诸如资源链接的操作信息、资源列表的操作信息、关注主播信息和浏览资源信息本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种资源交互预测模型的训练方法,其特征在于,所述资源交互预测模型包括特征提取网络和交互预测网络,所述训练方法包括:获取第一用户的账户信息和与目标资源的交互数据,其中,所述交互数据包括所述目标资源的特征信息、第一用户对所述目标资源的实际交互次数和与第一用户的交互行为相关联的实际操作标签数据;基于所述账户信息和所述特征信息,利用所述资源交互预测模型的所述特征提取网络得到与第一用户和所述目标资源对应的特征向量;基于所述特征向量利用所述资源交互预测模型的所述交互预测网络,得到第一用户对所述目标资源的预测交互次数;基于所述特征向量利用操作预测网络,得到第一用户对所述目标资源的预测操作标签数据;基于所述实际交互次数、所述预测交互次数、所述实际操作标签数据和所述预测操作标签数据,更新所述资源交互预测模型的参数。2.根据权利要求1所述的训练方法,其特征在于,基于所述特征向量利用所述交互预测网络,得到第一用户对所述目标资源的预测交互次数,包括:基于所述特征向量利用所述交互预测网络,得到第一用户对所述目标资源的预设种类的交互次数的概率;基于所述预设种类的交互次数的概率确定第一用户对所述目标资源的预测交互次数。3.根据权利要求1所述的训练方法,其特征在于,基于所述实际交互次数、所述预测交互次数、所述实际操作标签数据和所述预测操作标签数据,更新所述资源交互预测模型的参数,包括:基于所述实际交互次数和所述预测交互次数来构造第一损失函数,并且通过使由第一损失函数计算的损失最小化来调整所述资源交互预测模型的所述特征提取网络和所述交互预测网络的参数;基于所述实际操作标签数据和所述预测操作标签数据来构造第二损失函数,并且通过使由第二损失函数计算的损失最小化来调整所述操作预测网络和所述资源交互预测模型的所述特征提取网络的参数。4.根据权利要求1所述的训练方法,其特征在于,所述操作标签数据包括以下中的至少一个:第一用户对所述目标资源的资源链接的实际操作标签、对包括所述目标资源的资源列表的实际操作标签、对所述目标资源的实际浏览标签和对第二用户的实际关注标签。5.一种资源推荐方法,其特征在于,包括:获取第一用户的账户信息和在第二用户推荐资源时的目标资源信息;基于所述账户信息和所述目标资源信息利用资源交互预测模型来预测第一用户与所述目标资源的交互次数;在预测的交...

【专利技术属性】
技术研发人员:张荣黄兆楷张文杰杨文博
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1