推荐模型的训练方法、消息推荐方法、装置及电子设备制造方法及图纸

技术编号:39275397 阅读:5 留言:0更新日期:2023-11-07 10:52
本申请实施例提供了一种推荐模型的训练方法、消息推荐方法、装置、电子设备及计算机可读存储介质,涉及人工智能领域。该方法包括:获得消息特征、客体特征、目标推荐指标以及第一推荐价值;将消息特征和客体特征输入至神经网络模型,获得神经网络模型确定的第二推荐价值、第二排序结果和第一排序结果;获得每个样本推荐消息的实际推荐指标,根据每个样本推荐消息对应的目标推荐指标和实际推荐指标间的第一差异,以及每个样本推荐客体的第二排序结果和第一排序结果间的第二差异,对神经网络模型进行迭代训练,将迭代停止后的神经网络模型作为消息推荐模型。本申请实施例平衡推荐主体和推荐中介的收益,进行多目标推荐。进行多目标推荐。进行多目标推荐。

【技术实现步骤摘要】
推荐模型的训练方法、消息推荐方法、装置及电子设备


[0001]本申请涉及人工智能
,具体而言,本申请涉及一种推荐模型的训练方法、消息推荐方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]随着互联网的快速发展,为人们的生活带来了许多便利,同时也带了海量的数据信息。在推荐场景中,推荐系统可以基于消息推荐模型来为样本推荐客体提供感兴趣的样本推荐消息,并将样本推荐客体有针对性的推荐给这些可能感兴趣的样本推荐客体。
[0003]在推荐场景,特别是广告投放场景中,主要分为两种类型的广告(样本推荐消息)——合约广告和竞价广告,其中合约广告是基于推荐次数进行排序并推荐的广告,竞价广告是基于推荐价值进行排序并推荐的广告,目前业界对合约广告投放算法的研究主要是在需求约束和供给约束下的分配的最优化求解问题。然而在实际应用中,由于合约广告的推荐存在竞价广告参与的情况,目前的算法并没有达到广告平台收益最大化的效果。

技术实现思路

[0004]本申请实施例提供了一种推荐模型的训练方法、消息推荐方法、装置、电子设备、计算机可读存储介质及计算机程序产品,可以解决现有技术的上述问题。技术方案如下:
[0005]根据本申请实施例的第一个方面,提供了一种消息推荐模型的训练方法,该方法包括:
[0006]获得多个样本推荐消息的消息特征、多个样本推荐客体的客体特征、每个样本推荐消息的推荐主体向推荐中介指示的该样本推荐消息的目标推荐指标以及每个样本推荐客体对于该样本推荐消息的第一推荐价值;
[0007]将多个样本推荐消息的消息特征和多个样本推荐客体的客体特征输入至神经网络模型,获得神经网络模型确定的针对每个样本推荐客体,该样本推荐客体对于每个样本推荐消息的第二推荐价值和基于第二推荐价值确定的推荐至该样本推荐客体的各样本推荐消息的第一排序结果;
[0008]针对每个样本推荐客体,基于该样本推荐客体的第一排序结果,确定推荐至该样本推荐客体的目标样本推荐消息,根据每个样本推荐消息作为目标样本推荐消息的推荐结果,获得每个样本推荐消息的实际推荐指标;
[0009]根据第一推荐价值确定推荐至每个样本推荐客体的各样本推荐消息的第二排序结果,确定每个样本推荐消息对应的目标推荐指标和实际推荐指标间的第一差异和每个样本推荐客体的第二排序结果和第一排序结果间的第二差异,根据第一差异和第二差异对神经网络模型进行迭代训练,直至达到迭代停止条件,将迭代停止后的神经网络模型作为消息推荐模型。
[0010]根据本申请实施例的第二个方面,提供了一种消息推荐方法,包括:
[0011]获得多个推荐消息的消息特征和至少一个推荐客体的客体特征;
[0012]将多个推荐消息的消息特征和多个推荐客体的客体特征输入至消息推荐模型,获得消息推荐模型确定的对于每个推荐客体,推荐至该推荐客体的各推荐消息的第一排序结果;
[0013]针对每个推荐客体,基于该推荐客体的第一排序结果,确定推荐至该推荐客体的目标推荐消息,将目标推荐消息推荐至该推荐客体;
[0014]其中,消息推荐模型是基于第一方面的方法训练而成的。
[0015]根据本申请实施例的第三个方面,提供了一种消息推荐模型的训练装置,该装置包括:
[0016]样本数据获取模块,用于获得多个样本推荐消息的消息特征、多个样本推荐客体的客体特征、每个样本推荐消息的推荐主体向推荐中介指示的该样本推荐消息的目标推荐指标以及每个样本推荐客体对于该样本推荐消息的第一推荐价值;
[0017]排序模块,用于将多个样本推荐消息的消息特征和多个样本推荐客体的客体特征输入至神经网络模型,获得神经网络模型确定的针对每个样本推荐客体,该样本推荐客体对于每个样本推荐消息的第二推荐价值和基于第二推荐价值确定的推荐至该样本推荐客体的各样本推荐消息的第一排序结果;
[0018]指标确定模块,用于针对每个样本推荐客体,基于该样本推荐客体的第一排序结果,确定推荐至该样本推荐客体的目标样本推荐消息,根据每个样本推荐消息作为目标样本推荐消息的推荐结果,获得每个样本推荐消息的实际推荐指标;
[0019]迭代训练模块,用于根据第一推荐价值确定推荐至每个样本推荐客体的各样本推荐消息的第二排序结果,确定每个样本推荐消息对应的目标推荐指标和实际推荐指标间的第一差异和每个样本推荐客体的第二排序结果和第一排序结果间的第二差异,根据第一差异和第二差异对神经网络模型进行迭代训练,直至达到迭代停止条件,将迭代停止后的神经网络模型作为消息推荐模型。
[0020]作为一种可选的实施方式,多个样本推荐消息包括至少一个第一类别样本推荐消息和至少一个第二类别样本推荐消息,第一类别样本推荐消息为根据推荐次数进行排序并推荐的样本推荐消息,第二类别样本推荐消息为根据推荐价值进行排序并推荐的样本推荐消息;
[0021]第一类别样本推荐消息的目标推荐指标包括目标推荐次数和达到第一预设推荐效果的目标效果推荐次数,实际推荐指标包括实际推荐次数和达到第一预设推荐效果的实际效果推荐次数;
[0022]第二类别样本推荐消息的目标推荐指标包括目标推荐成本和达到第二预设推荐效果的目标效果推荐成本,实际推荐指标包括实际推荐成本和达到第二预设推荐效果的实际效果推荐成本。
[0023]作为一种可选的实施方式,指标确定模块用于:
[0024]对于每个第一类别样本推荐消息,将该第一类别样本推荐消息作为目标样本推荐消息的数量,作为实际推荐次数;
[0025]对于每个第一类别样本推荐消息,获得该第一类别样本推荐消息作为目标样本推荐消息时对相应样本推荐客体的效果系数,效果系数用于表征样本推荐消息推荐至样本客体达到预设推荐效果的概率,根据该第一类别样本推荐消息作为目标样本推荐消息时对相
应样本推荐客体的效果系数,获得实际效果推荐次数。
[0026]作为一种可选的实施方式,指标确定模块用于:
[0027]对于每个第二类别样本推荐消息,将该第二类别样本推荐消息作为目标样本推荐消息的样本推荐客体作为目标样本推荐客体;
[0028]将目标样本推荐客体的第一排序结果中,紧邻该第二类别样本推荐消息的第二推荐价值之后的第二推荐价值作为该目标样本推荐客体的参考价值;
[0029]根据该第二类别样本推荐消息的所有目标样本推荐客体的参考价值,获得该第二类别样本推荐消息的实际推荐成本。
[0030]作为一种可选的实施方式,指标确定模块用于:
[0031]对于每个第二类别样本推荐消息,根据该第二类别样本推荐消息作为目标样本推荐消息时对相应样本推荐客体的效果系数,获得该第二类样本推荐消息达到第二预设推荐效果的实际效果推荐次数;
[0032]根据该第二类样本推荐消息的实际效果推荐次数和实际推荐成本,获得该第二类别样本推荐消息达到第二预设推荐效果的实际效果推荐成本。
[0033]作为一种可选的实施方式,神经网络模型包括第一子神经网络模型和第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种消息推荐模型的训练方法,其特征在于,包括:获得多个样本推荐消息的消息特征、多个样本推荐客体的客体特征、每个样本推荐消息的推荐主体向推荐中介指示的该样本推荐消息的目标推荐指标以及每个样本推荐客体对于该样本推荐消息的第一推荐价值;将所述多个样本推荐消息的消息特征和多个样本推荐客体的客体特征输入至神经网络模型,获得所述神经网络模型确定的针对每个样本推荐客体,该样本推荐客体对于每个样本推荐消息的第二推荐价值和基于所述第二推荐价值确定的推荐至该样本推荐客体的各样本推荐消息的第一排序结果;针对每个样本推荐客体,基于该样本推荐客体的第一排序结果,确定推荐至该样本推荐客体的目标样本推荐消息,根据每个样本推荐消息作为目标样本推荐消息的推荐结果,获得每个样本推荐消息的实际推荐指标;根据所述第一推荐价值确定推荐至每个样本推荐客体的各样本推荐消息的第二排序结果,确定每个样本推荐消息对应的目标推荐指标和实际推荐指标间的第一差异和每个样本推荐客体的第二排序结果和第一排序结果间的第二差异,根据所述第一差异和第二差异对神经网络模型进行迭代训练,直至达到迭代停止条件,将迭代停止后的神经网络模型作为消息推荐模型。2.根据权利要求1所述的训练方法,其特征在于,所述多个样本推荐消息包括至少一个第一类别样本推荐消息和至少一个第二类别样本推荐消息,所述第一类别样本推荐消息为根据推荐次数进行排序并推荐的样本推荐消息,所述第二类别样本推荐消息为根据推荐价值进行排序并推荐的样本推荐消息;所述第一类别样本推荐消息的目标推荐指标包括目标推荐次数和达到第一预设推荐效果的目标效果推荐次数,实际推荐指标包括实际推荐次数和达到第一预设推荐效果的实际效果推荐次数;所述第二类别样本推荐消息的目标推荐指标包括目标推荐成本和达到第二预设推荐效果的目标效果推荐成本,实际推荐指标包括实际推荐成本和达到第二预设推荐效果的实际效果推荐成本。3.根据权利要求2所述的训练方法,其特征在于,所述根据每个样本推荐消息作为目标样本推荐消息的推荐结果,获得每个样本推荐消息的实际推荐指标,包括:对于每个第一类别样本推荐消息,将该第一类别样本推荐消息作为目标样本推荐消息的数量,作为所述实际推荐次数;对于每个第一类别样本推荐消息,获得该第一类别样本推荐消息作为目标样本推荐消息时对相应样本推荐客体的效果系数,所述效果系数用于表征样本推荐消息推荐至样本客体达到预设推荐效果的概率,根据该第一类别样本推荐消息作为目标样本推荐消息时对相应样本推荐客体的效果系数,获得所述实际效果推荐次数。4.根据权利要求2所述的训练方法,其特征在于,所述根据每个样本推荐消息作为目标样本推荐消息的推荐结果,获得每个样本推荐消息的实际推荐指标,包括:对于每个第二类别样本推荐消息,将该第二类别样本推荐消息作为目标样本推荐消息的样本推荐客体作为目标样本推荐客体;将所述目标样本推荐客体的第一排序结果中,紧邻该第二类别样本推荐消息的第二推
荐价值之后的第二推荐价值作为该目标样本推荐客体的参考价值;根据该第二类别样本推荐消息的所有目标样本推荐客体的参考价值,获得该第二类别样本推荐消息的实际推荐成本。5.根据权利要求4所述的训练方法,其特征在于,所述根据每个样本推荐消息作为目标样本推荐消息的推荐结果,获得每个样本推荐消息的实际推荐指标,包括:对于每个第二类别样本推荐消息,根据该第二类别样本推荐消息作为目标样本推荐消息时对相应样本推荐客体的效果系数,获得该第二类样本推荐消息达到第二预设推荐效果的实际效果推荐次数;根据该第二类样本推荐消息的实际效果推荐次数和实际推荐成本,获得该第二类别样本推荐消息达到第二预设推荐效果的实际效果推荐成本。6.根据权利要求1

5任意一项所述的训练方法,其特征在于,所述神经网络模型包括第一子神经网络模型和第二子神经网络模型;其中,所述第一子神经网络模型用于根据多个样本推荐消息的消息特征和多个样本推荐客体的客体特征,获得针对每个样本推荐客体,该样本推荐客体对于每个样本推荐消息的第二推荐价值;所述第二子神经网络模型用于根据针对每个样本推荐客体,根据该样本推荐客体对于各个样本推荐消息的第二推荐价值,获得推荐至该样本推荐客体的各样本推荐消息的第一排序结果;所述根据所述第一差异和第二差异对神经网络模型进...

【专利技术属性】
技术研发人员:张弘黄东波
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1