【技术实现步骤摘要】
媒体资源推荐方法、装置、电子设备以及存储介质
[0001]本公开涉及互联网
,尤其涉及一种媒体资源推荐方法、装置、电子设备以及存储介质。
技术介绍
[0002]随着互联网的快速发展和广泛普及,在一些媒体资源的推荐业务场景中,通过对召回的候选媒体资源经过粗排、精排、重排以及混排等多个媒体资源推荐阶段实现多目标排序,将最终排序后的候选媒体资源推荐给目标对象,以满足目标对象的需求。
[0003]相关技术中,通过交叉熵算法(Cross
‑
Entropy Method,CEM)或贝叶斯优化算法(Bayes Optimization)等自动调参的方式,对媒体资源推荐阶段中用于融合候选媒体资源的多个预测互动结果的融合参数进行及时调整,以确保媒体资源推荐的准确率。
[0004]然而,采用上述方式得到的融合参数是非个性化的,即针对不同对象推荐媒体资源时所涉及的融合参数均相同,从而导致媒体资源推荐的效果不佳,影响对象体验。
技术实现思路
[0005]本公开提供一种媒体资源推荐方法、装置、电 ...
【技术保护点】
【技术特征摘要】
1.一种媒体资源推荐方法,其特征在于,所述方法包括:响应于目标对象的资源请求,获取在目标推荐阶段所述目标对象对应的状态信息,所述状态信息指示所述目标推荐阶段对应的候选媒体资源的资源信息、所述目标对象的对象信息以及所述目标对象的历史互动行为;将所述目标对象对应的状态信息输入融合参数分布预测模型,得到所述目标对象对应的融合参数分布信息,所述融合参数分布信息指示融合参数的分布情况,所述融合参数用于在所述目标推荐阶段中对所述候选媒体资源的预测互动结果进行融合;基于所述目标对象对应的融合参数分布信息,对所述目标对象针对所述候选媒体资源的多个预测互动结果进行融合,得到所述候选媒体资源的推荐参考信息,基于所述推荐参考信息,向所述目标对象推荐所述候选媒体资源。2.根据权利要求1所述的媒体资源推荐方法,其特征在于,所述方法还包括:基于至少一个长期互动行为预测模型,对所述目标对象针对所述候选媒体资源的长期互动行为进行预测,得到所述候选媒体资源的至少一个长期预测互动结果;基于至少一个短期互动行为预测模型,对所述目标对象针对所述候选媒体资源的短期互动行为进行预测,得到所述候选媒体资源的至少一个短期预测互动结果。3.根据权利要求1所述的媒体资源推荐方法,其特征在于,所述基于所述目标对象对应的融合参数分布信息,对所述目标对象针对所述候选媒体资源的多个预测互动结果进行融合,得到所述候选媒体资源的推荐参考信息,包括:基于所述融合参数分布信息进行高斯采样,得到所述目标对象对应的融合参数向量,所述融合参数向量指示在所述目标推荐阶段对所述多个预测互动结果进行融合的多个融合参数;基于所述融合参数向量,对所述多个预测互动结果进行融合,得到所述推荐参考信息。4.根据权利要求1所述的媒体资源推荐方法,其特征在于,所述方法还包括:基于样本数据集,对基于媒体资源的多个互动行为对应的评估模型进行训练,得到训练后的多个评估模型,所述样本数据集包括样本对象在目标时间段内的多个样本资源请求所对应的样本数据,所述样本数据包括在样本推荐阶段所述样本对象对应的样本状态信息、样本融合参数分布信息以及样本对象反馈信息,所述评估模型用于评估所述样本融合参数分布信息对互动行为的影响程度,所述样本对象反馈信息指示对象基于媒体资源的互动行为;基于所述样本数据集和训练后的多个评估模型,将训练后的多个评估模型对所述融合参数分布预测模型的评估结果作为奖励值,对所述融合参数分布预测模型进行训练,得到训练后的所述融合参数分布预测模型。5.根据权利要求4所述的媒体资源推荐方法,其特征在于,所述基于样本数据集,对基于媒体资源的多个互动行为对应的评估模型进行训练,得到训练后的多个评估模型,包括:基于第i个样本数据中的样本状态信息和第一评估模型,获取第一奖励值,所述第一评估模型为基于媒体资源的多个...
【专利技术属性】
技术研发人员:蔡庆芃,詹若涵,张弛,郑杰,丁光伟,龚平华,郑东,江鹏,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。