【技术实现步骤摘要】
媒体资源的下发方法、装置、设备和存储介质
[0001]本申请涉及人工智能
,特别涉及一种媒体资源的下发方法
、
装置
、
设备和存储介质
。
技术介绍
[0002]在对业务的推广活动中,一般通过向对象下发媒体资源来实现对业务的推广
。
其中,媒体资源的下发场景有多种,如可以通过通知消息进行媒体资源的下发,或者通过在应用内跳出消息弹窗来进行媒体资源的下发
。
[0003]现有技术中,会用单一下发场景进行媒体资源的下发
。
而不同的下发场景的下发机制不同,不同的下发场景可能会对应相同的对象池,导致有可能会向同一对象通过多个下发场景下发相同的媒体资源,造成流量资源的浪费
。
技术实现思路
[0004]本申请实施例提供了一种媒体资源的下发方法
、
装置
、
设备和存储介质,使得下发的媒体资源能够达到推广效果,促进媒体资源的转化
。
并且,避免了流量资源的浪费和下发场景的 ...
【技术保护点】
【技术特征摘要】
1.
一种媒体资源的下发方法,其特征在于,所述方法包括:基于对象的对象信息和行为信息,获取多个候选资源内容
、
多个候选下发场景和多个候选下发时间,所述行为信息用于指示所述对象基于历史下发的媒体资源产生的交互行为;基于所述对象信息
、
所述行为信息
、
所述多个候选资源内容
、
所述多个候选下发场景和所述多个候选下发时间,通过多场景强化学习模型,从所述多个候选资源内容
、
所述多个候选下发场景和所述多个候选下发时间中,确定目标资源内容
、
目标下发场景和目标下发时间,所述多场景强化学习模型基于多个样本下发场景中多个样本对象的对象信息
、
行为信息
、
多个样本资源内容
、
多个样本下发时间和所述多个样本下发场景进行强化学习得到;在所述目标下发时间和所述目标下发场景下,向所述对象下发所述目标资源内容
。2.
根据权利要求1所述的方法,其特征在于,所述基于所述对象信息
、
所述行为信息
、
所述多个候选资源内容
、
所述多个候选下发场景和所述多个候选下发时间,通过多场景强化学习模型,从所述多个候选资源内容
、
所述多个候选下发场景和所述多个候选下发时间中,确定目标资源内容
、
目标下发场景和目标下发时间,包括:将所述对象信息
、
所述行为信息
、
所述多个候选资源内容
、
所述多个候选下发场景和所述多个候选下发时间输入所述多场景强化学习模型;通过所述多场景强化学习模型,从所述多个候选资源内容
、
所述多个候选下发场景和所述多个候选下发时间中确定第一数量的资源内容
、
第二数量的下发场景和第三数量的下发时间;从所述第一数量的资源内容
、
所述第二数量的下发场景
、
所述第三数量的下发时间中确定所述目标资源内容
、
所述目标下发场景和所述目标下发时间
。3.
根据权利要求2所述的方法,其特征在于,所述通过所述多场景强化学习模型,从所述多个候选资源内容
、
所述多个候选下发场景和所述多个候选下发时间中确定第一数量的资源内容
、
第二数量的下发场景和第三数量的下发时间,包括:通过所述多场景强化学习模型,基于所述对象信息和所述行为信息,从所述多个候选资源内容中确定第一数量的资源内容,所述第一数量的资源内容为所述多个候选资源内容中与所述对象信息和所述行为信息匹配度最高的前第一数量的候选资源内容;通过所述多场景强化学习模型,基于所述对象信息
、
所述行为信息和所述第一数量的资源内容,从所述多个候选下发场景中确定第二数量的下发场景,所述第二数量的下发场景为所述多个候选下发场景中与所述对象信息
、
所述行为信息和所述第一数量的资源内容匹配度最高的前第二数量的候选下发场景;通过所述多场景强化学习模型,基于所述对象信息
、
所述行为信息
、
所述第一数量的资源内容和所述第二数量的下发场景,从所述多个候选下发时间中确定第三数量的下发时间,所述第三数量的下发时间为所述多个候选下发时间中与所述对象信息
、
所述行为信息
、
所述第一数量的资源内容和所述第二数量的下发场景匹配度最高的前第三数量的候选下发时间
。4.
根据权利要求1所述的方法,其特征在于,所述多场景强化学习模型的训练过程,包括:获取多个样本下发场景中多个样本对象的多个状态信息,所述状态信息包括样本对象
的对象信息和行为信息;对于每个状态信息,将所述状态信息输入所述多场景强化学习模型,得到动作信息,基于所述状态信息和所述动作信息,得到回报信息,所述动作信息包括样本资源内容
、
样本下发场景和样本下发时间,用于指示资源下发平台在样本下发时间和样本下发场景下,为样本对象下发样本资源内容,所述回报信息用于指示基于所述动作信息为所述样本对象下发样本资源内容,对资源所属平台产生的回报;基于所述回报信息,调整所述多场景强化学习模型的模型参数
。5.
根据权利要求1所述的方法,其特征在于,所述方法还包括以下至少一项:若所述对象的对象信息和所述行为信息指示所述对象达到目标行为状态,执行基于对象的对象信息和行为信息,获取多个候选资源内容
、
多个候选下发场景和多个候选下发时间的步骤;若接收到对象对预设下发场景的媒体资源下发请求,执行基于对象的对象信息和行为信息,获取多个候选资源内容
、
多个候选下发场景和多个候选下发时间的步骤;若发生...
【专利技术属性】
技术研发人员:王山雨,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。