多媒体信息推荐方法、装置和设备及存储介质制造方法及图纸

技术编号:25991446 阅读:23 留言:0更新日期:2020-10-20 18:59
本申请公开了一种多媒体信息推荐方法、装置和设备及存储介质,涉及计算机技术领域,用于提升多媒体信息推荐的精准性。该方法包括:获取多个多媒体信息的资源属性信息以及当前时间段之前的N个连续时间段对应的N个互动数据集合;分别获取各多媒体信息每一互动数据集合对应的互动率偏差值集合;利用已训练的互动率校正模型,根据资源属性信息与N个互动率偏差值集合,获取各多媒体信息在当前时间段的互动率偏差值;通过互动率偏差值分别对预估互动率进行校正;根据各多媒体信息校正后的预估互动率,从多个多媒体信息中确定目标多媒体信息,并将目标多媒体信息推荐给目标用户,从而实现多媒体信息的精准推荐。

【技术实现步骤摘要】
多媒体信息推荐方法、装置和设备及存储介质
本申请涉及计算机
,提供一种多媒体信息推荐方法、装置和设备及存储介质。
技术介绍
智能出价广告是一种新的出价方式,广告主可以选择期望优化的优化目标,并提供对该优化目标期望的平均转化成本(target_cpa),广告平台通过预估每一次展示的转化价值,自动进行出价。目前常见的自动出价方案包括优化行为出价(optimizedcostperaction,ocpa)方案、优化点击付费(optimizedcostperclick,ocpc)方案和优化千次展现出价(optimizedcostpermille,ocpm)方案。以ocpa方案为例,当广告主在广告投放流程中选定优化目标,例如移动应用的激活或者购物网站的下单等,并填写愿意为此投放目标而支付的平均价格,并及时准确的回传效果数据,广告平台则可以借助转化预估模型,实时预估每一次广告展示对广告主的转化价值,自动进行广告出价,最终按照点击扣费,使得每个优化目标平摊成本在广告主期望的成本价附近区间内。其中,在广告出价环节中根据广告在用户上的转化价值来决定广告的排序,从而决定广告是否能够获取此次曝光以及获得此次曝光之后广告主的成本是否符合预期,例如对于ocpa方案而言,将每千次曝光的总扣费(effectivecostpermille,ecpm)作为广告竞价排序的指标,通过计算获得各个广告的ecpm,ecpm高的广告优先进行曝光。但是,由于广告出价环节中是根据预估的互动率进行的,如预估转化率(conversionrate,CVR),由于CVR预估存在数据稀疏等问题,难以做到完全准确预估,从而导致CVR预估存在很大偏差,从而影响广告出价环节的转化成本,从而使得广告的实际成本难以达成广告主的预期。可见,预估互动率的准确性直接影响到当前曝光机会所要曝光的广告,因而预估互动率准确性较低时,也无法精准的实现广告推荐。其他多媒体信息推荐系统,也存在同样问题。
技术实现思路
本申请实施例提供一种多媒体信息推荐方法、装置和设备及存储介质,用于提升多媒体信息推荐的精准性。一方面,提供一种多媒体信息推荐方法,所述方法包括:获取多个多媒体信息的资源属性信息,以及所述多个多媒体信息在当前时间段之前的N个连续时间段对应的N个互动数据集合,其中,每一时间段的互动数据集合包括所述多媒体信息在多个特征维度上的互动数据;分别获取各多媒体信息的N个互动数据集合中每一互动数据集合对应的互动率偏差值集合;其中,每一互动率偏差值集合包括所述多媒体信息在多个特征维度上的互动率偏差值,每一互动率偏差值表示一个特征维度上预估互动率与真实互动率之间的偏差;所述预估互动率为预估的用户与多媒体信息进行互动的次数与述多媒体信息的展示次数之间的比值;利用已训练的互动率校正模型,根据各多媒体信息的资源属性信息与N个互动数据集合对应的N个互动率偏差值集合,获取各多媒体信息在当前时间段的互动率偏差值;其中,所述互动率校正模型是利用多个训练样本训练得到的,每一训练样本包括一个多媒体信息的资源属性信息以及N+1个连续时间段的互动率偏差值集合;所述互动率偏差值表示多媒体信息的预估互动率与真实互动率之间的偏差;通过各多媒体信息在当前时间段的互动率偏差值分别对各多媒体信息的预估互动率进行校正;根据各多媒体信息校正后的预估互动率,从所述多个多媒体信息中确定目标多媒体信息,并将所述目标多媒体信息推荐给目标用户。一方面,提供一种多媒体信息推荐装置,所述装置包括:获取单元,用于获取多个多媒体信息的资源属性信息,以及所述多个多媒体信息在当前时间段之前的N个连续时间段对应的N个互动数据集合,其中,每一时间段的互动数据集合包括所述多媒体信息在多个特征维度上的互动数据;所述获取单元,还用于分别获取各多媒体信息的N个互动数据集合中每一互动数据集合对应的互动率偏差值集合;其中,每一互动率偏差值集合包括所述多媒体信息在多个特征维度上的互动率偏差值,每一互动率偏差值表示一个特征维度上预估互动率与真实互动率之间的偏差;所述预估互动率为预估的用户与多媒体信息进行互动的次数与述多媒体信息的展示次数之间的比值;确定单元,用于利用已训练的互动率校正模型,根据各多媒体信息的资源属性信息与N个互动数据集合对应的N个互动率偏差值集合,获取各多媒体信息在当前时间段的互动率偏差值;其中,所述互动率校正模型是利用多个训练样本训练得到的,每一训练样本包括一个多媒体信息的资源属性信息以及N+1个连续时间段的互动率偏差值集合;所述互动率偏差值表示多媒体信息的预估互动率与真实互动率之间的偏差;校正单元,用于通过各多媒体信息在当前时间段的互动率偏差值分别对各多媒体信息的预估互动率进行校正;推荐单元,用于根据各多媒体信息校正后的预估互动率,从所述多个多媒体信息中确定目标多媒体信息,并将所述目标多媒体信息推荐给目标用户。可选的,所述装置还包括模型训练单元,用于:从训练样本库中获取设定数量的训练样本;通过获取的训练样本,按照设定的训练参数对所述互动率校正模型进行多次训练,每一次训练过程包括如下步骤:根据所述资源属性信息以及N+1个连续时间段中前N个时间段的互动率偏差值集合,通过所述互动率校正模型,获取每一训练样本的多媒体信息在第N+1个时间段的互动率偏差值;根据所述训练样本的多媒体信息在第N+1个时间段的互动率偏差值,与所述训练样本中第N+1个时间段的互动率偏差值集合,获取所述互动率校正模型的损失值;根据所述损失值确定是否继续对所述互动率校正模型进行训练;若确定继续对所述互动率校正模型进行训练,则对所述互动率校正模型的模型参数进行调整,并通过调整后的所述互动率校正模型继续下一次训练过程。可选的,所述确定单元,用于:将所述每一特征维度在每一时间段内的互动次数所属的数值区间对应位置赋值为所述每一特征维度在每一时间段的互动率偏差值,除所述每一特征维度在每一时间段内的互动次数所属的数值区间之外的其余数值区间对应位置赋值为空值,以得到所述每一特征维度在每一时间段内的互动率偏差值集合对应的互动率偏差子向量。可选的,所述多个特征维度包括多个单一特征维度和由所述多个单一特征维度进行交叉得到的交叉特征维度。可选的,所述深度子模型包括特征向量化层和至少两个全连接层,则所述确定单元,用于:通过所述特征向量化层,将所述资源属性信息中各特征字段和各特征字段对应的特征值进行拼接,并获取拼接后的各特征字段和各特征字段对应的特征值对应的词向量;通过所述至少两个全连接层,对各特征字段对应的词向量进行特征映射,以得到所述资源表示向量。可选的,所述确定单元,用于:分别对各特征字段和各特征字段对应的特征值进行编码,并将编码后的各特征字段和各特征字段对应的特征值进行拼接,得到各特征字段和各特征字段对应的特征值对应的索引号;根据各特征字段和各特征字段对应的特征值对应的索引号,从词向量库中获取所本文档来自技高网
...

【技术保护点】
1.一种多媒体信息推荐方法,其特征在于,所述方法包括:/n获取多个多媒体信息的资源属性信息,以及所述多个多媒体信息在当前时间段之前的N个连续时间段对应的N个互动数据集合,其中,每一时间段的互动数据集合包括所述多媒体信息在多个特征维度上的互动数据;/n分别获取各多媒体信息的N个互动数据集合中每一互动数据集合对应的互动率偏差值集合;其中,每一互动率偏差值集合包括所述多媒体信息在多个特征维度上的互动率偏差值,每一互动率偏差值表示一个特征维度上预估互动率与真实互动率之间的偏差;所述预估互动率为预估的用户与多媒体信息进行互动的次数与所述多媒体信息的展示次数之间的比值;/n利用已训练的互动率校正模型,根据各多媒体信息的资源属性信息与N个互动数据集合对应的N个互动率偏差值集合,获取各多媒体信息在当前时间段的互动率偏差值;其中,所述互动率校正模型是利用多个训练样本训练得到的,每一训练样本包括一个多媒体信息的资源属性信息以及N+1个连续时间段的互动率偏差值集合;所述互动率偏差值表示多媒体信息的预估互动率与真实互动率之间的偏差;/n通过各多媒体信息在当前时间段的互动率偏差值分别对各多媒体信息的预估互动率进行校正;/n根据各多媒体信息校正后的预估互动率,从所述多个多媒体信息中确定目标多媒体信息,并将所述目标多媒体信息推荐给目标用户。/n...

【技术特征摘要】
1.一种多媒体信息推荐方法,其特征在于,所述方法包括:
获取多个多媒体信息的资源属性信息,以及所述多个多媒体信息在当前时间段之前的N个连续时间段对应的N个互动数据集合,其中,每一时间段的互动数据集合包括所述多媒体信息在多个特征维度上的互动数据;
分别获取各多媒体信息的N个互动数据集合中每一互动数据集合对应的互动率偏差值集合;其中,每一互动率偏差值集合包括所述多媒体信息在多个特征维度上的互动率偏差值,每一互动率偏差值表示一个特征维度上预估互动率与真实互动率之间的偏差;所述预估互动率为预估的用户与多媒体信息进行互动的次数与所述多媒体信息的展示次数之间的比值;
利用已训练的互动率校正模型,根据各多媒体信息的资源属性信息与N个互动数据集合对应的N个互动率偏差值集合,获取各多媒体信息在当前时间段的互动率偏差值;其中,所述互动率校正模型是利用多个训练样本训练得到的,每一训练样本包括一个多媒体信息的资源属性信息以及N+1个连续时间段的互动率偏差值集合;所述互动率偏差值表示多媒体信息的预估互动率与真实互动率之间的偏差;
通过各多媒体信息在当前时间段的互动率偏差值分别对各多媒体信息的预估互动率进行校正;
根据各多媒体信息校正后的预估互动率,从所述多个多媒体信息中确定目标多媒体信息,并将所述目标多媒体信息推荐给目标用户。


2.如权利要求1所述的方法,其特征在于,所述互动率校正模型是通过如下训练过程训练得到的:
从训练样本库中获取设定数量的训练样本;
通过获取的训练样本,按照设定的训练参数对所述互动率校正模型进行多次训练,每一次训练过程包括如下步骤:
根据所述资源属性信息以及N+1个连续时间段中前N个时间段的互动率偏差值集合,通过所述互动率校正模型,获取每一训练样本的多媒体信息在第N+1个时间段的互动率偏差值;
根据所述训练样本的多媒体信息在第N+1个时间段的互动率偏差值,与所述训练样本中第N+1个时间段的互动率偏差值集合,获取所述互动率校正模型的损失值;
根据所述损失值确定是否继续对所述互动率校正模型进行训练;
若确定继续对所述互动率校正模型进行训练,则对所述互动率校正模型的模型参数进行调整,并通过调整后的所述互动率校正模型继续下一次训练过程。


3.如权利要求1所述的方法,其特征在于,所述互动率校正模型包括宽度子模型和深度子模型,则针对每一多媒体信息,利用互动率校正模型获取互动率偏差值,包括:
根据所述N个互动率偏差值集合,通过所述宽度子模型获取多媒体信息的互动率偏差向量;
根据所述资源属性信息,通过所述深度子模型获取多媒体信息的资源表示向量;
基于所述宽度子模型和所述深度子模型的权重,根据所述互动率偏差向量和所述资源表示向量得到在当前时间段的互动率偏差值。


4.如权利要求3所述的方法,其特征在于,根据所述N个互动率偏差值集合,通过所述宽度子模型获取多媒体信息的互动率偏差向量,包括:
根据每一特征维度在每一时间段内的互动次数所属的数值区间,确定所述每一特征维度在每一时间段的互动率偏差子向量,其中,所述数值区间是根据互动次数的置信度进行划分的;
将各个特征维度在各时间段的互动率偏差子向量进行拼接,得到多媒体信息对应的互动率偏差向量。


5.如权利要求4所述的方法,其特征在于,根据每一特征维度在每一时间段内的互动次数所属的数值区间,确定所述每一特征维度在每一时间段内的互动率偏差值集合对应的互动率偏差子向量,包括:
将所述每一特征维度在每一时间段内的互动次数所属的数值区间对应位置赋值为所述每一特征维度在每一时间段的互动率偏差值,除所述每一特征维度在每一时间段内的互动次数所属的数值区间之外的其余数值区间对应位置赋值为空值,以得到所述每一特征维度在每一时间段内的互动率偏差值集合对应的互动率偏差子向量。


6.如权利要求1-5任一所述的方法,其特征在于,所述多个特征维度包括多个单一特征维度和由所述多个单一特征维度进行交叉得到的交叉特征维度。


7.如权利要求3-5任一所述的方法,其特征在于,所述深度子模型包括特征向量化层和至少两个全连接层,则根据所述资源属性信息,通过所述深度子模型获取多媒体信息的资源表示向量,包括:
通过所述特征向量化层,将所述资源属性信息中各特征字段和各特征字段对应的特征值进行拼接,并获取拼接后的各特征字段和各特征字段对应的特征值对应的词向量;
通过所述至少两个全连接层,对各特征字段对应的词向量进行特征映射,以得到所述资源表示向量。


...

【专利技术属性】
技术研发人员:严超
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1