【技术实现步骤摘要】
广告推荐模型的监控方法、推荐方法及装置
本专利技术涉及人工智能技术,尤其涉及一种广告推荐模型的监控方法、推荐方法、装置、电子设备及计算机可读存储介质。
技术介绍
人工智能(AI,ArtificialIntelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。广告推荐是人工智能的一个重要应用方向,如何向用户推荐更可能感兴趣的广告是当前的研究目标。广告推荐的推荐效果取决于特征和广告推荐模型的稳定性。出于数据时效性考虑,特征往往要经历周期性更新,而在更新过程中可能出现一些潜在问题,导致特征值分布出现波动,最终影响广告推荐效果,故需要对特征和广告推荐模型进行稳定性监控。在相关技术提供的方案中,通常是通过描述性统计量来进行特征监控,但是描述性统计量对于特征值分布波动的敏感度不高,无法准确地反映特征值分布异常,导致进行广告推荐的准确性差。
技术实现思路
本专利技术实施例提供一种广告推荐模型的监控方法、推荐方法、装置、电子设备及计算机可读存储介质,能够提升对特征值分布波动的敏感程度,更准确地捕捉到异常,并提升根据广告推荐模型进行广告推荐的准确性。本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供一种广告推荐模型的监控方法,包括:针对相邻两个模型更 ...
【技术保护点】
1.一种广告推荐模型的监控方法,其特征在于,包括:/n针对相邻两个模型更新周期,获取在每个所述模型更新周期训练广告推荐模型推荐广告时能够使用的用户样本;/n确定所述用户样本对应用户特征种类的特征值分位数;/n根据所述特征值分位数进行分布估算处理,得到所述用户特征种类对应每个所述模型更新周期的特征值概率分布;/n对所述相邻两个模型更新周期的特征值概率分布之间的差异进行度量处理,得到所述用户特征种类对应的信息散度;/n根据所述信息散度,从所述相邻两个模型更新周期分别对应的用户样本中选取用户样本以作为训练样本;/n其中,所述训练样本用于对所述广告推荐模型进行训练;训练后的所述广告推荐模型用于预测用户对应不同待推荐广告的偏好信息。/n
【技术特征摘要】
1.一种广告推荐模型的监控方法,其特征在于,包括:
针对相邻两个模型更新周期,获取在每个所述模型更新周期训练广告推荐模型推荐广告时能够使用的用户样本;
确定所述用户样本对应用户特征种类的特征值分位数;
根据所述特征值分位数进行分布估算处理,得到所述用户特征种类对应每个所述模型更新周期的特征值概率分布;
对所述相邻两个模型更新周期的特征值概率分布之间的差异进行度量处理,得到所述用户特征种类对应的信息散度;
根据所述信息散度,从所述相邻两个模型更新周期分别对应的用户样本中选取用户样本以作为训练样本;
其中,所述训练样本用于对所述广告推荐模型进行训练;训练后的所述广告推荐模型用于预测用户对应不同待推荐广告的偏好信息。
2.根据权利要求1所述的监控方法,其特征在于,
所述确定所述用户样本对应用户特征种类的特征值分位数,包括:
对所述用户样本对应用户特征种类的特征值进行分位近似处理,得到N分位数;其中,所述N为大于1的整数;
所述根据所述特征值分位数进行分布估算处理,得到所述用户特征种类对应每个所述模型更新周期的特征值概率分布,包括:
构建与所述N分位数对应的分段概率函数;
将所述分段概率函数的被积函数,确定为所述用户特征种类对应所述模型更新周期的特征值概率分布。
3.根据权利要求2所述的监控方法,其特征在于,
所述对所述用户样本对应用户特征种类的特征值进行分位近似处理,得到N分位数之后,还包括:
确定相邻的两个N分位数之间的差值;
当所述差值小于差异阈值时,对所述相邻的两个N分位数进行合并处理;
所述将所述分段概率函数的被积函数,确定为所述用户特征种类对应所述模型更新周期的特征值概率分布之后,还包括:
确定所述特征值概率分布中每一个分段的函数值,并去除满足极值条件的函数值。
4.根据权利要求1所述的监控方法,其特征在于,所述根据所述信息散度,从所述相邻两个模型更新周期分别对应的用户样本中选取用户样本以作为训练样本,包括:
当所述信息散度未超过波动阈值时,将所述相邻两个模型更新周期中后一个模型更新周期对应的用户样本,确定为训练样本;
当所述信息散度超过所述波动阈值时,将所述相邻两个模型更新周期中前一个模型更新周期对应的用户样本,确定为训练样本。
5.根据权利要求1所述的监控方法,其特征在于,所述根据所述信息散度,从所述相邻两个模型更新周期分别对应的用户样本中选取用户样本以作为训练样本,包括:
对所述用户特征种类进行归类处理,得到监控类;
对所述监控类内的所述用户特征种类的信息散度进行平均处理,得到平均信息散度;
根据所述平均信息散度,从所述相邻两个模型更新周期分别对应的用户样本中选取用户样本以作为训练样本。
6.根据权利要求1所述的监控方法,其特征在于,所述对所述相邻两个模型更新周期的特征值概率分布之间的差异进行度量处理,得到所述用户特征种类对应的信息散度,包括:
确定前一个模型更新周期的特征值概率分布与后一个模型更新周期的特征值概率分布之间的交叉熵;
确定所述前一个模型更新周期的特征值概率分布的信息熵;
将所述交叉熵减去所述信息熵,得到所述用户特征种类对应的信息散度。
7.根据权利要求1至6任一项所述的监控方法,其特征在于,还包括:
将所述训练样本中的用户特征值与广告特征值进行组合,得到组合特征值;其中,所述广告特征值是推荐至用户的广告的特征值;
通过所述广告推荐模型,对所述组合特征值进行预测处理,得到待对比的偏好信息;
根据所述待对比的偏好信息与所述训练样本中的样本偏好信息之间的差异,在所述广告推荐模型中进行反向传播,并
在反向传播的过程中,更新所述广告推荐模型的权重参...
【专利技术属性】
技术研发人员:李嘉喆,余传伟,凌国惠,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。