【技术实现步骤摘要】
一种推荐系统用点击率预测模型去偏方法、装置及介质
[0001]本专利技术涉及机器学习和数据挖掘领域,尤其涉及一种推荐系统用点击率预测模型去偏方法、装置及介质。
技术介绍
[0002]近年来,推荐系统被广泛地应用于电商与短视频等平台中。作为其中最重要的环节之一,点击率预测任务利用丰富的特征信息对候选物品进行排序,起到了个性化推荐的作用。目前的推荐场景下,推荐系统所收集的用户数据普遍存在偏差,而点击率预测模型往往会捕捉并扩大这种偏差,进而造成用户侧信息茧房、物品及商家侧不公平等危害。为了互联网平台的长期利益与可持续发展,除了提升点击率转化率以外,如何减轻推荐系统偏差、提升公平性正日渐成为重要的目标之一。
[0003]部分研究尝试调整点击率预测模型的训练方式,如将公平性指标纳入损失函数或进行对抗训练等。尽管这些方法能有效减轻模型偏差、提升推荐结果的公平性,但是它们忽略了造成模型偏差的根本原因,从而无法解释其方法为何有效。这对于建立可信任的推荐系统,规范模型治理等方面造成了困难。
[0004]为了快速有效地对点击率预 ...
【技术保护点】
【技术特征摘要】
1.一种推荐系统用点击率预测模型去偏方法,其特征是,该去偏方法包括点击率预测模型的偏差生成过程及根本原因分析步骤、用于提升物品侧公平性的一阶权重缩减操作步骤或用于提升无偏测试准确率的一阶权重重构操作步骤,其中:所述点击率预测模型的偏差生成过程及根本原因分析步骤,是通过逐个阻断模型的不同结构部分,确定模型线性部分对特征级偏差的关键贡献,然后对线性部分中一阶权重的学习过程进行理论分析,分析得出物品组间不平衡的正样本率与特征层面偏差之间存在较强相关性;所述一阶权重缩减操作步骤,是通过切断正样本比例不均匀分布对模型预测的影响路径,对抗特征层面偏差,牺牲极少推荐准确率以提升有偏测试的物品侧公平性;所述一阶权重重构操作步骤,是通过少量随机曝光的交互数据构造点击率预测模型中的一阶权重,将模型推荐结果与用户真实兴趣靠拢,以提升无偏测试物品推荐准确率。2.根据权利要求1所述的推荐系统用点击率预测模型去偏方法,其特征是,所述点击率预测模型的偏差生成过程及根本原因分析步骤具体包括以下过程:(1)点击率预测模型在数据集下进行训练过程中,训练集中不同种类物品的正样本率分布不平衡,得出造成点击率预测模型产生偏差的根本原因;(2)对于点击率预测模型FM或NFM的预测分数,表达为:,其中表示第j个特征的一阶线性权重,表示模型的全局偏置,表示交互记录中含有第j个特征,则表示交互记录中含有第j个特征,表示高阶特征交互输出,式中不平衡的种类正样本率导致点击率预测模型中各种类对应的一阶线性权重差距较大,且权重与正样本率呈线性正相关关系;(3)的取值影响最终的预测分数,最终造成预测分数与正样本率呈线性正相关关系;(4)最终的预测分数影响到推荐结果,即正样本率较高的种类在最终推荐时易被多推。3.根据权利要求1所述的推荐系统用点击率预测模型去偏方法,其特征是,所述一阶权重缩减操作步骤中,在有偏的推荐模型CTR训练后,通过调整权重以缓解特征层面偏差,并改变k个参数,其形式化表达为:,其中表示第j个特征理想中的一阶线性权重,且。4.根据权利要求3所述的推荐系统用点击率预测模型去偏方法,其特征是,在训练完...
【专利技术属性】
技术研发人员:冯福利,金锦秋,丁斯昊,王文杰,何向南,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。