【技术实现步骤摘要】
一种基于时间感知的逆倾向得分的项目推荐方法
[0001]本专利技术涉及互联网领域,具体涉及一种基于时间感知的逆倾向得分的项目推荐方法。
技术介绍
[0002]传统的推荐方法通常基于观察性的用户项目交互数据构建用户偏好预测模型,并制定推荐列表。但是,观察到的交互数据可能会导致暴露偏差,从而无法准确把握用户的真正兴趣。另一方面,推荐列表与用户满意度之间是存在巨大差距的。通常情况下,用户会被有吸引力的标题/封面而点击某个项目,但点击的项目并不符合用户的偏好。目前,因果理论和深度学习在消除暴露偏差方面的出色表现,例如,DICE通过将用户兴趣和项目曝光分离成两种嵌入并结合在一起来创建预测模型,以便从用户交互历史中捕捉更多的因果关系,但同类方法仅仅是使用基于深度学习计算了文字的字符级表示,并没有反映数据间的因果关系。FAWMF通过引入反事实曝光变量来表示特定项目曝光于用户的概率,并将其作为个性化数据的置信度权重,从而减少推荐模型的偏差影响。但模型的除偏能力直接取决于置信度的准确性,同时用户历史交互记录的隐特征并没有考虑到用户互动历史的曝 ...
【技术保护点】
【技术特征摘要】
1.一种基于时间感知的逆倾向得分的项目推荐方法,其特征在于,包括以下步骤:步骤1:采集带有时间戳的新闻推荐数据和短视频推荐数据,并对带有时间戳的新闻推荐数据和短视频数据进行预处理,得到曝光
‑
点击数据;步骤2:对曝光
‑
点击数据进行特征提取,得到历史交互特征;步骤3:提取历史交互特征中的项目和时间戳,并计算时间序列中的相对时间间隔;步骤4:基于时间间隔与所设置的阈值将历史交互记录分为正负样本;步骤5:对正负样本进行同等概率抽样处理,得到无偏测试集;步骤6:根据历史交互特征,采用逆倾向评分计算方法计算用户的曝光偏好特征和项目的曝光倾向特征;步骤7:结合用户的历史交互特征和曝光倾向特征利用基于深度学习的因子分解机进行模型训练并计算得到得到项目i曝光后是否被用户u点击的点击概率;步骤8:基于无偏测试集验证因子分解机的除偏效果;步骤9:根据训练完成的因子分解机生成点击率降序的项目推荐列表。2.根据权利要求1所述的一种基于时间感知的逆倾向得分的项目推荐方法,其特征在于,所述步骤3包括以下步骤:步骤3.1:提取历史交互特征中的项目和时间戳,得到历史交互序列中具有时间间隔的数据,并基于时间序列对历史交互特征进行排序,得到历史交互特征序列数据;步骤3.2:对历史交互特征序列数据,按照历史交互特征发生的时间节点,计算相邻两个历史交互记录的相对时间间隔;并根据用户分组计算该用户的所有点击项目的最早时间和最近时间,计算该用户交互记录的时间总跨度:所述相对时间间隔的计算表达公式为:其中,T
*
为相对时间间隔,T
i
为用户当前交互项目的时间戳,T
i
‑1为用户上一个交互项目的时间戳,T为用户交互记录的时间总跨度。3.根据权利要求1所述的一种基于时间感知的逆倾向得分的项目推荐方法,其特征在于,所述步骤4包括以下步骤:步骤4.1:将历史交互特征中相对时间间隔小于时间长度阈值的交互记录作为负样本;步骤4.2:将历史交互特征中相对时间间隔大于时间长度阈值的交互记录作为正样本。4.根据权利要求1所述的一种基于时间感知的逆倾向得分的项目推荐方法,其特征在于,所述步骤6包括以下步骤:步骤6.1:基于时间衰减函数计算项目点击量:式中,Y
u,i,t
为计算了时间衰减的项目点击量,为时间衰减函数,按照指数衰减;B为冷却系数,为一个超参数,用于控制时间衰减的强度;Y
u,i
为未计算时间衰减的项目点击量;步骤6.2:对考虑了时间衰减的项目点击量进行求和,并与数据中项目的最大曝光量相除,得到项目曝光倾向和用户曝光偏好:
式中:p
i,t
为项目i在t时刻的曝光倾向,Y
u,i,t
为计算了时间衰减的项目点击量,∑为求和符号,为表示所有项目中的最大曝光量,τ为项目曝光倾向的平滑项;p
u,t
为用户曝光偏好;为带有时间衰减的项目点击量的累积和;|I
u
|为表示用户交互的项目数量;步骤6.3:基于项目曝光倾向和用户曝光偏好,针对单个用户及其交互的项目进行再次求和之后的平均值,得到最终的用户曝光偏好的表示:θ
u,i,t
=α
‑
...
【专利技术属性】
技术研发人员:王庆先,黄庆,常奥,曾昌强,吴苏强,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。