【技术实现步骤摘要】
偏好预测方法、电子设备及存储介质
[0001]本专利技术属于计算机
,具体是涉及到一种偏好预测方法、电子设备及存储介质。
技术介绍
[0002]推荐系统可以预测用户偏好,即帮助用户从海量数据中找到符合其个人偏好的商品或者信息,被广泛应用在电子商务,社交网络和广告等在线应用中。然而,推荐系统一直遭受着各种各样的偏差影响,比如流行度偏差和放大主观偏差。
[0003]为了缓解这两种类型的偏差,近些年很多去偏方法被提出。对于解决流行度偏差来说,主要的方法是通过对物品进行重新赋权,包括加强不流行物品的权重和降低流行物品的权重。对于放大主观偏差,学术界则主要有三种方法,分别从公平性、多样性、以及标准化解决放大主观偏差问题,这三种方法本质上是调整训练中不同类型商品的分布情况。随着近些年因果推理方法在机器学习中被重视,因果方法也被广泛应用在推荐系统去偏领域。学术界也才因果影响的角度给出了流行度偏差和放大主观偏差的解决方法。
[0004]然而,上述的消偏方法仍存在一些问题和缺陷。首先,上述所有方法都通过限制或调整商品权重 ...
【技术保护点】
【技术特征摘要】
1.一种偏好预测方法,其特征是,包括:确定用户历史交互的第一对象集、受流行度偏差影响的第二对象集和受放大主观偏差影响的第三对象集;将所述第一对象集、所述第二对象集和所述第三对象集分别对应编码为第一独热向量、第二独热向量和第三独热向量;将所述第一独热向量、所述第二独热向量和所述第三独热向量分别输入至预先建立的变分自编码器,对应得到第一潜在语义向量、第二潜在语义向量和第三潜在语义向量;根据所述第一潜在语义向量、所述第二潜在语义向量和所述第三潜在语义向量,计算去偏潜在语义向量;将所述去偏潜在语义向量输入至预先建立的解码器,以预测用户偏好的对象。2.如权利要求1所述的偏好预测方法,其特征是,所述确定用户历史交互的第一对象集、受流行度偏差影响的第二对象集和受放大主观偏差影响的第三对象集,包括:获取用户历史交互的第一对象集;计算所述第一对象集中的每一对象的流行程度分数和匹配程度分数;将所述第一对象集中流行程度分数高于预设的第一流行程度值且匹配程度分数低于预设的第一匹配程度值的对象添加至所述第二对象集;将所述第一对象集中流行程度分数低于预设的第二流行程度值且匹配程度分数高于预设的第二匹配程度值的对象添加至所述第三对象集。3.如权利要求2所述的偏好预测方法,其特征是,所述流行程度分数的计算公式为:其中,S
p
(u,i)为针对用户u的对象i的流行程度分数,num(i)为对象i被所有用户交互的次数,X包括用户u交互过的所有对象;所述匹配程度分数的计算公式为:d
u
=∑
j∈X
d
j
;其中,S
m
(u,i)为针对用户u的对象i的匹配程度分数,d
i
为对象i的属性向量,d
u
为用户u的属性向量。4.如权利要求1所述的偏好预测方法,其特征是,所述将所述第一独热向量、所述第二独热向量和所述第三独热向量分别输入至预先建立的变分自编码器,对应得到第一潜在语义向量、第二潜在语义向量和第三潜在语义向量,包括:将所述第一独热向量、所述第二独热向量和所述第三独热向量分别输入至预先建立的解耦合变分自编码器,对应得到第一后验分布、第二后验分布和第三后验分布;从标准正太分布中随机采样向量;根据所述第一后验分布和所述采样向量,生成所述第一潜在语义向量;根据所述第二后验分布和所述采样向量,生成所述第二潜在语义向量;根据所述第三后验分布和所述采样向量,生成所述第三潜在语义向量。5.如权利要求4所述的时序网络中的链路预测方法,其特征是,所述第一潜在语义向量
的生成公式为:z
x
=μ
x
+∈
⊙
σ
x
;其中,z
x
为所述第一潜在语义向量,μ
x
为所述第一后验分布中的平均值向量,σ
x
为所述第一后验分布中的方差向量,∈为所述采样向量;所述第二潜在语义向量的生成公式为:z
m
=μ
【专利技术属性】
技术研发人员:陈洪辉,蔡飞,郭昱普,郑建明,邵太华,潘志强,陈翀昊,王梦如,张鑫,宋城宇,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。