当前位置: 首页 > 专利查询>之江实验室专利>正文

一种基于知识图谱的公平性推荐算法制造技术

技术编号:37969077 阅读:8 留言:0更新日期:2023-06-30 09:44
一种基于知识图谱的公平性推荐算法,包括:步骤1、构建知识图谱;步骤2、合并知识图谱与用户项目交互图构成用户项目知识图,用户项目知识图即为用户的输入;步骤3、从用户项目知识图中提取用户项目路径;步骤4、将路径信息输入循环注意力神经网络建模用户的表示;步骤5、通过敏感属性过滤网络过滤掉用户表示中的敏感属性;步骤6、得到最终的表示计算损失函数;步骤7、判断是否达到设定的训练次数;步骤8、结束训练,使用训练好的模型为用户生成公平推荐的项目。本发明专利技术能够实现对于用户项目的公平性推荐,缓解了用户数据的问题,同时能够很好的去除用户敏感属性对于推荐的影响,在推荐方法领域具有重要的作用。领域具有重要的作用。领域具有重要的作用。

【技术实现步骤摘要】
一种基于知识图谱的公平性推荐算法


[0001]本专利技术属于推荐算法应用
,涉及一种基于知识图谱的公平性推荐算法。

技术介绍

[0002]推荐系统的成功使得它在搜索引擎、电子商务、社交媒体网站、新闻门户等网络应用中普遍存在,几乎每一个向用户提供内容的服务都配备了推荐系统。推荐系统通过用户的行为来预测用户偏好,尽管传统基于协同过滤的推荐算法具有有效性和通用性,但由于无法对物品属性、用户配置文件和上下文等侧信息进行建模,因此在用户和物品交互较少的稀疏情况下表现不佳。近年来,将知识图谱引入推荐系统引起了越来越多的关注。知识图谱是一种包含了大量真实世界知识的异构网络,在图谱中节点表示实体,边表示实体间的关系。通过挖掘知识图谱中的内部连接,可以提取用户和项目之间的高阶连接信息。用户和项目之间的路径可以为其稀疏的交互数据提供丰富的补充信息。同时路径信息包含了大量的实体和关系的语义信息,能够更有效的建模用户的表示。
[0003]随着推荐系统的进一步发展,用户也对推荐系统提出了更高的要求,公平性一直是被推荐系统忽视的一个问题。例如,一些用户会对性别因素敏感,他们希望推荐系统能够忽略性别的因素从而做的推荐;例如女性通常购买的衣服颜色为粉色,那么推荐系统通过训练就会为女性推荐更多的粉色衣服而为男性推荐更少的粉色衣服,该推荐结果对于喜欢其他颜色衣服的女性和喜欢粉色衣服的男性是不公平。同时年龄、职业等其他因素也会是用户使用推荐系统的敏感因素。因此一个公平的推荐系统对于提升用户的体验十分重要。现有的公平性算法主要专注于群体的公平性,即推荐的指标在不同群体之间应该是相似的,未能很好实现去除推荐系统中用户敏感属性的影响。同时对于用户敏感属性的去除本质上相当于丢失了一部分用户的数据信息,如何在去除用户数据信息的同时保持推荐性能也是一个需要解决的问题。

技术实现思路

[0004]本专利技术目的是为了实现对于用户项目的公平性推荐,并解决现有推荐方法面临的用户数据稀疏的问题,提出一种基于知识图谱的公平性推荐算法,能够实现对于用户项目的公平性推荐,缓解了用户数据的问题,同时能够很好的去除用户敏感属性对于推荐的影响,在推荐方法领域具有重要的作用。
[0005]本专利技术的技术关键在于,利用知识图谱提取用户和项目之间的高阶路径,来进一步丰富用户的表示;之后通过敏感属性过滤网络过滤用户对应的敏感属性,最后通过多次迭代得到优化后的用户和项目表示,从而实现公平的推荐。
[0006]一种基于知识图谱的公平性推荐算法,其特征在于,包括以下步骤:
[0007]步骤1、构建知识图谱;
[0008]步骤2、合并知识图谱与用户项目交互图构成用户项目知识图,用户项目知识图即为用户的输入;
[0009]步骤3、从用户项目知识图中提取用户项目路径;
[0010]步骤4、将路径信息输入循环注意力神经网络建模用户的表示;
[0011]步骤5、通过敏感属性过滤网络过滤掉用户表示中的敏感属性;
[0012]步骤6、得到最终的表示计算损失函数;
[0013]步骤7、判断是否达到设定的训练次数;
[0014]步骤8、结束训练,使用训练好的模型为用户生成公平推荐的项目。
[0015]进一步,步骤2具体包括:首先将用户项目交互图中的项目与知识图谱中的实体进行匹配,然后将匹配的实体直接相关的全部三元组与用户项目交互图进行合并,最终构成用户项目知识图。
[0016]进一步,步骤3具体包括:对于每一个用户项目交互(u,i),本专利技术利用深度搜索算法在用户项目知识图中分别提取以u为起始节点,i为结束节点,满足不同长度值的多条路径,构成路径集合P(u,i)={p1,p2,...p
n
}。
[0017]进一步,步骤4具体包括:对于一条路径p={e1,r1,e2,r2,...,e
m
},实体嵌入e
j
,对应的实体类别嵌入et
j
以及关系类别嵌入r
j
的组合作为循环注意力神经网络的输入单元;在最后一个实体后填充一个空关系,输入单元不仅包含了序列信息,也由于关系嵌入的引入包含了语义信息;得到路径p对应嵌入{x1,x2,...,x
m
};循环注意力神经网络第l步更新公式如下:
[0018]h
l
=LSTM(h
l
‑1,x
k
),
ꢀꢀ
(1)
[0019]其中,公式(1)中,代表循环注意力神经网络第l

1步的输出,d为循环注意力神经网络隐藏状态的维度;同时,考虑到循环注意力神经网络每步的隐藏层输出都与隐藏层最终的输出h
L
有关,利用注意力机制来计算隐藏层每步输出H={h1,h2,...h
L
}对于h
L
的贡献,来生成最终的路径表示s:
[0020][0021][0022]s=[s

,h
L
],
ꢀꢀ
(4)
[0023]其中,σ代表激活函数,att
l,L
代表隐藏层输出h
l
对于隐藏层最终输出h
L
的影响;对于每一个用户项目交互对(u,i)对应的路径集合,通过公式(1)

(4)可以得到所有路径对应表示的集合S(u,i)={s1,s2,...s
n
};进而可以合并用户交互的所有项目路径表示,得到用户对应的路径集合S(u)={s1,s2,...s
N
};考虑到用户不同的路径对于用户表示的贡献程度是不同的,因此采用自注意力机制来计算不同路径的贡献,并生成最终的用户表示S
u

[0024]Q=W
Q
S(u),
ꢀꢀ
(5)
[0025]K=W
K
S(u),
ꢀꢀ
(6)
[0026]V=W
V
S(u),
ꢀꢀ
(7)
[0027][0028]其中,公式(5)

(7)中,W
Q
、W
K
和代表可训练的参数矩阵。
[0029]进一步,步骤5具体包括:引入敏感属性过滤网络使得用户的敏感属性独立于用户
嵌入;敏感属性过滤网络由多个全连接网络组成;敏感属性过滤网络能选择性的过滤掉敏感属性,对于第j个敏感属性,将其对应的过滤网络定义为f
j
,通过对f
j
进行训练可以过滤掉对应的敏感属性;同时通过组合不同的敏感属性对应的过滤网络,能为用户选择性的去除多种敏感属性,M种属性组合过滤网络得到的用户表示S

u
如下:
[0030][0031]在训练过程中,对所有敏感属性集合采样二进制掩码来决定每次迭代过程中去除的敏感属性组合,能将本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的公平性推荐算法,其特征在于,包括以下步骤:步骤1、构建知识图谱;步骤2、合并知识图谱与用户项目交互图构成用户项目知识图,用户项目知识图即为用户的输入;步骤3、从用户项目知识图中提取用户项目路径;步骤4、将路径信息输入循环注意力神经网络建模用户的表示;步骤5、通过敏感属性过滤网络过滤掉用户表示中的敏感属性;步骤6、得到最终的表示计算损失函数;步骤7、判断是否达到设定的训练次数;步骤8、结束训练,使用训练好的模型为用户生成公平推荐的项目。2.如权利要求1所述的一种基于知识图谱的公平性推荐算法,其特征在于,步骤2具体包括:首先将用户项目交互图中的项目与知识图谱中的实体进行匹配,然后将匹配的实体直接相关的全部三元组与用户项目交互图进行合并,最终构成用户项目知识图。3.如权利要求1所述的一种基于知识图谱的公平性推荐算法,其特征在于,步骤3具体包括:对于每一个用户项目交互(u,i),本发明利用深度搜索算法在用户项目知识图中分别提取以u为起始节点,i为结束节点,满足不同长度值的多条路径,构成路径集合P(u,i)={p1,p2,

p
n
}。4.如权利要求1所述的一种基于知识图谱的公平性推荐算法,其特征在于,步骤4具体包括:对于一条路径p={e1,r1,e2,r2,

,e
m
},实体嵌入e
j
,对应的实体类别嵌入et
j
以及关系类别嵌入r
j
的组合作为循环注意力神经网络的输入单元;在最后一个实体后填充一个空关系,输入单元不仅包含了序列信息,也由于关系嵌入的引入包含了语义信息;得到路径p对应嵌入{x1,x2,

,x
m
};循环注意力神经网络第l步更新公式如下:h
l
=LSTM(h
l
‑1,x
k
), (1)其中,公式(1)中,代表循环注意力神经网络第l

1步的输出,d为循环注意力神经网络隐藏状态的维度;同时,考虑到循环注意力神经网络每步的隐藏层输出都与隐藏层最终的输出h
L
有关,利用注意力机制来计算隐藏层每步输出H={h1,h2,

h
L
}对于h
L
的贡献,来生成最终的路径表示s:来生成最终的路径表示s:s=[s

,h
L
], (4)其中,σ代表激活函数,att
l,L
代表隐藏层输出h
l
对于隐藏层最终输出h
L
的影响;对于每一个用户项目交互对(u,i)对应的路径集合,通过公式(1)

(4)可以得到所有路径对应表示的集合S(u,i)={s1,s2,

s
n
};进而可以合并用户交互的所有项目路径表示,得到用户对应的路径集合S(u)={s1,s2,

s
N
};考虑到用户不同的路径对于用户表示的贡献程度是不同的,因此采用自注意力机制来计算不同路径的贡献,并生成最终的用户表示S
u
:Q=W
Q
S(u),
ꢀꢀ
(5)
K=...

【专利技术属性】
技术研发人员:李超张钊李其明
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1