当前位置: 首页 > 专利查询>河北大学专利>正文

基于生成式对抗网络的推荐系统中的投毒攻击方法技术方案

技术编号:37554895 阅读:14 留言:0更新日期:2023-05-15 07:39
本发明专利技术涉及一种基于生成式对抗网络的推荐系统中的投毒攻击方法,具体包括以下步骤:S1、将推荐系统中用户项目评分数据集中的所有用户项目评分序列划分为用户短序列,从中挑选出与目标项目相似的项目和流行项目,归为候选项目集;根据用户短序列中各短序列与候选项目集的重叠程度,将用户短序列划分为高影响序列和低影响序列,再从中挑选出模板用户概貌,模板用户概貌中的高影响序列被转换为高影响概貌,模板用户概貌中的低影响序列被转换为低影响概貌;S2、利用生成式对抗网络对高影响概貌和低影响概貌进行训练,训练完成后得到训练好的生成器和参数;随机挑选模板用户概貌中α个用户作为模板用户,生成虚假用户概貌。本发明专利技术解决了现有网络推荐系统中虚假用户概貌生成质量不高和投毒攻击效果不佳的问题。质量不高和投毒攻击效果不佳的问题。质量不高和投毒攻击效果不佳的问题。

【技术实现步骤摘要】
基于生成式对抗网络的推荐系统中的投毒攻击方法


[0001]本专利技术涉及一种网络安全技术,具体地说是一种基于生成式对抗网络的推荐系统中的投毒攻击方法。

技术介绍

[0002]推荐系统是利用服务商平台信息向客户提供商品信息和建议,帮助用户做出合适的决策,提供个性化建议的服务平台。但是,由于推荐系统本身的特性,它不仅有益于用户,而且还可以帮助供应商推广他们的产品。因此,有恶意攻击者想要攻击推荐系统,以实现其恶意目标——推广或者减少推广商品。而为了增强推荐系统的鲁棒性,目前主要是从提高推荐系统攻击能力的角度,期待从反方向抵御恶意攻击。
[0003]投毒攻击是推荐系统中经常遇到的攻击方式,它是指攻击者通过向推荐系统中注入精心设计的虚假用户概貌,扰乱系统推荐的结果,达到抬高或者降低特定目标项目的推荐频率或评分的恶意攻击行为。由于深度学习技术的发展,攻击者不在限制于人工设计的虚假用户概貌,攻击者利用现有的深度学习技术,生成更加难以分辨的虚假用户概貌,给推荐系统的安全性带来了极大的挑战。由于生成式对抗网络在模仿和复制上的强大能力,目前已经有很多研究人员应用生成式对抗网络学习和模拟,生成对抗样本。
[0004]早期对于投毒攻击的研究主要集中在原始攻击模型上,这些模型都是基于启发式规则来创建虚假用户概貌的。由于其设计方式简单,攻击造成的破坏能力小,且容易被检测出来,因此已经不能满足提高推荐系统安全和可靠性的需要。所以,目前急需新型攻击方法的出现,帮助推荐系统防御方向的进步。
[0005]推荐系统的对抗策略包括两大类:推荐系统中的攻击检测和提高推荐系统的鲁棒性。推荐系统的攻击检测算法纷繁多样,其目的是在于提高推荐系统的检测效率和准确率。但是,目前的检测算法并不能很好地检测基于深度学习技术的虚假用户概貌。

技术实现思路

[0006]本专利技术的目的就是提供一种基于生成式对抗网络的推荐系统中的投毒攻击方法,以解决现有网络推荐系统中虚假用户概貌的生成质量不高和攻击效果不佳的问题。
[0007]本专利技术的目的是这样实现的:
[0008]一种基于生成式对抗网络的推荐系统中的投毒攻击方法,包括以下步骤:
[0009]S1、模板用户的选择和处理:先将推荐系统中用户项目评分数据集中的所有用户项目评分序列划分为用户短序列,从中挑选出与目标项目相似的项目和流行项目,归为候选项目集;根据用户短序列中各短序列与候选项目集的重叠程度,将用户短序列划分为高影响序列和低影响序列,再从中挑选出模板用户概貌,模板用户概貌中的高影响序列被转换为高影响概貌,模板用户概貌中的低影响序列被转换为低影响概貌。
[0010]S2、虚假用户概貌的生成:利用生成式对抗网络对高影响概貌和低影响概貌进行训练,训练完成后得到训练好的生成器和参数;随机挑选模板用户概貌中α个用户作为模板
用户,生成虚假用户概貌。
[0011]进一步地,步骤S1的具体操作方式是:
[0012]S1

1从推荐系统中收集用户项目历史评分数据,构建用户项目评分数据集。
[0013]S1

2根据用户项目历史评分数据,得出用户项目评分序列:其中,为用户u交互过的第x个项目。
[0014]S1

3根据时间间隔阈值Δt,将用户项目评分序列URIS
u
划分到不同的用户短序列中;其划分依据是:如果则项目和被划分进同一个短序列中;反之,则被划分到下一个短序列中;其中,和表示用户项目评分序列URIS
u
中任意两个相邻的项目,和表示项目和对应的评分时间。
[0015]S1

4按照公式(1)计算目标项目与其他项目之间的项目相似度w
ij

[0016][0017]其中,为用户项目评分数据集中项目i的平均评分,为用户项目评分数据集中项目j的平均评分;U
ij
=U
i
∩U
j
,表示为给项目i和项目j都评过分的用户集合。
[0018]S1

5按照公式(2)计算各项目的项目流行度τ
i

[0019][0020]其中,|U
i
|为给项目i评过分的用户集合总数,表示用户项目评分数据集中用户项目的交互总次数。
[0021]S1

6根据计算得到的项目相似度w
ij
和项目流行度τ
i
,将与目标项目相关的项目以及有益于目标项目被推荐的项目一并归入候选项目集CIS:
[0022]CIS={i∈I:w
ij
>γ or τ
i
>ρ}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0023]其中,γ为项目相似度选择阈值,ρ为项目流行度选择阈值。
[0024]S1

7分别计算用户短序列USSS
u
中各短序列与候选项目集CIS的重叠程度OR
u,i

[0025][0026]如果某个短序列的重叠程度OR
u,i
大于影响划分阈值λ,则该短序列即被归入高影响序列;反之,则被归入低影响序列。
[0027]S1

8对于当用户短序列USSS
u
中高影响序列的比例超过设定值时,将该用户的评分概貌视为模板用户概貌;模板用户概貌中的高影响序列被转换为高影响概貌,低影响序列被转换为低影响概貌;高影响概貌表示用户u对属于高影响序列的项目的评分向量,低影响概貌表示用户u对属于低影响序列的项目的评分向量。
[0028]进一步地,步骤S2的具体操作方式是:
[0029]S2

1对生成器G
h
、生成器G
l
和鉴别器D分别进行随机的初始化。
[0030]S2

2在固定鉴别器D的参数后,训练生成器G
h
和生成器G
l
;将噪声向量z输入到生成
器G
h
和生成器G
l
中,训练生成虚假用户评分向量。
[0031]S2

3从模板用户概貌中挑选出M
G
个概貌,以表示真实用户的评分行为;从高影响概貌得到高影响概貌的指示向量的值,从低影响概貌得到低影响概貌的指示向量的值;指示向量e
u,i
是一个n维向量,用以判断被挑选的模板用户概貌中高影响概貌和低影响概貌中用户u是否给项目i评过分;如果指示向量e
u,i
=1,则表示评过分;如果指示向量e
u,i
=0,则表示没有评过分。
[0032]S2

4对生成器G
h
和生成器G
l
进行训练,得本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于生成式对抗网络的推荐系统中的投毒攻击方法,其特征是,包括以下步骤:S1、模板用户的选择和处理:先将推荐系统中用户项目评分数据集中的所有用户项目评分序列划分为用户短序列,从中挑选出与目标项目相似的项目和流行项目,归为候选项目集;根据用户短序列中各短序列与候选项目集的重叠程度,将用户短序列划分为高影响序列和低影响序列,再从中挑选出模板用户概貌,模板用户概貌中的高影响序列被转换为高影响概貌,模板用户概貌中的低影响序列被转换为低影响概貌;S2、虚假用户概貌的生成:利用生成式对抗网络对高影响概貌和低影响概貌进行训练,训练完成后得到训练好的生成器和参数;随机挑选模板用户概貌中α个用户作为模板用户,生成虚假用户概貌。2.根据权利要求1所述的基于生成式对抗网络的推荐系统中的投毒攻击方法,其特征是,步骤S1的具体操作方式是:S1

1从推荐系统中收集用户项目历史评分数据,构建用户项目评分数据集;S1

2根据用户项目历史评分数据,得出用户项目评分序列:其中,为用户u交互过的第x个项目;S1

3根据时间间隔阈值Δt,将用户项目评分序列URIS
u
划分到不同的用户短序列中;其划分依据是:如果则项目和被划分进同一个短序列中;反之,则被划分到下一个短序列中;其中,和表示用户项目评分序列URIS
u
中任意两个相邻的项目,和表示项目和对应的评分时间;S1

4按照公式(1)计算目标项目与其他项目之间的项目相似度w
ij
:其中,为用户项目评分数据集中项目i的平均评分,为用户项目评分数据集中项目j的平均评分;U
ij
=U
i
∩U
j
,表示为给项目i和项目j都评过分的用户集合;S1

5按照公式(2)计算各项目的项目流行度τ
i
:其中,|U
i
|为给项目i评过分的用户集合总数,表示用户项目评分数据集中用户项目的交互总次数;S1

6根据计算得到的项目相似度w
ij
和项目流行度τ
i
,将与目标项目相关的项目以及有益于目标项目被推荐的项目一并归入候选项目集CIS:CIS={i∈I:w
ij
>γ or τ
i
>ρ}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)其中,γ为项目相似度选择阈值,ρ为项目流行度选择阈值;S1

7分别计算用户短序列USSS
u
中各短序列与候选项目集CIS的重叠程度OR
u,i

如果某个短序列的重叠程度OR
u,i
大于影响划分阈值λ,则该短序列即被归入高影响序列;反之,则被归入低影响序列;S1

8对于当用户短序列USSS
u
中高影响序列的比例超过设定值时,将该用户的评分概貌视为模板用户概貌;模板用户概貌中的高影响序列被转换为高影响概貌,低影响序列被转换为低影响概貌;高影响概貌表示用户u对属于高影响序列的项目的评分向量,低影响概貌表示用户u对属于低影响序列的项目的评分向量。3.根据权利要求1所述的基于生成式对抗网络的推荐系统中的投毒攻击方法,其特征是,步骤S2的具体操作方式是:S2

1对生成器G
h
、生成器G
l
和鉴别器D分别进行随机的初始化;S2

2在固定鉴别器D的参数后,训练生成器G
h
和生成器G
l
;将噪声向量z输入到生成器G
h
和生成器G
l
中,训练生成虚假用户评分向量;S2

3从模板用户概貌中挑选出M
G
个概貌,以表...

【专利技术属性】
技术研发人员:蔡红云王诗云张宇王嘉豪
申请(专利权)人:河北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1