一种在间接协作学习背景下的投毒恶意用户的剔除方法技术

技术编号：38093258 阅读：7 留言：0更新日期：2023-07-06 09:06

本发明专利技术公开了一种在间接协作学习背景下的投毒恶意用户的剔除方法，涉及信息安全技术领域。该方法为：运用聚类算法对用户上传的每一种掩码特征的值进行聚类分析，分为两个簇；若两个簇的聚类中心的欧氏距离大于阈值，则该特征为指示性特征；上述指示性特征内包含用户数较少的簇为可疑簇，将其中的用户标记为可疑用户；当某一用户被多次标记为可疑后，将其作为恶意用户剔除。利用余下良性用户上传的掩码特征训练得到的间接协作学习的全局模型，能够应对投毒攻击的鲁棒性，而几乎不损失模型精度。度。度。

全部详细技术资料下载

【技术实现步骤摘要】
一种在间接协作学习背景下的投毒恶意用户的剔除方法

[0001]本专利技术涉及信息安全
，特别是涉及一种在间接协作学习背景下的投毒恶意用户的剔除方法。

技术介绍

[0002]一些企业采用协作学习来了解客户对其产品的行为。他们以评论、反馈或其他属性的形式从用户那里收集数据。在这项工作中，我们将收集数据并在其上处理学习算法的实体称为服务器。服务器并不一定需要是一个中心化的实体。服务器的任务可以在参与者之间以分布式的方式执行。向服务器提交数据的参与者或客户称为用户。用户可以是拥有自己数据集的个人、团体或公司。用户并不知道或了解其他用户的训练数据的任何直接信息。在间接协作学习设置下，用户不是直接将原始数据提交给服务器，而是掩码自己数据的一些信息，并将其发送给服务器。这既节省了带宽(数据成本)，又产生了更好的隐私。被屏蔽的信息称为被屏蔽的特征。用户在他们的机器上计算一个本地模型，该模型生成掩码特征。服务器从所有用户中收集这些掩码特征，并执行操作(例如求和)来生成一个全局训练的模型。这个全局模型从整个数据集中捕获特征，因此具有非常高的准确性。在上述讨论的间接协作学习环境中，我们认为有常数分数(f)的用户是恶意的。这些恶意用户被激励修改或毒害训练数据集，以影响全局模型的准确性。例如，垃圾邮件发送者可以将真正的电子邮件标记为垃圾邮件，从而降低学习到的垃圾邮件过滤器的准确性。这样的垃圾邮件过滤器会将真实内容的电子邮件指定为垃圾邮件，从而降低过滤器在用户中的可信度。在合理情况下，大多数用户是诚实的，而一小部分用户f(ε&lt...

【技术保护点】

【技术特征摘要】
1.一种在间接协作学习背景下的投毒恶意用户的剔除方法，其特征在于，所述方法为：运用聚类算法对用户上传的每一种掩码特征的值进行聚类分析，分为两个簇；若两个簇的聚类中心的欧氏距离大于阈值，则该特征为指示性特征；所述指示性特征内包含用户数较少的簇为可疑簇，将其中的用户标记为可疑用户；当某一用户被多次标记为可疑用户后，将其作为恶意用户剔除。2.根据权利要求1所述的在间接协作学习背景下的投毒恶意用户的剔除方法，其特征在于，所述聚类算法为k均值聚类算法，运用聚类算法对用户上传的每一种掩码特征的值进行聚类分析，具体为：1)针对某个掩码特征，在所有用户上传的值中随机选取两个值p1
(0)
和p2
(0)
作为初始聚类中心；2)计算剩余所有值与p1
(0)
和p2
(0)
的欧氏距离与哪个聚类中心更近则归到该聚类中心所属簇下，其中n为掩码特征的值的维数；计算本次生成的两个簇的质心，作为新的聚类中心p1
(1)
和p2

【专利技术属性】
技术研发人员：陈艳姣，徐文渊，姚孝轩，白怡杰，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人