【技术实现步骤摘要】
一种非交互式隐私保护多方机器学习方法
本专利技术属于计算机安全领域,具体涉及一种非交互式隐私保护的多方机器学习方法。
技术介绍
隐私数据的多方机器学习技术与联邦学习技术在实际应用中取得了很好的效果。这些有关隐私保护机器学习的工作面向许多流行的机器学习模型,例如随机决策树、朴素贝叶斯分类、k-均值聚类、神经网络等。但是,这些解决方案中并未考虑数据属主和训练者的安全需求。尽管数据属主(如持有健康记录的患者)未必具有参与训练的需求与客观条件,这些方案还是要求数据属主以交互的方式参与训练,导致了数据属主必须面对频繁交互带来的高计算或通信开销的效率问题。于2019年6月25日公开的专利技术专利CN109934004A,公开了一种机器学习服务系统中保护隐私的方法,包括:步骤1,学习和表达原始数据:将高维的原始数据用低维本征空间表达;步骤2,学习和表达攻击者数据:将所有具有高概率分类结果的查询数据用低维本征空间表达作为攻击者数据;步骤3,比较和判断是否回答当前查询:比较所述攻击者数据与原始数据的相似度,如果相似度大于预设的阈值,确 ...
【技术保护点】
1.一种非交互式隐私保护多方机器学习方法,其特征在于,所述方法构建了非交互式隐私保护机器学习架构,所述架构包括三种实体:/n数据属主,为拥有数据集,并为机器学习分类器的训练提供训练数据,且不需要获得训练结果的实体;/n数据服务提供者,为不可信的辅助服务器,在训练期间承担加密和运算操作,包括发布公共参数,向数据属主颁发加密密钥,以及与训练者合作进行训练;/n训练者,从数据属主处收集数据作为训练数据集,利用该训练数据集训练并建立机器学习分类器模型;/n所述方法包括以下步骤:/nS1、数据服务提供者生成公共参数,并初始化具有安全参数的公钥加密方案,然后为每个数据属主生成私钥与公钥 ...
【技术特征摘要】
1.一种非交互式隐私保护多方机器学习方法,其特征在于,所述方法构建了非交互式隐私保护机器学习架构,所述架构包括三种实体:
数据属主,为拥有数据集,并为机器学习分类器的训练提供训练数据,且不需要获得训练结果的实体;
数据服务提供者,为不可信的辅助服务器,在训练期间承担加密和运算操作,包括发布公共参数,向数据属主颁发加密密钥,以及与训练者合作进行训练;
训练者,从数据属主处收集数据作为训练数据集,利用该训练数据集训练并建立机器学习分类器模型;
所述方法包括以下步骤:
S1、数据服务提供者生成公共参数,并初始化具有安全参数的公钥加密方案,然后为每个数据属主生成私钥与公钥密钥对,并将公钥分发给该数据属主;每一个训练者生成加密密钥对,并公布自己的加密公钥;
S2、数据属主对自己数据集中的每一个记录使用公钥加密方案进行加密,数据属主将加密的数据集上传给训练者,训练者收集后将其作为训练数据集的一部分;
S3、在训练者与数据服务提供者之间运行若干训练轮隐私保护训练协议,最终训练者得到训练完成的机器学习分类器模型,同时数据服务提供者无法以明文的形式揭示机器学习分类器模型的内容。
2.根据权利要求1所述的非交互式隐私保护多方机器学习方法,其特征在于,步骤S1中,公钥加密方案为基于CCA-2安全的公钥加密方案PKE={Gen,Enc,Dec},其模数为n;当需要加密一个训练样本实例x与其对应的标签y时,数据属主需要使用公钥pk进行加密:
(1)随机选择一对互逆的a阶非奇异矩阵A,其中每个元素均在以n为阶的循环群上,并将A设置为z(1);
(2)将A-1*x加密为PKE.Encpk(A-1*x)并设置为z(2);
(3)...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。