【技术实现步骤摘要】
一种对隐私计算模型安全发布及引用的装置及方法
[0001]本专利技术属于隐私计算领域,尤其涉及一种对隐私计算模型安全发布及引用的装置及方法。
技术介绍
[0002]目前有关机器学习模型或其他数据应用模型,对其在训练运行完成之后,都想将其进行公开发布至其他人所使用,例如:对图像数据集、文本数据进行深度学习后得出的模型,基于数学运算得出的一个可用于生产的多项式公式等,将这些公开出去,对于使用方和研发方都能带来一些利益上的价值。
[0003]但公开时会存在一些较为严重的隐私数据问题,比如模型的参数、模型的权重项偏置项、模型的结构等都会出现泄露,这些泄露可会被攻击进行穷举进而可以大概率的反推出原始使用的隐私数据集,这就会造成隐私数据泄露,有些模型的公开甚至还需要将所用到的数据集进行公开,因为需要给到第三方使用一起参与再次训练等,比如本地单方建模等等,这样就甚至会直接泄露原始隐私数据。
[0004]需要说明的是,上述内容属于专利技术人的技术认知范畴,并不必然构成现有技术。
技术实现思路
[0005]为了解决上述问题,本专利技术的目的是提供一种对隐私计算模型安全发布及引用的装置及方法,致力于尽可能的既保证单方或多方模型能够正常发布公开使用,又能保证隐私在不被泄露的情况下,同时使得数据和模型还保持有一种有价值意义的计算,通过核心算法:价值噪声回归算法,通过对训练好的模型或是数学多项式等,结合模型或数学运算的出来的结果集,对原始数据集、结果集、模型等隐私敏感类数据进行价值噪声获取并加入噪声形成脱敏状态 ...
【技术保护点】
【技术特征摘要】
1.一种对隐私计算模型安全发布及引用的装置,装置包括多个节点,多个节点分别表示为:节点A、节点B、节点C...节点DATA,其特征在于,节点A、节点B、节点C...节点DATA均为多方隐私计算节点,装置中的节点同时支持在单方/多方建模下的隐私模型发布与引用;节点A、节点B、节点C...节点DATA均利用隐私计算技术进行建模计算,隐私计算技术包括计算联邦学习、多方安全计算和同态加密;节点A、节点B、节点C...节点DATA均利用自己本地的隐私数据进行多方的隐私建模计算,最终会得到五个输出:结果数据、模型、结构、报告和输入源。2.根据权利要求1所述的一种对隐私计算模型安全发布及引用的装置,其特征在于,所述结果数据是隐私建模计算后得到的结果数据;模型则是类隐私机器学习训练得到的模型结果;所述结构是一个dag结构,在运行逻辑回归前,需要对数据进行特征工程,特征工程包括特征筛选和特征采样,特征工程或算法之间通过dag结构进行前后连接,形成一种有顺序执行的模型结构;所述报告是训练得到的模型报告,用于对模型进行评价;所述输入源则表示该模型用到了节点A、节点B、节点C...节点DATA的哪些源始隐私数据。3.根据权利要求1所述的一种对隐私计算模型安全发布及引用的装置,其特征在于,将所述输出代入价值噪声回归算法,价值噪声回归算法是利用已经经过隐私建模计算得到的模型,并在其中获取相关特征的价值噪声影响特征取值幅度,价值噪声回归算法最终输出的结果称为价值噪声包,价值噪声包包含有结果数据、模型、结构、报告和输入源并已经过脱敏。4.根据权利要求1所述的一种对隐私计算模型安全发布及引用的装置,其特征在于,所述装置还包括模型市场,模型市场是用于公开公布价值噪声包的地方,各节点用户在此处获取引用想要使用的模型。5.基于权利要求4所述的装置的引用方法,其特征在于,所述引用方法以下以多方的形式进行阐述:S1:单方或多方上传本地数据并单方或联合建模;S2:建模计算得出结果;S3:结果代入至价值噪声回归算法;S4:算法输出价值噪声包;S5:价值噪声包拷贝发布至模型市场;S6:节点浏览模型市场并拷贝引用模型;S7:节点本地数据与价值噪声包进行计算得到结果。6.根据权利要求5所述的引用方法,其特征在于,所述S1具体包括如下步骤:节点A、节点B、节点C...节点DATA多方在自己节点本地上传隐私数据,隐私数据是一种多行多列格式数据集,并联合构建一个dag模型,最终的dag模型构建的是一个数学多项式,记为structure_dag;根据该structure_dag,节点A提供A1列数据,节点B提供B2列数据,节点C提供C3列数据...DATA提供DATA
x
列数据参与计算,然后将其转换为普通的数学多项式,记为f(A1,B2,
C3,....,DATA
x
):7.根据权利要求6所述的引用方法,其特征在于,所述S2具体包括如下步骤:多方开始基于structure_dag和f(A1,B2,C3,....,DATA
x
)进行同态计算,在密文级别上的数学多项式运算最终输出结果数据,并解密得到明文级别的结果数据,最终的结果数据是多行单列型数据,记为result_data。8.根据权利要求7所述的引用方法,其特征在于,所述S3具体包括如下步骤:将structure_dag、f(A1,B2,C3,....,DATA
x
)、result_data代入进价值噪声回归算法,设置迭代轮次阈值,当前第n次迭代次数算出来的损失值TLoss
n
的计算公式为:TLoss
n
是一个常数值,根据TLoss
n
的表达式,得到fLoss
n
,将该fLoss
n
求平方转换为函数可导性质,用于使用类梯度下降方式求出下一轮迭代的A1、B2、C3....DATA
x
值,记为值,记为分别对A1、B2、C3....DATA
x
求偏导数,将进行化简展开到:对求偏导A1:对B2求偏导:对C3求...
【专利技术属性】
技术研发人员:王济平,黎刚,高俊杰,汤克云,容梓豪,徐荣文,
申请(专利权)人:京信数据科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。