【技术实现步骤摘要】
基于隐私保护的线性回归特征显著性检验方法、装置
本说明书实施例属于密码学中多方安全计算的隐私保护
,尤其涉及一种基于隐私保护的线性回归特征显著性检验方法、装置。
技术介绍
目前多方参与的数据共享应用场景中,共享数据通常由多个参与方提供,各个参与方的私有数据保留在本地,不进行明文的聚合。多个参与方数据需要统一建立模型时,需保证参与方输出的输出结果为私有的,对其他参与方是不可见的。在数据共享的应用场景中,多个参与方通常需要共同参与建立相应的模型。例如使用机器学习模型来进行模型预。所述的模型通常可以包括采用某种算法建立的回归方程。回归方程中通常包括应用场景下采集的多种特征信息。这些特征信息通常作为回归方程的自变量,预测对象作为回归方程的因变量。一般的,当自变量与因变量确实存在某种关系时,建立的回归方程才有意义,而目前构建回归方程使用的特征信息多种多样。因此,作为自变量的特征信息与作为因变量的预测对象是否有关,相关程度如何、能否作为回归方程使用的特征等对最终构建的模型的数据效果影响重大。
技术实现思路
r>本说明书的目的在本文档来自技高网...
【技术保护点】
1.一种基于隐私保护的线性回归特征显著性检验方法,包括:/n设置回归特征的回归系数在t检验中的原假设为零,各参与方基于多方安全计算的线性回归训练确定t检验中回归系数的估计值和联合矩阵的误差平方和的无偏估计值;/n根据第一参与方持有的私有数据构成的第一原始矩阵、第二参与方持有的私有数据构成的第二原始矩阵确定的第二原始矩阵计算联合矩阵的对称矩阵的第一加法分片和第二加法分片;/n基于所述第一加法分片和第二加法分片,两方联合计算隐私保护下的所述对称矩阵的逆矩阵的第一加法分片和第二加法分片;/n基于所述逆矩阵的第一加法分片和第二加法分片、所述无偏估计值,第一参与方和第二参与方联合计算 ...
【技术特征摘要】
1.一种基于隐私保护的线性回归特征显著性检验方法,包括:
设置回归特征的回归系数在t检验中的原假设为零,各参与方基于多方安全计算的线性回归训练确定t检验中回归系数的估计值和联合矩阵的误差平方和的无偏估计值;
根据第一参与方持有的私有数据构成的第一原始矩阵、第二参与方持有的私有数据构成的第二原始矩阵确定的第二原始矩阵计算联合矩阵的对称矩阵的第一加法分片和第二加法分片;
基于所述第一加法分片和第二加法分片,两方联合计算隐私保护下的所述对称矩阵的逆矩阵的第一加法分片和第二加法分片;
基于所述逆矩阵的第一加法分片和第二加法分片、所述无偏估计值,第一参与方和第二参与方联合计算所述回归系数的标准差的第一加法分片和第二加法分片;
根据所述回归系数的标准差的第一加法分片和第二加法分片、回归系数的估计值计算回归特征的统计量;
根据所述统计量所对应的P值确定的t检验结果,确定回归特征的显著性检验结果。
2.如权利要求1所述的方法,在t检验中,采用回归系数与所诉回归系数的标准差的商作为统计量t的数值。
3.如权利要求1所述的方法,所述联合矩阵包括采用下述方式构建的假想矩阵:
将第一参与方A持有的私有数据构成的第一原始矩阵和将第二参与方B持有的私有数据构成的第二原始矩阵横向拼接在一起构成的联合矩阵,在联合矩阵中,每一列表示一个特征的个特征样本,每一行表示个特征,则特征数,为第一参与方A的特征个数,为第二参与方B的特征个数,为第一参与方A中单个特征的样本数,为第二参与方B中单个特征的样本数。
4.如权利要求1所述的方法,所述联合矩阵包括采用下述方式构建的假想矩阵:
将第一参与方A持有的私有数据构成的第一原始矩阵和将第二参与方B持有的私有数据构成的第二原始矩阵纵向拼接在一起构成的联合矩阵,在联合矩阵中,每一列表示一个特征的个特征样本,每一行表示个特征,则特征数,为第一参与方A的特征个数,为第二参与方B的特征个数,为第一参与方A中单个特征的样本数,为第二参与方B中单个特征的样本数。
5.如权利要求3或4所述的方法,所述原始矩阵包括采用下述方式构建生成:
参与方将本地私有数据中的特征按行构成原始矩阵或按列构成原始矩阵的转置矩阵,为相应的参与方,其中,在原始矩阵中,每一列表示一个特征的个特征样本,每一行表示个特征。
6.如权利要求1所述的方法,所计算所述回归系数的标准差的第一加法分片和第二加法分片包括:
基于所述逆矩阵的第一加法分片和第二加法分片,第一参与方和第二参与方联合计算所述无偏估计值与逆矩阵相乘的运算结果的第一加法分片和第二加法分片;
根据所述相乘的运算结果的第一加法分片和第二加法分,第一参与方和第二参与方联合进行隐私保护平方根倒数算法的计算,得到回归系数的标准差的第一加法分片和第二加法分片。
7.如权利要求1所述的方法,所述方法还包括:
根据所述回归特征的显著特性检验结果对特征进行筛选,确定适用特征。
8.一种基于隐私保护的线性回归特征显著性检验方法,包括:
第一参与方基于多方安全计算的线性回归训练确定t检验中回归特征的回归系数的估计值和联合矩阵的误差平方和的无偏估计值,其中,设置所述回归系数在t检验中的原假设为零;
第一参与方获取联合矩阵的对称矩阵的第一加法分片,所述联合矩阵根据第一参与方持有的私有数据构成的第一原始矩阵、第二参与方持有的私有数据构成的第二原始矩阵确定;
基于所述第一加法分片和第二参与方的第二加法分片,第一参与方通过与第二参与方联合计算隐私保护下的所述对称矩阵的逆矩阵的分片,得到所述逆矩阵的第一加法分片;
基于所述逆矩阵的第一加法分片和第二参与方的逆矩阵的第二加法分片、所述无偏估计值,第一参与方通过与第二参与方联合计算所述回归系数的标准差的分片,得到所述回归系数的标准差的第一加法分片;
根据所述回归系数的标准差的第一加法分片和第二参与方的回归系数的标准差的第二加法分片、回归系数的估计值计算回归特征的统计量;
根据所述统计量所对应的P值确定的t检验结果,确定回归特征的显著性检验结果。
9.如权利要求8所述的方法,在t检验中,采用回归系数与所诉回归系数的标准差的商作为统计量t的数值。
10.如权利要求8所述的方法,所述联合矩阵包括采用下述方式构建的假想矩阵:
将第一参与方A持有的私有数据构成的第一原始矩阵和将第二参与方B持有的私有数据构成的第二原始矩阵横向拼接在一起构成的联合矩阵,在联合矩阵中,每一列表示一个特征的个特征样本,每一行表示个特征,则特征数,为第一参与方A的特征个数,为第二参与方B的特征个数,为第一参与方A中单个特征的样本数,为第二参与方B中单个特征的样本数。
11.如权利要求8所述的方法,所述联合矩阵包括采用下述方式构建的假想矩阵:
将第一参与方A持有的私有数据构成的第...
【专利技术属性】
技术研发人员:刘颖婷,陈超超,王力,周俊,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。