【技术实现步骤摘要】
基于多方安全计算检验模型特征显著性的方法和装置
本说明书实施例涉及机器学习
,更具体地,涉及一种基于多方安全计算检验线性回归模型的特征显著性的方法和装置。
技术介绍
机器学习所需要的数据往往会涉及到多个平台、多个领域。例如在基于机器学习的商户分类分析场景中,电子支付平台拥有商户的交易流水数据,电子商务平台存储有商户的销售数据,银行机构拥有商户的借贷数据。数据往往以孤岛的形式存在。由于行业竞争、数据安全、用户隐私等问题,数据整合面临着很大阻力,如何在保证数据不泄露的前提下将分散在各个平台的数据整合在一起成为一项挑战。在例如线性回归模型中,在训练出模型参数之后,还需要通过回归分析对各个模型参数进行检验。“回归分析”是解析自变量和因变量并明确两者关系的统计方法。只有当自变量与因变量确实存在某种关系时,建立的回归方程才有意义。因此,作为自变量的因素与作为因变量的预测对象是否有关,相关程度如何,以及判断这种相关程度的把握性多大,就成为进行回归分析必须要解决的问题。通常,“回归分析”会使用t检验来对回归项系数一一检 ...
【技术保护点】
1.一种基于多方安全计算检验线性回归模型的特征显著性的方法,所述方法由多个数据持有方中第一数据持有方的设备执行,所述多个数据持有方各自的设备中共同存储了N个样本和所述模型的模型参数,所述模型参数基于所述N个样本获取,其中,各个数据持有方设备中分别存储有与所述模型参数中第j个模型参数对应的第一数值,各个第一数值之和等于所述第j个模型参数,所述N个样本中包括的特征数据构成特征矩阵,所述第一数据持有方的设备中存储了所述特征矩阵中的部分数据,所述方法包括:/n基于本地的所述N个样本中的部分数据和所述模型参数中的部分数据,与其它数据持有方的设备联合执行基于秘密分享的矩阵加法和矩阵乘法 ...
【技术特征摘要】
1.一种基于多方安全计算检验线性回归模型的特征显著性的方法,所述方法由多个数据持有方中第一数据持有方的设备执行,所述多个数据持有方各自的设备中共同存储了N个样本和所述模型的模型参数,所述模型参数基于所述N个样本获取,其中,各个数据持有方设备中分别存储有与所述模型参数中第j个模型参数对应的第一数值,各个第一数值之和等于所述第j个模型参数,所述N个样本中包括的特征数据构成特征矩阵,所述第一数据持有方的设备中存储了所述特征矩阵中的部分数据,所述方法包括:
基于本地的所述N个样本中的部分数据和所述模型参数中的部分数据,与其它数据持有方的设备联合执行基于秘密分享的矩阵加法和矩阵乘法,获取所述N个样本的误差平方和,所述矩阵加法和矩阵乘法使得对所述第一数据持有方隐藏来自其它数据持有方的隐私数据;
基于本地的所述特征矩阵中的部分数据,与其它数据持有方设备联合执行基于秘密分享的矩阵加法和/或矩阵乘法,获取第一矩阵对角线上第j项的值,其中,所述第一矩阵为特征矩阵的转置与特征矩阵的乘积的逆矩阵;
基于本地的与所述第j个模型参数对应的第一数值、所述N个样本的误差平方和、以及所述第一矩阵对角线上第j项的值,计算与第j个t检验值对应的第二数值,其中,所述第j个t检验值为第j个模型参数的t检验值;
基于本地计算的与所述第j个t检验值对应的第二数值,与其它数据持有方的设备联合执行基于秘密分享的加法,获取所述第j个t检验值,以基于所述第j个t检验值确定所述线性回归模型的相应特征的显著性。
2.根据权利要求1所述的方法,其中,所述特征矩阵为N行K列的矩阵,其中,每行与所述N个样本中的一个样本相对应,每列与K个特征中的一个特征相对应,其中,所述第一数据持有方的设备中存储的所述特征矩阵中的部分数据为N行k列的子矩阵,其中,k<K。
3.根据权利要求2所述的方法,其中,所述特征矩阵包括横向拼接的多个子矩阵,每个子矩阵包括N行,所述多个子矩阵分别存储在相应的数据持有方设备中。
4.根据权利要求3所述的方法,其中,与其它数据持有方设备联合执行基于秘密分享的矩阵加法和/或矩阵乘法,获取第一矩阵对角线上第j项的值包括,与其它数据持有方设备联合执行基于秘密分享的矩阵乘法,获取第一矩阵对角线上第j项的值。
5.根据权利要求1所述的方法,所述特征矩阵为N行K列的矩阵,其中,每行与所述N个样本中的一个样本相对应,每列与K个特征中的一个特征相对应,其中,所述第一数据持有方的设备中存储的所述特征矩阵中的部分数据为n行K列的子矩阵,其中,n<N。
6.根据权利要求5所述的方法,其中,所述特征矩阵包括纵向拼接的多个子矩阵,每个子矩阵包括K列,所述多个子矩阵分别存储在相应的数据持有方设备中。
7.根据权利要求6所述的方法,其中,与其它数据持有方设备联合执行基于秘密分享的矩阵加法和/或矩阵乘法,获取第一矩阵对角线上第j项的值包括,与其它数据持有方设备联合执行基于秘密分享的矩阵加法,获取第一矩阵对角线上第j项的值。
8.根据权利要求1所述的方法,其中,与其它数据持有方的设备联合执行基于秘密分享的矩阵加法和矩阵乘法,获取所述N个样本的误差平方和包括,与其它数据持有方设备和服务方设备联合执行基于秘密分享的矩阵加法和矩阵乘法,获取所述N个样本的误差平方和。
9.根据权利要求1所述的方法,其中,与其它数据持有方设备联合执行基于秘密分享的矩阵加法和/或矩阵乘法,获取第一矩阵对角线上第j项的值包括,与其它数据持有方设备和服务方设备联合执行基于秘密分享的矩阵加法和/或矩阵乘法,获取第一矩阵对角线上第j项的值。
10.根据权利要求1所述的方法,其中,所述多个数据持有方为多个网络平台,所述N个样本与所述多个网络平台中的N个用户分别对应。
11.一种基于多方安全计算检验线性回归模型的特征显著性的装置,所述装...
【专利技术属性】
技术研发人员:刘颖婷,陈超超,王力,周俊,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。