【技术实现步骤摘要】
数据降维方法、终端设备及存储介质
[0001]本申请属于数据处理领域,尤其涉及数据降维方法、终端设备及存储介质。
技术介绍
[0002]通过将数据从高维降到低维,可以去除数据中的冗杂的和因变量的特征,便于进行数据分析和统计。但是在对多方数据进行降维时,需要联合多方数据进行数据分析,会出现数据泄露的风险。
技术实现思路
[0003]有鉴于此,本申请实施例提供了一种数据降维方法、终端设备及存储介质,可以联合多方数据,在保证数据安全的情况下,实现对多方数据的降维。
[0004]本申请实施例的第一方面提供了一种数据降维方法,执行于协调方,所述方法包括:
[0005]获取发起方发送的加密后的第一协方差矩阵以及第一均值数据,获取参与方发送的加密后的第二协方差矩阵以及第二均值数据,所述第一均值数据是对所述发起方的第一数据集中各类数据的第一均值向量和进行预处理以及加密后得到,所述第二均值数据是对所述参与方的第二数据集中各类数据的第二均值向量和进行预处理以及加密后得到;
[0006]根据所述加密后的第一 ...
【技术保护点】
【技术特征摘要】
1.一种数据降维方法,执行于协调方,其特征在于,所述方法包括:获取发起方发送的加密后的第一协方差矩阵以及第一均值数据,获取参与方发送的加密后的第二协方差矩阵以及第二均值数据,所述第一均值数据是对所述发起方的第一数据集中各类数据的第一均值向量和进行预处理以及加密后得到,所述第二均值数据是对所述参与方的第二数据集中各类数据的第二均值向量和进行预处理以及加密后得到;根据所述加密后的第一协方差矩阵以及所述加密后的第二协方差矩阵确定类内散度矩阵;根据所述第一均值数据和所述第二均值数据确定类间散度矩阵;根据所述类内散度矩阵和所述类间散度矩阵确定投影矩阵;将所述投影矩阵发送给所述发起方和所述参与方,以指示所述发起方根据所述投影矩阵对所述第一数据集进行数据降维,以及指示所述参与方根据所述投影矩阵对所述第二数据集进行数据降维。2.根据权利要求1所述的数据降维方法,其特征在于,所述第一数据集中的数据的维度与所述第二数据集中的数据的维度相同,所述第一均值数据是对所述第一均值向量和以及所述第一数据集的各类数据的数量进行加密得到,所述第二均值数据是对所述第二均值向量和以及所述第二数据集的各类数据的数量进行加密得到。3.根据权利要求2所述的数据降维方法,其特征在于,在获取发起方发送的加密后的第一协方差矩阵,获取参与方发送的加密后的第二协方差矩阵之前,所述方法还包括:根据所述第一均值数据和所述第二均值数据确定第三均值向量,所述第三均值向量是所述第一数据集和所述第二数据集中各类数据的均值向量;将所述第三均值向量发送给所述发起方和所述参与方,以指示所述发起方根据所述第三均值向量确定所述加密后的第一协方差矩阵,以及指示所述参与方根据所述第三均值向量确定所述加密后的第二协方差矩阵。4.根据权利要求2所述的数据降维方法,其特征在于,所述根据所述加密后的第一协方差矩阵以及所述加密后的第二协方差矩阵确定类内散度矩阵,包括:对所述加密后的第一协方差矩阵以及所述加密后的第二协方差矩阵进行求和,得到类内散度矩阵。5.根据权利要求2所述的数据降维方法,其特征在于,所述根据所述第一均值数据和所述第二均值数据确定类间散度矩阵,包括:根据所述第一均值数据和所述第二均值数据确定第三均值向量,所述第三均值向量是所述第一数据集和所述第二数据集中各类样本的均值向量;若数据类别为2,根据2类数据对应的所述第三均值向量的差值确定类间散度矩阵;若数据类别大于2,根据所述第一...
【专利技术属性】
技术研发人员:汪小益,邱炜伟,严杨,姚文豪,杜静漪,
申请(专利权)人:杭州趣链科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。