基于联邦学习的特征提取方法和装置、电子设备、介质制造方法及图纸

技术编号：31907298 阅读：18 留言：0更新日期：2022-01-15 12:46

本实施例提供基于联邦学习的特征提取方法和装置、电子设备、介质，属于机器学习技术领域。该方法包括：与第二参与方相互发送己方的原始特征数据；根据特征数据集的特征维度从特征数据集提取出目标特征；根据目标特征和原始本地模型的模型参数计算出原始本地模型的预测值；对己方的预测值进行加密处理得到加密目标梯度，并与第二参与方相互发送己方的加密目标梯度；根据第二参与方发送的加密目标梯度计算目标损失；根据己方的目标损失计算共线性量化因子；根据己方计算的共线性量化因子将相应的目标特征确定为待分析的最终特征。本公开实施例可以针对性地提取特征，提高特征提取的准确性和效率，为后续的模型训练提升训练速度、提高模型的准确率。提高模型的准确率。提高模型的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
基于联邦学习的特征提取方法和装置、电子设备、介质

[0001]本专利技术涉及机器学习
，尤其涉及基于联邦学习的特征提取方法和装置、电子设备和介质。

技术介绍

[0002]联邦学习是一种带有隐私保护、安全加密技术的分布式机器学习框架，可以实现让分散的各参与方在满足不向其他参与者披露隐私数据的前提下，协作进行机器学习的模型训练。联邦学习主要应用于建模。在实际建模的应用场景中，由于特征量较多，特征质量参差不齐，从而导致模型训练速率较慢且效果不好。因此，如何提供一种提高多个特征提取的准确性，成为亟待解决的技术问题。

技术实现思路

[0003]本公开实施例的主要目的在于提出一种基于联邦学习的特征提取方法和装置、电子设备和介质，以提高多个特征提取的准确性。
[0004]为实现上述目的，本公开实施例的第一方面提出了一种基于联邦学习的特征提取方法，包括：
[0005]与第二参与方相互发送己方的原始特征数据；
[0006]根据特征数据集的特征维度从所述特征数据集提取出目标特征；其中，所述特征数据集包括己方的原始特征数据和第二参与方发送的原始特征数据；
[0007]根据所述目标特征和原始本地模型的模型参数计算出所述原始本地模型的预测值；
[0008]对己方的预测值进行加密处理得到加密目标梯度，并与所述第二参与方相互发送己方的加密目标梯度；
[0009]根据所述第二参与方发送的加密目标梯度计算目标损失；
[0010]根据己方的目标损失计算共线性量化因子；
>[0011]根据己方计算的共线性量化因子将相应的目标特征确定为待分析的最终特征。
[0012]在一些实施例，所述对己方的预测值进行加密处理得到加密目标梯度，并与所述第二参与方相互发送己方的加密目标梯度，包括：
[0013]对己方的预测值进行同态加密处理，得到加密梯度；
[0014]与所述第二参与方相互发送己方的加密梯度；
[0015]根据己方的预测值和所述第二参与方发送的加密梯度，计算目标梯度；
[0016]与所述第二参与方相互发送己方的目标梯度；
[0017]根据所述第二参与方发送的目标梯度和己方的目标特征计算出所述加密目标梯度；
[0018]与所述第二参与方相互发送己方的加密目标梯度。
[0019]在一些实施例，所述对己方的预测值进行加密处理得到加密目标梯度，并与所述
第二参与方相互发送己方的加密目标梯度，还包括：
[0020]获取所述第二参与方发送的公钥；
[0021]根据所述第二参与方发送的公钥对己方的预测值进行同态加密处理得到加密掩码；
[0022]将己方的加密掩码添加到己方的加密目标梯度中，得到加密掩码梯度，并将己方的加密掩码梯度作为己方的加密目标梯度。
[0023]在一些实施例，所述根据所述第二参与方发送的加密目标梯度计算目标损失，包括：
[0024]根据己方的私钥对己方的加密目标梯度进行解密，得到目标梯度，并与所述第二参与方相互发送解密得到的目标梯度；
[0025]根据己方解密得到的目标梯度计算出第一损失，并与所述第二参与方相互发送第一损失；
[0026]根据己方计算出的第一损失与所述第二参与方发送的第一损失计算出目标损失。
[0027]在一些实施例，所述根据己方计算出的第一损失与所述第二参与方发送的第一损失计算出目标损失，包括：
[0028]对己方计算出的第一损失进行加密，得到第一加密损失，并与所述第二参与方相互发送所述第一加密损失；
[0029]根据第二参与方发送的加密梯度，得到第二损失；其中，己方的加密梯度由己方的预测值进行同态加密处理得到，所述第二损失不包括正则项；
[0030]根据己方的第一损失、第二参与方发送的第一损失、己方的第二损失，计算出目标加密损失；
[0031]根据己方的私钥对己方计算的目标加密损失进行解密，得到第三损失；
[0032]根据根据己方的正则项、己方得到的第三损失，计算出目标损失。
[0033]在一些实施例，所述根据所述目标损失计算共线性量化因子，包括：
[0034]获取所述第二参与方发送的预测值；
[0035]若根据己方计算的目标损失确定己方的原始本地模型拟合，则根据己方的预测值和第二参与方发送的预测值计算拟合值；
[0036]根据己方计算的拟合值和己方的真实值计算残差平方和，并根据己方的真实值、己方的真实值的平均值计算总离差平方和；
[0037]计算己方的总离差平方和和己方的残差平方和之间的比值，将己方计算的比值作为己方的共线性量化因子。
[0038]在一些实施例，所述根据所述共线性量化因子将相应的目标特征确定为待分析的最终特征，包括：
[0039]比较己方计算的共线性量化因子与预设值之间的大小关系；
[0040]根据己方计算的共线性量化因子与预设值之间的大小关系将相应的目标特征确定为待分析的最终特征。
[0041]为实现上述目的，本公开的第二方面提出了一种基于联邦学习的特征提取装置，包括：
[0042]原始特征数据发送模块，用于与第二参与方相互发送己方的原始特征数据；
[0043]目标特征提取模块，用于根据特征数据集的特征维度从所述特征数据集提取出目标特征；其中，所述特征数据集包括己方的原始特征数据和第二参与方发送的原始特征数据；
[0044]预测值计算模块，用于根据所述目标特征和原始本地模型的模型参数计算出所述原始本地模型的预测值；
[0045]加密处理模块，用于对所述预测值进行加密处理得到加密目标梯度，并与所述第二参与方相互发送己方的加密目标梯度；
[0046]损失计算模块，用于根据所述第二参与方发送的加密目标梯度计算目标损失；
[0047]共线性量化因子计算模块，用于根据己方的目标损失计算共线性量化因子；
[0048]特征确定模块，用于根据己方计算的共线性量化因子将相应的目标特征确定为待分析的最终特征。
[0049]为实现上述目的，本公开的第三方面提出了一种电子设备，包括：
[0050]至少一个存储器；
[0051]至少一个处理器；
[0052]至少一个程序；
[0053]所述程序被存储在存储器中，处理器执行所述至少一个程序以实现本公开如上述第一方面所述的方法。
[0054]为实现上述目的，本公开的第四方面提出了一种存储介质，该存储介质是计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行：
[0055]如上述第一方面所述的方法。
[0056]本公开实施例提出的基于联邦学习的特征提取方法和装置、电子设备、介质，通过与第二参与方相互发送己方的原始特征数据；根据特征数据集的特征维度从特征数据集提取出目标特征；其中，特征数据集包括己方的原始特征数据和第二参与方发送的原始特征数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习的特征提取方法，应用于第一参与方，其特征在于，包括：与第二参与方相互发送己方的原始特征数据；根据特征数据集的特征维度从所述特征数据集提取出目标特征；其中，所述特征数据集包括己方的原始特征数据和第二参与方发送的原始特征数据；根据所述目标特征和原始本地模型的模型参数计算出所述原始本地模型的预测值；对己方的预测值进行加密处理得到加密目标梯度，并与所述第二参与方相互发送己方的加密目标梯度；根据所述第二参与方发送的加密目标梯度计算目标损失；根据己方的目标损失计算共线性量化因子；根据己方计算的共线性量化因子将相应的目标特征确定为待分析的最终特征。2.根据权利要求1所述的方法，其特征在于，所述对己方的预测值进行加密处理得到加密目标梯度，并与所述第二参与方相互发送己方的加密目标梯度，包括：对己方的预测值进行同态加密处理，得到加密梯度；与所述第二参与方相互发送己方的加密梯度；根据己方的预测值和所述第二参与方发送的加密梯度，计算目标梯度；与所述第二参与方相互发送己方的目标梯度；根据所述第二参与方发送的目标梯度和己方的目标特征计算出所述加密目标梯度；与所述第二参与方相互发送己方的加密目标梯度。3.根据权利要求2所述的方法，其特征在于，所述对所述预测值进行加密处理得到加密目标梯度，并与所述第二参与方相互发送己方的加密目标梯度，还包括：获取所述第二参与方发送的公钥；根据所述第二参与方发送的公钥对己方的预测值进行同态加密处理得到加密掩码；将己方的加密掩码添加到己方的加密目标梯度中，得到加密掩码梯度，并将己方的加密掩码梯度作为己方的加密目标梯度。4.根据权利要求1至3任一项所述的方法，其特征在于，所述根据所述第二参与方发送的加密目标梯度计算目标损失，包括：根据己方的私钥对己方的加密目标梯度进行解密，得到目标梯度，并与所述第二参与方相互发送解密得到的目标梯度；根据己方解密得到的目标梯度计算出第一损失，并与所述第二参与方相互发送第一损失；根据己方计算出的第一损失与所述第二参与方发送的第一损失计算出目标损失。5.根据权利要求4所述的方法，其特征在于，所述根据己方计算出的第一损失与所述第二参与方发送的第一损失计算出目标损失，包括：对己方计算出的第一损失进行加密，得到第一加密损失，并与所述第二参与方相互发送所述第一加密损失；根据第二参与方发送的加密梯度，得到第二损失；其中，己方的加密梯度由己方的预测值进行同态加...

【专利技术属性】
技术研发人员：黄晨宇，王健宗，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人