基于隐私保护的模型训练方法及装置制造方法及图纸

技术编号：39282124 阅读：8 留言：0更新日期：2023-11-07 10:55

本说明书实施例提供了基于隐私保护的模型训练方法及装置。该方法可由多个第一节点执行，包括：获取多个第二节点分别提供的中间结果，其由第二节点基于本地的多个样本的特征数据对目标模型对应的本地模型执行前向传播训练得到；基于该多个样本的标签数据确定各个中间结果分别对应的用于表征可靠性的分数，从各个中间结果中选取分数达到阈值的多个第一中间结果；基于多个第一中间结果的聚合结果和标签数据确定目标模型的第一预测损失值；响应于第一预测损失值不满足模型收敛条件，基于第一预测损失值和各第二节点中提供多个第一中间结果的多个第三节点的本地模型当前的第一模型参数，确定多个第三节点分别对应的梯度值；向多个第三节点发送梯度值。向多个第三节点发送梯度值。向多个第三节点发送梯度值。

全部详细技术资料下载

【技术实现步骤摘要】
基于隐私保护的模型训练方法及装置

[0001]本说明书实施例属于计算机
，尤其涉及基于隐私保护的模型训练方法及装置。

技术介绍

[0002]随着信息技术的快速发展，多数企业拥有大量用户的用户数据。若企业间共享用户数据，则能够更完善地支持企业评估用户状态与需求，从而为用户提供更加个性化的服务。然而，由于一些企业担心数据安全和隐私泄露问题，故而导致各企业拥有的用户数据不能直接公开或共享。

技术实现思路

[0003]本专利技术的目的在于提供一种基于隐私保护的模型训练方案，能使得具有相同样本空间、不同特征空间的多个参与方参与执行同一模型训练任务，并尽可能的保证数据安全和防止隐私泄露，以及确保训练的目标模型的可靠性。
[0004]本说明书第一方面提供一种基于隐私保护的模型训练方法，由多个第一节点执行，所述多个第一节点存储有对应于目标模型的多个样本的标签数据，所述方法包括：获取多个第二节点分别提供的中间结果，所述中间结果由所述第二节点基于本地存储的所述多个样本的特征数据对所述目标模型对应的本地模型执行前向传播训练得到，所述多个第二节点存储有所述多个样本的不同维度的特征数据；基于所述标签数据确定各个中间结果分别对应的用于表征可靠性的分数，并从所述各个中间结果中选取出分数达到阈值的多个第一中间结果；基于对所述多个第一中间结果的聚合结果和所述标签数据，确定所述目标模型的第一预测损失值；响应于所述第一预测损失值不满足模型收敛条件，基于所述第一预测损失值和所述多个第二节点中提供所述多个第一中间结果的多个第三节...

【技术保护点】

【技术特征摘要】
1.一种基于隐私保护的模型训练方法，由多个第一节点执行，所述多个第一节点存储有对应于目标模型的多个样本的标签数据，所述方法包括：获取多个第二节点分别提供的中间结果，所述中间结果由所述第二节点基于本地存储的所述多个样本的特征数据对所述目标模型对应的本地模型执行前向传播训练得到，所述多个第二节点存储有所述多个样本的不同维度的特征数据；基于所述标签数据确定各个中间结果分别对应的用于表征可靠性的分数，并从所述各个中间结果中选取出分数达到阈值的多个第一中间结果；基于对所述多个第一中间结果的聚合结果和所述标签数据，确定所述目标模型的第一预测损失值；响应于所述第一预测损失值不满足模型收敛条件，基于所述第一预测损失值和所述多个第二节点中提供所述多个第一中间结果的多个第三节点各自的本地模型当前的第一模型参数，确定所述多个第三节点分别对应的梯度值；向所述多个第三节点分别发送其对应的梯度值。2.根据权利要求1所述的方法，其中，所述基于所述标签数据确定各个中间结果分别对应的用于表征可靠性的分数，并从所述各个中间结果中选取出分数达到阈值的多个第一中间结果，包括：所述多个第一节点中的一个目标节点在所述多个第一节点中确定用于对每个所述中间结果进行评分的第一节点，并将确定结果发送给所述多个第一节点中的其他节点；所述多个第一节点基于对所述各个中间结果的聚合结果和所述标签数据确定第二预测损失值，基于对所述各个中间结果中除自己负责评分的第二中间结果以外的中间结果的聚合结果和所述标签数据确定第三预测损失值，并将所述第三预测损失值和所述第二预测损失值的差值确定为所述第二中间结果对应的分数；所述目标节点接收所述其他节点发送的其他中间结果对应的分数；所述目标节点从所述各个中间结果中选取出分数达到阈值的多个第一中间结果。3.根据权利要求1所述的方法，其中，在向所述多个第三节点分别发送其对应的梯度值之后，还包括：获取所述多个第三节点提供的本地模型更新的第二模型参数，所述第二模型参数由所述第三节点在基于获得的梯度值更新本地模型的参数后得到；基于各个所述第二模型参数，确定所述目标模型的模型性能；响应于所述模型性能满足所述模型收敛条件，确定各个所述第二模型参数为所述目标模型的更新的参数。4.根据权利要求3所述的方法，其中，所述多个第一节点和所述多个第二节点包含在区块链系统中；以及在确定各个所述第二模型参数为所述目标模型的更新的参数之后，还包括：在所述区块链系统中存储各个所述第二模型参数。5.根据权利要求3所述的方法，还包括：响应于所述模型性能不满足所述模型收敛条件，向所述多个第三节点发送用于指示对本地模型进行下一轮模型训练的反馈信息。6.根据权利要求1所述的方法，其中，初始的所述目标模型为模型使用方的设备提供的
初始模型；以及在获取多个第二节点分别提供的中间结果之前，还包括：获取所述模型使用方的设备提供的所述标签数据；获取所述初始模型作为所述目标模型；将所述初始模型发送给所述多个第二节点，以使得所述多个第二节点将所述初始模型作为本地模型进行模型训练。7.根据权利要求6...

【专利技术属性】
技术研发人员：盖珂珂，王烁，魏长征，吴行行，丁慧，徐蕾，
申请(专利权)人：蚂蚁区块链科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人