一种数据处理方法、装置、设备、系统和存储介质制造方法及图纸

技术编号：37711233 阅读：11 留言：0更新日期：2023-06-02 00:03

本申请公开了一种数据处理方法、装置、设备、系统和存储介质。由联邦学习系统中的第一节点执行，所述方法包括：获取第二节点发送的第二加密数据；第二加密数据由第二节点根据第二节点的第二样本数据确定；根据第一节点的第一加密数据和第二加密数据，确定待训练模型在第一节点中的第一收敛矩阵；其中，第一加密数据根据第一节点的第一样本数据确定；根据待训练模型在第一节点的第一预设梯度值和第一收敛矩阵，确定第一节点在当前收敛中的第一权重。本申请实施例的技术方案，简化了计算步骤和数据交互量，还能够在保证模型训练的性能不变的前提下，大幅提高训练的效率。大幅提高训练的效率。大幅提高训练的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法、装置、设备、系统和存储介质

[0001]本申请涉及机器学习
，尤其涉及一种数据处理方法、装置、设备、系统和存储介质。

技术介绍

[0002]在互联网和人工智能大力发展的今天，越来越多的需求可以通过机器学习、深度学习等方式解决。例如常见的回归问题，通过机器学习进行数据处理，以使模型具备快速收敛解决回归目标的性能。但是，一般的数据处理过程将所有数据汇总在同一服务器或同一节点内完成，要求所有数据公开，这在实际业务场景是很高的要求。
[0003]因此，相关人士采用联邦的机器学习架构，通过不同的节点各自持有的部分数据共同地进行模型的训练。在这之中，节点与节点之间要保证交互内容的秘密性，因此保证了数据的安全，降低了模型对数据的要求。而为了保证交互内容的私密性，需要通过加密解密的方法对交互内容进行传输。但是在数据处理的迭代过程中，大量的交互、加密和解密过程会导致数据处理的计算量大、效率比较低。

技术实现思路

[0004]本申请提供了一种数据处理方法、装置、设备、系统和存储介质，以降低数据处理的计算量，并提高数据处理的效率。
[0005]根据本申请的第一方面，提供了一种数据处理方法，由联邦学习系统中的第一节点执行，所述方法包括：
[0006]获取第二节点发送的第二加密数据；第二加密数据由第二节点根据第二节点的第二样本数据确定；
[0007]根据第一节点的第一加密数据和第二加密数据，确定待训练模型在第一节点中的第一收敛矩阵；其中，第一加密数据根据第一节点的第一样本...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，由联邦学习系统中的第一节点在待训练模型的当前迭代周期中执行，所述方法包括：获取第二节点发送的第二加密数据；所述第二加密数据由所述第二节点根据所述第二节点的第二样本数据确定；根据所述第一节点的第一加密数据和所述第二加密数据，确定待训练模型在所述第一节点中的第一收敛矩阵；其中，所述第一加密数据根据所述第一节点的第一样本数据确定；根据所述待训练模型在所述第一节点的第一预设梯度值和所述第一收敛矩阵，确定所述第一节点在当前收敛中的第一权重。2.根据权利要求1所述的方法，其特征在于，所述根据待训练模型在所述第一节点的第一预设梯度值和所述第一收敛矩阵，确定所述第一节点在当前收敛中的第一权重，包括：根据所述第一预设梯度值和所述第一收敛矩阵，确定所述第一加密数据在所述第一节点中的第一非交互梯度值；根据所述第一非交互梯度值和所述第一预设梯度值，确定所述第一权重。3.根据权利要求2所述的方法，其特征在于，所述根据所述第一非交互梯度值和所述第一预设梯度值，确定所述第一权重，包括：根据所述第一样本数据和所述第一加密数据，确定所述第一节点的固有梯度值；根据所述第一非交互梯度值、第一预设梯度值和所述固有梯度值的和，确定所述第一权重。4.根据权利要求1所述的方法，其特征在于，在所述获取第二节点的第二加密数据之前，所述方法还包括：根据所述第一节点的第一样本数据和第一初始化权重，确定第一交互数据；根据所述第一交互数据，确定所述第一节点的第一加密数据；将所述第一加密数据和通过预设的秘密分享算法加密后的第一交互数据发送至第二节点；以使所述第二节点根据所述第二节点的第二样本数据、所述第一加密数据和所述第一交互数据，确定所述第二节点的第二加密数据。5.根据权利要求1
‑
4任一项所述的方法，其特征在于，所述方法还包括：所述第一加密数据和所述第一预设梯度值，通过获取所述第二节点在所述待训练模型的预设迭代周期内根据预设的秘密分享算法的计算结果而更新。6.一种数据处理方法，其特征在于，由联邦学习系统中的第二节点在待训练模型的当前迭代周期中执行，所述方法包括：根据所述第二节点的第二样本数据，确定所述第二节点的第二加密数据；向第一节点发送所述第二加密数据，以使所述第一节点根据所述第一节点的第一加密数据和所述第二加密数据，确定待训练模型在所述第一节点中的第一收敛矩阵；其中，所述第一加密数据根据所述第一节点的第一样本数据确定；并使所述第一节点根据所述待训练模型在所述第一节点的第一预设梯度值和所述第一收敛矩阵，确定所述第一节点在当前收敛中的第一权重。7.根据权利要求6所述的方法，其特征在于，所述根据所述第二节点的第二样本数据，确定所述第二节点的第二加密数据，包括：获取第一节点发送的第一加密数据和通过预设的秘密分享算法加密后的第一交互数
据；其中，所述第一加密数据根据所述第一节点的第一样本数据确定；根据所述第二节点的第二样本数据、所述第一加密数据和所述第一交互数据，确定所述第二节点的第二加密数据。8.根据权利要求6所述的方法，其特征在于，在所述确定所述第二节点的第二加密数据之后，所述方法还包括：根据所述第二加密数据，确定所述第二节点的第二收敛...

【专利技术属性】
技术研发人员：赵骁飞，兰春嘉，
申请(专利权)人：上海零数众合信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人