数据处理方法、模型训练方法、装置、系统和电子设备制造方法及图纸

技术编号：40746634 阅读：2 留言：0更新日期：2024-03-25 20:04

本申请提供一种数据处理方法、模型训练方法、装置、系统和电子设备，该方法的一具体实施方式包括：从第一参与方中获取待处理用户对应的设备加密信息以及第一部分用户加密数据；从至少一个第二参与方中获取所述设备加密信息所对应的第二部分用户加密数据；通过全局模型处理所述第一部分用户加密数据以及所述第二部分用户加密数据，得到所述待处理用户的数据处理结果。该方法可以降低数据泄露的风险。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据处理领域，具体而言，涉及一种数据处理方法、模型训练方法、装置、系统和电子设备。

技术介绍

1、联邦学习是一种在多个参与方不进行数据交互的情况下通过安全机制交互模型参数，从而达到协同训练效果的分布式机器学习方法。

2、在相关技术中可以通过联邦学习协调训练多个参与方的模型，然后可以基于各个模型的模型参数构建一个全局模型，从而可以利用该全局模型处理各个参与方的数据。但是在联邦学习过程中仍然会交互少量的数据(例如模型参数)。因此，在联邦学习过程中仍然存在数据泄露的风险。

技术实现思路

1、本申请实施例的目的在于提供一种数据处理方法、模型训练方法、装置、系统和电子设备，用以降低数据泄露的风险。

2、第一方面，本申请实施例提供了一种数据处理方法，该方法包括：所述方法由服务器在隐私计算环境下执行，该方法包括：从第一参与方中获取待处理用户对应的设备加密信息以及第一部分用户加密数据；从至少一个第二参与方中获取所述设备加密信息所对应的第二部分用户加密数据；通过全局模型处理所述第一部分用户加密数据以及所述第二部分用户加密数据，得到所述待处理用户的数据处理结果。

3、这样，由于数据处理过程均是在隐私计算环境下进行的，且各个数据均是在加密之后才会发送至服务器，因此可以在各个参与方之间的用户数据、设备数据和模型参数等均不会泄露的基础上得到待处理用户的数据处理结果，从而降低了数据泄露的风险。

4、可选地，所述全局模型用于根据待处理用户的加密数据确定用

5、可选地，所述隐私计算环境包括以下任一环境：可信执行环境、安全多方计算环境、同态加密环境。这样，第一参与方、至少一个第二参与方以及服务器三者可以在上述任一隐私计算环境下进行数据交互，以使三者能够在保护数据本身不对外泄露的前提下实现数据的分析计算。

6、第二方面，本申请实施例提供了一种模型训练方法，所述方法在隐私计算环境下执行，该方法包括：从第一参与方中获取样本用户所使用的样本设备加密信息，以及从至少一个第二参与方中获取全量用户加密数据；所述全量用户加密数据包括所述第二参与方中的全部设备加密信息以及全部用户加密数据；向所述第一参与方发送所述样本设备加密信息与所述全部设备加密信息的交集设备信息，以指示所述第一参与方根据所述交集设备信息对应的样本用户加密数据在自身的联邦学习模块中训练第一模型，得到所述第一模型加密后的第一初始模型参数；向所述至少一个第二参与方发送所述样本设备加密信息与所述全部设备加密信息的交集设备信息，以指示所述至少一个第二参与方根据所述交集设备信息对应的用户加密数据在自身的联邦学习模块中训练第二模型，得到所述第二模型加密后的第二初始模型参数；根据所述第一初始模型参数以及所述第二初始模型参数，聚合得到初始全局模型；若所述初始全局模型不满足预设收敛要求，则再次从所述第一参与方中获取样本用户所使用的样本设备加密信息以及从所述至少一个第二参与方中获取全量用户加密数据，以重新聚合所述初始全局模型；若所述初始全局模型满足预设收敛要求，则将所述初始全局模型确定为全局模型，所述全局模型用于根据用户的加密数据确定用户的数据处理结果。

7、这样，全局模型的训练过程是在基于隐私计算环境搭建的联邦学习平台中进行的，且用于交互的初始模型参数均为加密后的数据，因此可以在不泄露各个参与方之间的模型参数的基础上训练得到全局模型，从而降低了数据泄露的风险。

8、可选地，在所述根据所述第一初始模型参数以及所述第二初始模型参数，聚合得到初始全局模型之后，所述方法还包括：加密所述初始全局模型的模型参数；指示所述第一参与方对所述初始全局模型加密后的模型参数进行解密处理，并根据所述初始全局模型解密后的模型参数，在所述联邦学习模块中更新所述第一初始模型参数；指示所述至少一个第二参与方对所述初始全局模型加密后的模型参数进行解密处理，并根据所述初始全局模型解密后的模型参数，在所述联邦学习模块中更新所述第二初始模型参数。这样，各个参与方可以在联邦学习模块中更新模型参数，降低了在更新阶段的数据泄露风险。

9、可选地，所述若所述初始全局模型满足预设收敛要求，则将所述初始全局模型确定为全局模型，包括：统计所述初始全局模型在当前时刻所历经的迭代次数；计算所述初始全局模型在历次迭代时分别对应的损失函数值；根据所述在历次迭代时分别对应的损失函数值以及所述迭代次数，计算损失平均值；若所述损失平均值小于预设损失阈值，则将所述初始全局模型确定为所述全局模型。这样，由于损失平均值整合了初始全局模型在多次迭代过程中的损失数据，因此更能够从初始全局模型的整体性上判定其是否收敛，在一定程度上提高了全局模型的准确性以及稳定性。

10、可选地，所述全局模型用于根据用户的加密数据确定用户质量评分，所述数据处理结果为用户的质量评分；以及在所述若所述初始全局模型满足预设收敛要求，则将所述初始全局模型确定为全局模型之后，所述方法还包括：从所述第一参与方中获取待测试用户所使用的测试设备加密信息以及第一测试用户加密数据；从所述至少一个第二参与方中获取所述测试设备加密信息所对应的第二测试用户加密数据；通过所述全局模型处理所述第一测试用户加密数据以及所述第二测试用户加密数据，得到测试质量评分；计算所述测试质量评分对应的评价指标值，并在所述评价指标值大于预设指标阈值的情况下，允许在自身的联邦学习模块中使用所述全局模型。这样，可以通过测试集测试已经收敛的全局模型是否能够投入使用，从而增加质量评分的准确性。

11、第三方面，本申请实施例提供了一种数据处理方法，所述方法由第一参与方在隐私计算环境下执行，该方法包括：向服务器发送请求指令；所述请求指令用于请求返回待处理用户的数据处理结果；所述请求指令中包括所述待处理用户对应的设备加密信息以及第一部分用户加密数据；接收所述数据处理结果；其中，所述服务器从至少一个第二参与方中获取所述设备加密信息所对应的第二部分用户加密数据；并通过全局模型处理所述第一部分用户加密数据以及所述第二部分用户加密数据，得到所述待处理用户的数据处理结果。这样，降低了数据泄露的风险。

12、第四方面，本申请实施例提供了一种数据处理装置，应用于服务器，且所述装置在隐私计算环境下工作，所述装置包括：第一获取模块，用于从第一参与方中获取待处理用户对应的设备加密信息以及第一部分用户加密数据；第二获取模块，用于从至少一个第二参与方中获取所述设备加密信息所对应的第本文档来自技高网...

【技术保护点】

1.一种数据处理方法，其特征在于，所述方法由服务器在隐私计算环境下执行，该方法包括：

2.根据权利要求1所述的方法，其特征在于，所述全局模型用于根据待处理用户的加密数据确定用户质量评分，所述数据处理结果为所述待处理用户的质量评分；以及

3.根据权利要求1或2所述的方法，其特征在于，所述隐私计算环境包括以下任一环境：可信执行环境、安全多方计算环境、同态加密环境。

4.一种模型训练方法，其特征在于，所述方法在隐私计算环境下执行，该方法包括：

5.根据权利要求4所述的方法，其特征在于，在所述根据所述第一初始模型参数以及所述第二初始模型参数，聚合得到初始全局模型之后，所述方法还包括：

6.根据权利要求4或5所述的方法，其特征在于，所述若所述初始全局模型满足预设收敛要求，则将所述初始全局模型确定为全局模型，包括：

7.根据权利要求4所述的方法，其特征在于，所述全局模型用于根据用户的加密数据确定用户质量评分，所述数据处理结果为用户的质量评分；以及

8.一种数据处理方法，其特征在于，所述方法由第一参与方在隐私计算环境下执行，该方法包括：

9.一种数据处理装置，其特征在于，应用于服务器，且所述装置在隐私计算环境下工作，所述装置包括：

10.一种数据处理装置，其特征在于，应用于第一参与方，且所述装置在隐私计算环境下工作，所述装置包括：

11.一种数据处理系统，其特征在于，所述系统在隐私计算环境下工作，该系统包括：

12.一种电子设备，其特征在于，包括处理器以及存储器，所述存储器存储有计算机可读取指令，当所述计算机可读取指令由所述处理器执行时，运行如权利要求1-8中任一所述的方法。

13.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时运行如权利要求1-8中任一所述的方法。

...

【技术特征摘要】

1.一种数据处理方法，其特征在于，所述方法由服务器在隐私计算环境下执行，该方法包括：

3.根据权利要求1或2所述的方法，其特征在于，所述隐私计算环境包括以下任一环境：可信执行环境、安全多方计算环境、同态加密环境。

4.一种模型训练方法，其特征在于，所述方法在隐私计算环境下执行，该方法包括：

6.根据权利要求4或5所述的方法，其特征在于，所述若所述初始全局模型满足预设收敛要求，则将所述初始全局模型确定为全局模型，包括：

7.根据权利要求4所述的方法，其特征在于，所...

【专利技术属性】
技术研发人员：王新军，季爱军，丁玉成，朱斌杰，郭永康，齐一鸣，李震，
申请(专利权)人：上海识装信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人