数据处理方法、电子设备以及存储介质技术

技术编号:37392084 阅读:12 留言:0更新日期:2023-04-27 07:29
本申请实施例公开了一种数据处理方法、电子设备以及存储介质。所述方法包括:多个第一客户端分别使用各自的本地数据对图神经网络模型进行训练,并在训练结束后分别将训练得到的模型参数发送给服务器;接收服务器发送的全局图神经网络模型的模型参数,全局图神经网络模型为服务器基于收集的多个第二客户端数据对图神经网络模型进行训练得到;将多个第一客户端分别训练得到的模型参数和全局图神经网络模型的模型参数进行聚合,得到第一聚合参数;基于第一聚合参数对上一轮训练后的图神经网络模型进行下一轮次训练。本方法实现了在保护用户数据隐私的前提下,提高端侧模型和云端模型的推荐效果。模型的推荐效果。模型的推荐效果。

【技术实现步骤摘要】
数据处理方法、电子设备以及存储介质


[0001]本申请涉及人工智能
,更具体地,涉及一种数据处理方法、电子设备以及存储介质。

技术介绍

[0002]联邦推荐系统由一个中央服务器和大量用户终端组成,每个用户终端在其本地利用其拥有的数据训练本地推荐模型。每个用户终端将自己训练的模型参数发送给中央服务器,并在该中央服务器上通过聚合的方法构建一个全局推荐模型,随后将聚合后的全局推荐模型参数发送到下一轮需要训练的用户终端上,并进行下一轮模型训练。联邦学习能够保证用户原始数据始终留在用户本地。然而,在实际应用中,对于一些没有关闭个性化推荐功能的用户,服务器仍能收集到该部分用户的原始数据,一定程度上泄露了用户的隐私。并且,现有的联邦融合方案,均是全模型参数的融合,由于各个参与方的数据分布不同,全量模型融合效果仍有待改善。

技术实现思路

[0003]鉴于上述问题,本申请提出了一种数据处理方法、电子设备以及存储介质,以改善上述问题。
[0004]第一方面,本申请实施例提供了一种数据处理方法,应用于第一客户端,所述第一客户端的数量为多个,所述方法包括:所述多个第一客户端分别使用各自的本地数据对图神经网络模型进行训练,并在训练结束后分别将训练得到的模型参数发送给所述服务器,所述多个第一客户端均未开启个性化推荐功能,所述模型参数表征不涉及用户隐私的部分模型参数;接收所述服务器发送的全局图神经网络模型的模型参数,所述全局图神经网络模型为所述服务器基于收集的多个第二客户端数据对所述图神经网络模型进行训练得到;将所述多个第一客户端分别训练得到的模型参数和所述全局图神经网络模型的模型参数进行聚合,得到第一聚合参数;基于所述第一聚合参数对上一轮训练后的所述图神经网络模型进行下一轮次训练。
[0005]第二方面,本申请实施例提供了一种数据处理方法,应用于服务器,所述方法包括:所述服务器基于收集的多个第二客户端数据对图神经网络模型进行训练,得到全局图神经网络模型,并将所述全局图神经网络模型的模型参数分别发送给多个第一客户端;接收所述多个第一客户端分别发送的训练得到的模型参数,所述训练得到的模型参数为所述多个第一客户端分别使用各自的本地数据对所述图神经网络模型进行训练得到,所述多个第一客户端均未开启个性化推荐功能,所述模型参数表征不涉及用户隐私的部分模型参数;将所述全局图神经网络模型的模型参数与接收到的所述多个第一客户端分别训练得到的模型参数进行聚合,得到第二聚合参数;基于所述第二聚合参数对上一轮训练后得到的所述全局图神经网络模型进行下一轮次训练。
[0006]第三方面,本申请实施例提供了一种数据处理方法,应用于端云推荐系统,所述端
云推荐系统包括多个第一客户端以及服务器,所述方法包括:所述多个第一客户端分别使用各自的本地数据对图神经网络模型进行训练,并在训练结束后分别将训练得到的模型参数发送给所述服务器,所述多个第一客户端均未开启个性化推荐功能,所述模型参数表征不涉及用户隐私的部分模型参数;所述服务器基于收集的多个第二客户端数据对所述图神经网络模型进行训练,得到全局图神经网络模型,并将所述全局图神经网络模型的模型参数分别发送给所述多个第一客户端;所述多个第一客户端中的每个第一客户端将所述多个第一客户端分别训练得到的模型参数和所述全局图神经网络模型的模型参数进行聚合,得到第一聚合参数,并基于所述第一聚合参数对上一轮训练后的所述图神经网络模型进行下一轮次训练;所述服务器将所述全局图神经网络模型的模型参数与接收到的所述多个第一客户端分别训练得到的模型参数进行聚合,得到第二聚合参数,并基于所述第二聚合参数对上一轮训练后得到的所述全局图神经网络模型进行下一轮次训练。
[0007]第四方面,本申请提供了一种电子设备,包括一个或多个处理器以及存储器;一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述第一方面或第二方面所述的方法。
[0008]第五方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码运行时执行上述第一方面或第二方面所述的方法。
[0009]本申请提供的一种数据处理方法、电子设备以及存储介质,通过所述多个第一客户端分别使用各自的本地数据对图神经网络模型进行训练,并在训练结束后分别将训练得到的模型参数发送给所述服务器,所述多个第一客户端均未开启个性化推荐功能,所述模型参数表征不涉及用户隐私的部分模型参数;接收所述服务器发送的全局图神经网络模型的模型参数,所述全局图神经网络模型为所述服务器基于收集的多个第二客户端数据对所述图神经网络模型进行训练得到;将所述多个第一客户端分别训练得到的模型参数和所述全局图神经网络模型的模型参数进行聚合,得到第一聚合参数;基于所述第一聚合参数对上一轮训练后的所述图神经网络模型进行下一轮次训练。从而通过上述方式实现了在模型训练的过程中,对不涉及用户隐私的部分模型参数进行融合,而不是对模型的所有参数进行融合,以实现在保护用户数据隐私的前提下,提高端侧模型和云端模型的推荐效果。
附图说明
[0010]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0011]图1示出了本申请一实施例提出的一种数据处理方法的方法流程图。
[0012]图2示出了本申请另一实施例提出的一种数据处理方法的方法流程图。
[0013]图3示出了本申请又一实施例提出的一种数据处理方法的方法流程图。
[0014]图4示出了本申请再一实施例提出的一种数据处理方法的方法流程图。
[0015]图5示出了本申请再一实施例提出的一种数据处理方法的方法流程图。
[0016]图6示出了本申请实施例提供的基于图神经网络的联邦端云推荐流程图。
[0017]图7示出了本申请的用于执行根据本申请实施例的一种数据处理方法的电子设备
的结构框图。
[0018]图8是本申请实施例的用于保存或者携带实现根据本申请实施例的一种数据处理方法的程序代码的存储单元。
具体实施方式
[0019]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0020]联邦学习作为一种全新的分布式机器学习范式,主要思想在于无需用户将数据上传到服务器上集中训练,而是通过多次交换模型参量或梯度等中间信息实现模型的分布式训练。然而,在实际应用中,一些用户没有关闭个性化推荐功能,使得服务器仍能收集到部分用户数据,一定程度上泄露了用户的隐私;并且,由于不同的用户的数据不同,使得服务本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,应用于第一客户端,所述第一客户端的数量为多个,所述方法包括:所述多个第一客户端分别使用各自的本地数据对图神经网络模型进行训练,并在训练结束后分别将训练得到的模型参数发送给所述服务器,所述多个第一客户端均未开启个性化推荐功能,所述模型参数表征不涉及用户隐私的部分模型参数;接收所述服务器发送的全局图神经网络模型的模型参数,所述全局图神经网络模型为所述服务器基于收集的多个第二客户端数据对所述图神经网络模型进行训练得到;将所述多个第一客户端分别训练得到的模型参数和所述全局图神经网络模型的模型参数进行聚合,得到第一聚合参数;基于所述第一聚合参数对上一轮训练后的所述图神经网络模型进行下一轮次训练。2.根据权利要求1所述的方法,其特征在于,所述将所述多个第一客户端分别训练得到的模型参数和所述全局图神经网络模型的模型参数进行聚合,得到第一聚合参数,包括:所述多个第一客户端中的每个第一客户端将所述训练得到的模型参数和接收到的所述全局图神经网络模型的模型参数进行聚合,得到多个聚合参数;将所述多个聚合参数进行聚合,得到第一聚合参数。3.根据权利要求2所述的方法,其特征在于,所述多个第一客户端中的每个第一客户端将所述训练得到的模型参数和接收到的所述全局图神经网络模型的模型参数进行聚合,得到多个聚合参数;将所述多个聚合参数进行聚合,得到第一聚合参数,包括:所述多个第一客户端中的每个第一客户端按照第一融合比例参数将所述训练得到的模型参数和接收到的所述全局图神经网络模型的模型参数进行聚合,得到多个端侧聚合参数;基于第一指定算法将所述多个端侧聚合参数进行聚合,得到第一聚合参数。4.根据权利要求1所述的方法,其特征在于,所述多个第一客户端分别使用各自的本地数据对图神经网络模型进行训练,包括:所述多个第一客户端分别将各自的本地数据输入图神经网络模型,以使得所述图神经网络模型根据所述各自的本地数据聚合对应的第一客户端中用户和商品的交互关系,学习得到用户和商品的表征;根据所述用户和商品的表征预测用户对商品的评分。5.一种数据处理方法,其特征在于,应用于服务器,所述方法包括:所述服务器基于收集的多个第二客户端数据对图神经网络模型进行训练,得到全局图神经网络模型,并将所述全局图神经网络模型的模型参数分别发送给多个第一客户端;接收所述多个第一客户端分别发送的训练得到的模型参数,所述训练得到的模型参数为所述多个第一客户端分别使用各自的本地数据对所述图神经网络模型进行训练得到,所述多个第一客户端均未开启个性化推荐功能,所述模型参数表征不涉及用户隐私的部分模型参数;将所述全局图神经网络模型的模型参数与接收到的所述多个第一客户端分别训练得到的模型参数进行聚合,得到第二聚合参数;基于所述第二聚合参数对上一轮训练后得到的所述全局图神经网络模型进行下一轮次训练。
6.根...

【专利技术属性】
技术研发人员:罗擘孟丹王俊傅致晖彭求应
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1