当前位置: 首页 > 专利查询>浙江大学专利>正文

基于拆分联邦学习的公共服务模型训练系统技术方案

技术编号:46063130 阅读:10 留言:0更新日期:2025-08-11 15:49
本说明书实施例提供基于拆分联邦学习的公共服务模型训练系统,包括:多个服务终端利用嵌入层生成本地服务问题数据的问题数据特征,获取服务端利用反馈的问题编码特征,将问题编码特征输入至头部层进行处理,获得预测作答数据,基于目标作答数据和预测作答数据对头部层进行更新,将头部层参数发送至聚合服务端,以及头部层梯度发送至服务端;服务端根据头部层梯度对编码层进行更新,并将编码层梯度反馈至多个服务终端;多个服务终端基于编码层梯度构建隐私梯度,并利用隐私梯度对嵌入层进行更新,将嵌入层参数发送至聚合服务端;聚合服务端基于各个服务终端发送的头部层参数和嵌入层参数对公共服务模型进行优化,获得目标公共服务模型。

【技术实现步骤摘要】

本说明书实施例涉及人工智能,特别涉及基于拆分联邦学习的公共服务模型训练系统


技术介绍

1、随着计算机和互联网技术的发展,公共服务各领域相关数据量急剧膨胀,相关部门的工作强度与复杂性日益升高,在保护数据隐私的前提下高效开发公共服务大模型尤为关键。传统联邦学习需客户端共享完整模型参数,导致模型架构暴露,且梯度交互仍存在原始数据泄露风险;公共服务部门终端算力有限,难以承载全量参数的大模型训练,而传统联邦学习的频繁全局参数传输导致通信开销剧增。因此亟需一种有效的方案以解决上述问题。


技术实现思路

1、有鉴于此,本说明书实施例提供了一种基于拆分联邦学习的公共服务模型训练系统。本说明书一个或者多个实施例同时涉及一种数据处理方法,一种数据处理装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序产品,以解决现有技术中存在的技术缺陷。

2、根据本说明书实施例的第一方面,提供了一种基于拆分联邦学习的公共服务模型训练系统,包括多个服务终端,服务端和聚合服务端,所述多个服务终端部署公共服务模型的头部层和嵌入层,本文档来自技高网...

【技术保护点】

1.一种基于拆分联邦学习的公共服务模型训练系统,其特征在于,包括多个服务终端,服务端和聚合服务端,所述多个服务终端部署公共服务模型的头部层和嵌入层,所述服务端部署所述公共服务模型的编码层,包括:

2.根据权利要求1所述的基于拆分联邦学习的公共服务模型训练系统,其特征在于,所述服务端,对所述公共服务模型进行初始化,并拆分初始化后的公共服务模型,获得所述头部层、所述嵌入层和所述编码层,将所述头部层和所述嵌入层分别对应的第一模型参数发送至各个服务终端,用于在各个服务终端部署所述头部层和所述嵌入层。

3.根据权利要求1所述的基于拆分联邦学习的公共服务模型训练系统,其特征在...

【技术特征摘要】

1.一种基于拆分联邦学习的公共服务模型训练系统,其特征在于,包括多个服务终端,服务端和聚合服务端,所述多个服务终端部署公共服务模型的头部层和嵌入层,所述服务端部署所述公共服务模型的编码层,包括:

2.根据权利要求1所述的基于拆分联邦学习的公共服务模型训练系统,其特征在于,所述服务端,对所述公共服务模型进行初始化,并拆分初始化后的公共服务模型,获得所述头部层、所述嵌入层和所述编码层,将所述头部层和所述嵌入层分别对应的第一模型参数发送至各个服务终端,用于在各个服务终端部署所述头部层和所述嵌入层。

3.根据权利要求1所述的基于拆分联邦学习的公共服务模型训练系统,其特征在于,所述多个服务终端,利用所述嵌入层对所述本地服务问题数据进行处理,获得初始问题数据特征,针对所述初始问题数据特征添加噪声特征,获得问题数据特征,将所述问题数据特征发送至所述服务端;

4.根据权利要求1所述的基于拆分联邦学习的公共服务模型训练系统,其特征在于,所述多个服务终端,确定所述本地服务问题数据对应的目标作答数据,基于所述目标作答数据和所述预测作答数据计算损失值,根据所述损失值对所述头部层进行更新,获得头部层参数和头部层梯度。

5.根据权利要求1所述的基于拆分联邦学习的公共服务模型训练系统,其特征在于,所述多个服务终端,接收所述服务端反...

【专利技术属性】
技术研发人员:朱梦莹宋承昕郑小林阳梦园陈飞月程冠杰
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1