System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 模型训练方法、装置、电子设备及存储介质制造方法及图纸_技高网

模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:42648475 阅读:24 留言:0更新日期:2024-09-06 01:42
本申请提供一种模型训练方法、装置、电子设备及存储介质。该方法包括:接收来自多个边缘节点设备的模型训练数据;根据本轮训练的轮次、多个边缘节点设备的模型训练数据以及中心节点设备的模型训练数据,分别确定多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值;根据多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值,对多个边缘节点设备的模型训练数据中各个图片向量表示进行聚类,得到公共数据集中各个图片对应的聚类后的图片向量表示;根据公共数据集中的各个图片,以及各个图片对应的聚类后的图片向量表示,对全局模型进行训练,以更新全局模型的模型参数。本申请的方法,提升了全局模型训练的效果。

【技术实现步骤摘要】

本申请涉及模型训练领域,尤其涉及一种模型训练方法、装置、电子设备及存储介质


技术介绍

1、联邦学习是一种新兴的注重隐私保护的分布式机器学习范式,当前存在一种多模态联邦学习框架creamfl,能够从模型架构和数据模态异构的边缘节点设备端训练更大的中心节点设备端模型,在联邦学习的过程中,各个边缘节点设备间的本地数据集互不共享。

2、中心节点设备端建立全局模型,并将全局模型的输出结果发送至各个边缘节点设备,各个边缘节点设备利用本地模型及本地数据集进行模型训练,输出训练后的结果至中心节点设备端,以使中心节点设备根据各边缘节点训练后的结果对全局模型进行更新。

3、但是,在实际应用联邦学习的过程中,全局模型存在若因中心节点设备的数据质量不好,会最终导致全局模型训练效果差的问题。


技术实现思路

1、本申请提供一种模型训练方法、装置、电子设备及存储介质,用以解决模型训练效果差的技术问题。

2、第一方面,本申请提供一种模型训练方法,应用于中心节点设备,包括:

3、接收来自多个边缘节点设备的模型训练数据;边缘节点设备的模型训练数据包括将公共数据集中的n个图片分别输入边缘节点设备的本地模型后得到的n个图片向量表示,n为大于1的正整数;

4、根据本轮训练的轮次、多个边缘节点设备的模型训练数据以及中心节点设备的模型训练数据,分别确定多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值;中心节点设备的模型训练数据包括将公共数据集中的n个图片对应的文本分别输入全局模型后得到的n个文本向量表示;

5、根据多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值,对多个边缘节点设备的模型训练数据中各个图片向量表示进行聚类,得到公共数据集中各个图片对应的聚类后的图片向量表示;

6、根据公共数据集中的各个图片,以及各个图片对应的聚类后的图片向量表示,对全局模型进行训练,以更新全局模型的模型参数。

7、可选地,如上的方法,根据本轮训练的轮次、多个边缘节点设备的模型训练数据以及中心节点设备的模型训练数据,分别确定多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值,包括:

8、若本轮训练的轮次满足预设条件,根据多个边缘节点设备的模型训练数据、中心节点设备的模型训练数据以及本轮训练的轮次,分别确定多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值。

9、可选地,如上的方法,预设条件包括:以2为底数的本轮训练的轮次的对数为正整数。

10、可选地,如上的方法,根据多个边缘节点设备的模型训练数据、中心节点设备的模型训练数据以及本轮训练的轮次,分别确定多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值,包括:

11、以第一边缘节点设备的模型训练数据中的第k个图片向量表示为例,第k个图片向量表示对应公共数据集中的第k个图片,从中心节点设备的模型训练数据中获取n个文本分别输入全局模型后得到的n个文本向量表示;k在[1,n]之间,n个文本与n个图片一一对应;

12、根据第k个图片向量表示以及n个文本向量表示,确定第k个图片向量表示对应的得分;

13、获取第一边缘节点设备的模型训练数据中的除第k个图片向量表示之外的剩余图片向量表示对应的得分;

14、根据第一边缘节点设备的模型训练数据中的各个图片向量表示对应的得分以及本轮训练的轮次,确定第一边缘节点设备的模型训练数据中的各个图片向量表示对应的权重值。

15、可选地,如上的方法,根据多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值,对多个边缘节点设备的模型训练数据中各个图片向量表示进行聚类,得到公共数据集中各个图片对应的聚类后的图片向量表示,包括:

16、以公共数据集中的第一图片为例,获取多个边缘节点设备的模型训练数据中第一图片的图片向量表示对应的权重值;

17、根据多个边缘节点设备的模型训练数据中第一图片的图片向量表示对应的权重值,对多个边缘节点设备的模型训练数据中的第一图片的图片向量表示进行加权求和,得到第一图片对应的聚类后的图片向量表示。

18、可选地,如上的方法,根据本轮训练的轮次、多个边缘节点设备的模型训练数据以及中心节点设备的模型训练数据,分别确定多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值,包括:

19、若本轮训练的轮次不满足预设条件,根据多个边缘节点设备的模型训练数据,以及中心节点设备的模型训练数据,分别确定多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值。

20、可选地,如上的方法,根据多个边缘节点设备的模型训练数据,以及中心节点设备的模型训练数据,分别确定多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值,包括:

21、以第一边缘节点设备的模型训练数据中的第k个图片向量表示为例,第k个图片向量表示对应公共数据集中的第k个图片,从中心节点设备的模型训练数据中获取n个文本分别输入全局模型后得到的n个文本向量表示;k在[1,n]之间,n个文本与n个图片一一对应;

22、根据第k个图片向量表示以及n个文本向量表示,确定第k个图片向量表示对应的得分;

23、获取第一边缘节点设备的模型训练数据中的除第k个图片向量表示之外的剩余图片向量表示对应的得分;

24、根据第一边缘节点设备的模型训练数据中的各个图片向量表示对应的得分以及本轮训练的轮次,确定第一边缘节点设备的模型训练数据中的各个图片向量表示对应的权重值。

25、第二方面,本申请提供一种模型训练装置,应用于中心节点设备,包括:

26、接收模块,用于接收来自多个边缘节点设备的模型训练数据;边缘节点设备的模型训练数据包括将公共数据集中的n个图片分别输入边缘节点设备的本地模型后得到的n个图片向量表示,n为大于1的正整数;

27、确定模块,用于根据本轮训练的轮次、多个边缘节点设备的模型训练数据以及中心节点设备的模型训练数据,分别确定多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值;中心节点设备的模型训练数据包括将公共数据集中的n个图片对应的文本分别输入全局模型后得到的n个文本向量表示;

28、聚类模块,用于根据多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值,对多个边缘节点设备的模型训练数据中各个图片向量表示进行聚类,得到公共数据集中各个图片对应的聚类后的图片向量表示;

29、更新模块,用于根据公共数据集中的各个图片,以及各个图片对应的聚类后的图片向量表示,对全局模型进行训练,以更新全局模型的模型参数。

30、第三方面,本申请提供一种电子设备,包括:

31、处理器,以及与处理器通信连接的存储器;

32、存储器存储计算机执行指令;

33、处理器执行存储器存储本文档来自技高网...

【技术保护点】

1.一种模型训练方法,其特征在于,应用于中心节点设备,所述中心节点设备部署有全局模型,所述全局模型用于识别图片和文本;所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据本轮训练的轮次、所述多个边缘节点设备的模型训练数据以及所述中心节点设备的模型训练数据,分别确定所述多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值,包括:

3.根据权利要求2所述的方法,其特征在于,所述预设条件包括:以2为底数的所述本轮训练的轮次的对数为正整数。

4.根据权利要求2所述的方法,其特征在于,所述根据所述多个边缘节点设备的模型训练数据、所述中心节点设备的模型训练数据以及所述本轮训练的轮次,分别确定所述多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据所述多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值,对所述多个边缘节点设备的模型训练数据中各个图片向量表示进行聚类,得到所述公共数据集中各个图片对应的聚类后的图片向量表示,包括:

6.根据权利要求1所述的方法,其特征在于,所述根据本轮训练的轮次、所述多个边缘节点设备的模型训练数据以及所述中心节点设备的模型训练数据,分别确定所述多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值,包括:

7.根据权利要求6所述的方法,其特征在于,所述根据所述多个边缘节点设备的模型训练数据,以及所述中心节点设备的模型训练数据,分别确定所述多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值,包括:

8.一种模型训练装置,其特征在于,应用于中心节点设备,包括:

9.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至7任一项所述的方法。

...

【技术特征摘要】

1.一种模型训练方法,其特征在于,应用于中心节点设备,所述中心节点设备部署有全局模型,所述全局模型用于识别图片和文本;所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据本轮训练的轮次、所述多个边缘节点设备的模型训练数据以及所述中心节点设备的模型训练数据,分别确定所述多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值,包括:

3.根据权利要求2所述的方法,其特征在于,所述预设条件包括:以2为底数的所述本轮训练的轮次的对数为正整数。

4.根据权利要求2所述的方法,其特征在于,所述根据所述多个边缘节点设备的模型训练数据、所述中心节点设备的模型训练数据以及所述本轮训练的轮次,分别确定所述多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据所述多个边缘节点设备的模型训练数据中各个图片向量表示对应的权重值,对所述多个边缘节点设备的模型训练数...

【专利技术属性】
技术研发人员:张其濛葛灏李丹青岳帅王琦胡颖潘登李奕萱
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1