当前位置: 首页 > 专利查询>深圳大学专利>正文

机器学习模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37965867 阅读:7 留言:0更新日期:2023-06-30 09:41
本发明专利技术公开了一种机器学习模型的训练方法、装置、电子设备及存储介质。该方法应用于至少一个客户端,服务器与多个客户端进行多次迭代的分布式模型训练,在任一次迭代过程中,该方法包括:接收服务器发送的全局模型,基于客户端中的本地样本数据对全局模型进行训练,得到模型更新数据;对模型更新数据进行稀疏化处理,得到模型更新稀疏化数据;对模型更新稀疏化数据进行变长编码压缩,得到模型更新变长编码数据;将模型更新变长编码数据上传至服务器,以使服务器根据模型更新变长编码数据对全局模型进行更新。上述技术方案,通过对数据进行变长编码压缩,使数据分配的比特数更为合理,降低了数据压缩误差,从而提升模型训练精度。度。度。

【技术实现步骤摘要】
机器学习模型的训练方法、装置、电子设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种机器学习模型的训练方法、装置、电子设备及存储介质。

技术介绍

[0002]随着人工智能技术的发展,人们设计了各种先进的机器学习模型来进行训练从而提供各种服务与应用,以满足生活需求。
[0003]联邦学习是一种新的机器学习模型训练的模式,该模式可以使得多个客户端利用本地数据协作训练一个机器学习模型,并且无需将本地数据传输至其他地方。联邦学习的训练架构中包含一个服务器和多个参与训练的客户端,该架构的训练过程包含多个迭代,每个迭代中服务器与客户端之间通过传输压缩的训练的机器学习模型或者模型更新数据来进行模型更新。
[0004]在实现本专利技术的过程中,专利技术人发现现有技术中至少存在以下技术问题:现有技术方案中,存在压缩误差大和模型训练精度低的问题。

技术实现思路

[0005]本专利技术提供了一种机器学习模型的训练方法、装置、电子设备及存储介质,以降低压缩误差,提升模型训练精度。
[0006]根据本专利技术的一方面,提供了一种机器学习模型的训练方法,应用于至少一个客户端,服务器与多个客户端进行多次迭代的分布式模型训练,在任一次迭代过程中,所述方法包括:
[0007]接收服务器发送的全局模型,基于所述客户端中的本地样本数据对所述全局模型进行训练,得到模型更新数据;
[0008]对所述模型更新数据进行稀疏化处理,得到模型更新稀疏化数据;
[0009]对所述模型更新稀疏化数据进行变长编码压缩,得到模型更新变长编码数据;
[0010]将所述模型更新变长编码数据上传至所述服务器,以使所述服务器根据所述模型更新变长编码数据对所述全局模型进行更新,得到目标全局模型。
[0011]根据本专利技术的另一方面,提供了一种机器学习模型的训练装置,应用于至少一个客户端,服务器与多个客户端进行多次迭代的分布式模型训练,在任一次迭代过程中,所述装置包括:
[0012]模型更新数据确定模块,用于接收服务器发送的全局模型,基于所述客户端中的本地样本数据对所述全局模型进行训练,得到模型更新数据;
[0013]更新数据稀疏化模块,用于对所述模型更新数据进行稀疏化处理,得到模型更新稀疏化数据;
[0014]变长编码压缩压缩模块,用于对所述模型更新稀疏化数据进行变长编码压缩,得到模型更新变长编码数据;
[0015]变长编码数据上传模块,用于将所述模型更新变长编码数据上传至所述服务器,以使所述服务器根据所述模型更新变长编码数据对所述全局模型进行更新,得到目标全局模型。
[0016]根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:
[0017]至少一个处理器;
[0018]以及与所述至少一个处理器通信连接的存储器;
[0019]其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的机器学习模型的训练方法。
[0020]根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的机器学习模型的训练方法。
[0021]本专利技术实施例的技术方案,通过接收服务器发送的全局模型,进而基于客户端中的本地样本数据对全局模型进行训练,得到模型更新数据,进而对模型更新数据进行稀疏化处理,得到模型更新稀疏化数据,实现了模型更新数据的初步压缩,进而对初步压缩的模型更新稀疏化数据进行变长编码压缩,使数据分配的比特数更为合理,降低了数据压缩误差,进而将模型更新变长编码数据上传至服务器,以使服务器根据模型更新变长编码数据对全局模型进行更新,得到精度更高的目标全局模型。
[0022]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0023]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0024]图1是根据本专利技术实施例一提供的一种联邦学习模型的训练方法的流程图;
[0025]图2是根据本专利技术实施例一提供的一种模型单轮全局迭代训练的流程图;
[0026]图3是根据本专利技术实施例二提供的一种机器学习模型的训练方法的流程图;
[0027]图4是根据本专利技术实施例三提供的一种机器学习模型的训练方法的流程图;
[0028]图5是根据本专利技术实施例三提供的一种数据包的结构示意图;
[0029]图6是根据本专利技术实施例四提供的一种机器学习模型的训练装置的结构示意图;
[0030]图7是实现本专利技术实施例的机器学习模型的训练方法的电子设备的结构示意图。
具体实施方式
[0031]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范
围。
[0032]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0033]在介绍具体实施方式之前,先对本申请的应用场景介绍。具体而言,机器学习模型的训练系统包括一个服务器和多个参与训练的客户端。其中,服务器可以为位于云端的参数服务器;客户端可以为具备一定存储和计算能力的终端设备;服务器与各客户端之间可以通过无线方式进行通信,例如无线方式可以为移动通信、WiFi等。
[0034]实施例一
[0035]图1为本专利技术实施例一提供的一种机器学习模型的训练方法的流程图,本实施例可适用于联邦学习模型训练的情况,该方法可以由机器学习模型的训练装置来执行,该机器学习模型的训练装置可以采用硬件和/或软件的形式实现,该机器学习模型的训练装置可配置于一个或多个客户端中。如图1所示,该方法包括:
[0036]S110、接收服务器发送的全局模型,基于所述客户端中的本地样本数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种机器学习模型的训练方法,其特征在于,应用于至少一个客户端,服务器与多个客户端进行多次迭代的分布式模型训练,在任一次迭代过程中,所述方法包括:接收服务器发送的全局模型,基于所述客户端中的本地样本数据对所述全局模型进行训练,得到模型更新数据;对所述模型更新数据进行稀疏化处理,得到模型更新稀疏化数据;对所述模型更新稀疏化数据进行变长编码压缩,得到模型更新变长编码数据;将所述模型更新变长编码数据上传至所述服务器,以使所述服务器根据所述模型更新变长编码数据对所述全局模型进行更新,得到目标全局模型。2.根据权利要求1所述的方法,其特征在于,所述对所述模型更新数据进行稀疏化处理,得到模型更新稀疏化数据,包括:确定所述模型更新数据的绝对值;基于所述模型更新数据的绝对值,对所述模型更新数据进行排序,得到所述模型更新数据的排序结果;从所述模型更新数据结果的排序结果中获取预设个数的元素,并将所述预设个数的元素确定为模型更新稀疏化数据。3.根据权利要求1所述的方法,其特征在于,所述对所述模型更新稀疏化数据进行变长编码压缩,得到模型更新变长编码数据,包括:将所述模型更新稀疏化数据划分至多个数据包中,并确定各所述数据包分配的参数数量;基于各所述数据包分配的参数数量确定目标编码长度;基于所述目标编码长度对所述模型更新稀疏化数据进行压缩,得到模型更新变长编码数据。4.根据权利要求3所述的方法,其特征在于,所述将所述模型更新稀疏化数据划分至多个数据包中,并确定各所述数据包分配的参数数量,包括:将所述模型更新稀疏化数据划分至多个数据包中,并将各所述数据包对应的模型更新稀疏化数据输入优化目标函数,并对所述优化目标函数进行最小化处理,得到各数据包分配的参数数量;其中,所述数据包包括数据包包头和数据包负载,所述数据包包头包括包头信息、数据包位置标识规格信息、质心标识规格信息和质心分布信息;所述数据包负载包括各参数的位置标识和质心标识。5.根据权利要求3所述的方法,其特征在于,所述基于各所述数据包分配的参数数量确定目标编码长度,包括:将所述各所述数据包分配的参数数量输入至预先配置的...

【专利技术属性】
技术研发人员:崔来中苏晓鑫周义朋刘江川
申请(专利权)人:深圳大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1