机器学习模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号：37965867 阅读：7 留言：0更新日期：2023-06-30 09:41

本发明专利技术公开了一种机器学习模型的训练方法、装置、电子设备及存储介质。该方法应用于至少一个客户端，服务器与多个客户端进行多次迭代的分布式模型训练，在任一次迭代过程中，该方法包括：接收服务器发送的全局模型，基于客户端中的本地样本数据对全局模型进行训练，得到模型更新数据；对模型更新数据进行稀疏化处理，得到模型更新稀疏化数据；对模型更新稀疏化数据进行变长编码压缩，得到模型更新变长编码数据；将模型更新变长编码数据上传至服务器，以使服务器根据模型更新变长编码数据对全局模型进行更新。上述技术方案，通过对数据进行变长编码压缩，使数据分配的比特数更为合理，降低了数据压缩误差，从而提升模型训练精度。度。度。

全部详细技术资料下载

【技术实现步骤摘要】
机器学习模型的训练方法、装置、电子设备及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种机器学习模型的训练方法、装置、电子设备及存储介质。

技术介绍

[0002]随着人工智能技术的发展，人们设计了各种先进的机器学习模型来进行训练从而提供各种服务与应用，以满足生活需求。
[0003]联邦学习是一种新的机器学习模型训练的模式，该模式可以使得多个客户端利用本地数据协作训练一个机器学习模型，并且无需将本地数据传输至其他地方。联邦学习的训练架构中包含一个服务器和多个参与训练的客户端，该架构的训练过程包含多个迭代，每个迭代中服务器与客户端之间通过传输压缩的训练的机器学习模型或者模型更新数据来进行模型更新。
[0004]在实现本专利技术的过程中，专利技术人发现现有技术中至少存在以下技术问题：现有技术方案中，存在压缩误差大和模型训练精度低的问题。

技术实现思路

[0005]本专利技术提供了一种机器学习模型的训练方法、装置、电子设备及存储介质，以降低压缩误差，提升模型训练精度。
[0006]根据本专利技术的一方面，提供了一种机器学习模型的训练方法，应用于至少一个客户端，服务器与多个客户端进行多次迭代的分布式模型训练，在任一次迭代过程中，所述方法包括：
[0007]接收服务器发送的全局模型，基于所述客户端中的本地样本数据对所述全局模型进行训练，得到模型更新数据；
[0008]对所述模型更新数据进行稀疏化处理，得到模型更新稀疏化数据；
[0009]对所述模型...

【技术保护点】

【技术特征摘要】
1.一种机器学习模型的训练方法，其特征在于，应用于至少一个客户端，服务器与多个客户端进行多次迭代的分布式模型训练，在任一次迭代过程中，所述方法包括：接收服务器发送的全局模型，基于所述客户端中的本地样本数据对所述全局模型进行训练，得到模型更新数据；对所述模型更新数据进行稀疏化处理，得到模型更新稀疏化数据；对所述模型更新稀疏化数据进行变长编码压缩，得到模型更新变长编码数据；将所述模型更新变长编码数据上传至所述服务器，以使所述服务器根据所述模型更新变长编码数据对所述全局模型进行更新，得到目标全局模型。2.根据权利要求1所述的方法，其特征在于，所述对所述模型更新数据进行稀疏化处理，得到模型更新稀疏化数据，包括：确定所述模型更新数据的绝对值；基于所述模型更新数据的绝对值，对所述模型更新数据进行排序，得到所述模型更新数据的排序结果；从所述模型更新数据结果的排序结果中获取预设个数的元素，并将所述预设个数的元素确定为模型更新稀疏化数据。3.根据权利要求1所述的方法，其特征在于，所述对所述模型更新稀疏化数据进行变长编码压缩，得到模型更新变长编码数据，包括：将所述模型更新稀疏化数据划分至多个数据包中，并确定各所述数据包分配的参数数量；基于各所述数据包分配的参数数量确定目标编码长度；基于所述目标编码长度对所述模型更新稀疏化数据进行压缩，得到模型更新变长编码数据。4.根据权利要求3所述的方法，其特征在于，所述将所述模型更新稀疏化数据划分至多个数据包中，并确定各所述数据包分配的参数数量，包括：将所述模型更新稀疏化数据划分至多个数据包中，并将各所述数据包对应的模型更新稀疏化数据输入优化目标函数，并对所述优化目标函数进行最小化处理，得到各数据包分配的参数数量；其中，所述数据包包括数据包包头和数据包负载，所述数据包包头包括包头信息、数据包位置标识规格信息、质心标识规格信息和质心分布信息；所述数据包负载包括各参数的位置标识和质心标识。5.根据权利要求3所述的方法，其特征在于，所述基于各所述数据包分配的参数数量确定目标编码长度，包括：将所述各所述数据包分配的参数数量输入至预先配置的...

【专利技术属性】
技术研发人员：崔来中，苏晓鑫，周义朋，刘江川，
申请(专利权)人：深圳大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人