模型训练方法、装置、通信设备及可读存储介质制造方法及图纸

技术编号：37257163 阅读：22 留言：0更新日期：2023-04-20 23:33

本申请公开了一种模型训练方法、装置、通信设备及可读存储介质，属于通信技术领域。本申请实施例的模型训练方法包括：基站获取多个终端的终端数据；根据所述终端数据的相似度，对所述多个终端进行聚类，获得至少一个终端组；针对第一终端组，利用所述第一终端组中的源终端与目标终端之间的特征距离，与所述源终端联合训练得到用于所述第一终端组的模型；所述第一终端组为所述至少一个终端组中的任意一者。一者。一者。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、装置、通信设备及可读存储介质

[0001]本申请属于通信
，具体涉及一种模型训练方法、装置、通信设备及可读存储介质。

技术介绍

[0002]随着通信技术的发展，人工智能(Artificial Intelligence，AI)模型逐渐成为网络架构不可缺少的一部分。AI模型的训练通常是孤立的，直接基于特定任务以及样本数据集训练得到。然而，由于网络中终端的数量众多，若为每个终端单独训练模型，将会造成费时费资源。

技术实现思路

[0003]本申请实施例的目的是提供一种模型训练方法、装置、通信设备及可读存储介质，以解决目前网络中终端模型的训练费时费资源的问题。
[0004]为了解决上述技术问题，本申请是这样实现的：
[0005]第一方面，提供了一种模型训练方法，应用于基站，包括：
[0006]获取多个终端的终端数据；
[0007]根据所述终端数据的相似度，对所述多个终端进行聚类，获得至少一个终端组；
[0008]针对第一终端组，利用所述第一终端组中的源终端与目...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，应用于基站，其特征在于，包括：获取多个终端的终端数据；根据所述终端数据的相似度，对所述多个终端进行聚类，获得至少一个终端组；针对第一终端组，利用所述第一终端组中的源终端与目标终端之间的特征距离，与所述源终端联合训练得到用于所述第一终端组的模型；其中，所述第一终端组为所述至少一个终端组中的任意一者。2.根据权利要求1所述的方法，其特征在于，所述利用所述第一终端组中的源终端与目标终端之间的特征距离，与所述源终端联合训练得到用于所述第一终端组的模型，包括：S1：对于第i轮训练，从所述源终端接收其训练出的第一模型参数，并向所述源终端发送更新参数，所述更新参数用于对所述源终端中的模型部分进行参数更新；S2：获取第一特征值，其中，所述第一特征值是所述源终端和/或所述基站将源终端数据输入到对应模型中，通过前向传播计算得到；S3：将所述第一模型参数和第二模型参数发送给所述目标终端，并从所述目标终端接收第二特征值；其中，所述第二模型参数是所述基站在第i轮训练时训练得到；所述第二特征值是所述目标终端将其数据输入到基于所述第一模型参数和所述第二模型参数构建的模型中，通过前向传播计算得到；S4：根据所述第一特征值和所述第二特征值，确定所述特征距离，并利用所述特征距离，与所述源终端进行下一轮训练，直至满足模型训练结束条件；其中，当不满足模型训练结束条件时，i值累加1，并重复S1至S4；i为正整数。3.根据权利要求2所述的方法，其特征在于，所述模型的损失函数为：L＝L
C
(X
L
，y)+λMMD2(X
S
，X1,
…
,X
n
)其中，L
C
表示所述模型的输出值与真实值之间的差距，y表示所述模型的输出值，X
L
表示所述真实值；λMMD2(X
S
，X1,
…
,X
n
)用于度量所述特征距离，X
S
表示所述第一特征值，X1,
…
,X
n
表示所述第二特征值，n表示所述目标终端的个数，λ为系数。4.根据权利要求2所述的方法，其特征在于，所述方法还包括：向所述源终端和/或所述目标终端发送模型配置参数；其中，所述模型配置参数包括相应模型的以下至少一项：模型结构配置信息；输入样本类别；损失函数；超参数。5.根据权利要求1所述的方法，其特征在于，所述模型包括：轨迹预测模型；每个所述终端组中的所有终端具有相似轨迹。6.一种模型训练方法，应用于源终端，其特征在于，包括：在模型训练过程中，将自身数据输入到训练模型中，生成第一模型参数，并从基站接收更新参数，所述更新参数用于对所述源终端中的模型部分进行参数更新；向所述基站发送所述第一模型参数，由所述基站根据所述第一模型参数进行前向传播，并根据获取的第一特征值和第二特征值，确定源终端与目标终端之间的特征距离，利用所述特征距离，与所述源终端联合训练得到用于第一终端组的模型；
其中，所述第一终端组中的所有终端具有相似特征，所述源终端和所述目标终端属于所述第一终端组；所述第一特征值是所述源终端和/或所述基站将源终端数据输入到对应模型中，通过前向传播计算得到；所述第二特征值是所述目标终端将其数据输入到第一模型中，通过前向传播计算得到；所述第一模型是所述目标终端基于从所述基站接收到的模型参数构建。7.一种模型训练方法，应用于目标终端，其特征在于，包括：在模型训练过程中，从基站接收模型参数，并基于所述模型参数构建第一模型；将自身数据输入到所述第一模型中，通过前向传播计算得到第二特征值；向所述基站发送所述第二特征值，由所述基站根据第一特征值和所述第二特征值，确...

【专利技术属性】
技术研发人员：孙欣，王莹莹，李娜，赵芸，孙军帅，刘光毅，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人