一种基于联邦迁移学习的模型训练方法及计算节点技术

技术编号：29404198 阅读：14 留言：0更新日期：2021-07-23 22:42

本申请实施例公开了一种基于联邦迁移学习的模型训练方法及计算节点，可应用于人工智能领域中，该方法包括：在各源域上通过本地有标签数据训练各自的特征提取器的模型参数G和子任务模型(如分类器)的模型参数T，再将所有G发送给目标域，并在各源域上训练各自域鉴别器的模型参数D1，在目标域上训练域鉴别器的模型参数D2，将所有D1和D2在服务器端或目标域端聚合得到聚合参数值D，并将D发送给各个源域，每个源域通过各自的特征提取器和鉴别器进行多次迭代的对抗训练。本申请通过对抗训练过程实现域对齐，并且域之间互相传递的仅是模型参数值，不传递数据或数据特征，保护了数据隐私，在兼顾域对齐和数据隐私的情况下实现了对模型的协同训练。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于联邦迁移学习的模型训练方法及计算节点
本申请涉及人工智能领域，尤其涉及一种基于联邦迁移学习的模型训练方法及计算节点。
技术介绍
联邦学习(federatedlearning，FL)又称为联邦机器学习、联合学习、联盟学习等，其能有效帮助多个计算节点在满足用户隐私保护、数据安全和政府法规的要求下，进行数据使用和机器学习建模；迁移学习(transferlearning，TL)是把为任务A开发的模型作为初始点，重新使用在为任务B开发模型的过程中，也就是把基于已有任务训练好的模型学习到的知识迁移到新的任务中来帮助该模型进行再训练。业界目前已有几种基于联邦学习/迁移学习的模型训练方法，一种联邦学习方法称为联邦平均(federatedaveraging，FedAvg)，FedAvg结构上一般包括一个服务器和一些客户端，适用于各个客户端的数据都有标签的场景，技术流程主要包括模型下发和模型聚合过程，在模型下发过程，客户端从服务器下载模型，在本地数据上训练，训练到一定程度后上传模型到服务器；模型聚合过程，服务器会收集各个客户端上传的模型，并进行模型融合，这两个过程会反复迭代直至模型收敛。一种迁移学习方法则称为对抗判别域适应(adversarialdiscriminativedomainadaptation，ADDA)，ADDA的特点是从源域数据提取的特征和从目标域数据提取的特征会合并到一起作为训练数据的特征，结构上一般包括特征提取器和一个鉴别器，其中，特征提取器负责提取训练数据的特征，希望提取到的特征能够迷惑鉴别器，使鉴...

【技术保护点】
1.一种基于联邦迁移学习的模型训练方法，其特征在于，包括：/n在第一计算节点上的第一模型参数值和第二模型参数值保持不变的情况下，所述第一计算节点采用所述第一计算节点上的第一数据集训练所述第一计算节点上的第三模型，以得到所述第一计算节点上的第三模型参数值，所述第一模型参数值、所述第二模型参数值、所述第三模型参数值分别为所述第一计算节点上的第一模型、第二模型、第三模型的模型参数取值，其中，所述第一模型用于对输入数据进行特征提取，所述第二模型用于基于所述第一模型提取出的特征执行目标任务，所述第三模型用于鉴别由所述第一模型提取出的特征的源域；/n所述第一计算节点接收第一聚合参数值，所述第一聚合参数值基于所述第三模型参数值以及第四模型参数值得到，所述第四模型参数值为第二计算节点上的第三模型的模型参数取值，所述第二计算节点上的第三模型由所述第二计算节点采用所述第二计算节点上的第二数据集训练得到；/n所述第一计算节点将所述第三模型参数值更新为所述第一聚合参数值，并在保持所述第三模型参数值为所述第一聚合参数值不变的情况下，采用所述第一数据集对所述第一计算节点上的第一模型和第二模型再进行训练，并更新所述...

【技术特征摘要】
1.一种基于联邦迁移学习的模型训练方法，其特征在于，包括：
在第一计算节点上的第一模型参数值和第二模型参数值保持不变的情况下，所述第一计算节点采用所述第一计算节点上的第一数据集训练所述第一计算节点上的第三模型，以得到所述第一计算节点上的第三模型参数值，所述第一模型参数值、所述第二模型参数值、所述第三模型参数值分别为所述第一计算节点上的第一模型、第二模型、第三模型的模型参数取值，其中，所述第一模型用于对输入数据进行特征提取，所述第二模型用于基于所述第一模型提取出的特征执行目标任务，所述第三模型用于鉴别由所述第一模型提取出的特征的源域；
所述第一计算节点接收第一聚合参数值，所述第一聚合参数值基于所述第三模型参数值以及第四模型参数值得到，所述第四模型参数值为第二计算节点上的第三模型的模型参数取值，所述第二计算节点上的第三模型由所述第二计算节点采用所述第二计算节点上的第二数据集训练得到；
所述第一计算节点将所述第三模型参数值更新为所述第一聚合参数值，并在保持所述第三模型参数值为所述第一聚合参数值不变的情况下，采用所述第一数据集对所述第一计算节点上的第一模型和第二模型再进行训练，并更新所述第一模型参数值和所述第二模型参数值。

2.根据权利要求1所述的方法，其特征在于，所述第一计算节点接收第一聚合参数值，所述第一聚合参数值基于所述第三模型参数值以及第四模型参数值得到包括：
所述第一计算节点将所述第三模型参数值向所述第二计算节点发送，以使得所述第二计算节点将所述第三模型参数值和所述第四模型参数值进行聚合，以得到所述第一聚合参数值；
所述第一计算节点接收来自所述第二计算节点的所述第一聚合参数值。

3.根据权利要求1-2中任一项所述的方法，其特征在于，所述方法还包括：
所述第一计算节点将更新得到的第一模型参数值和更新得到的第二模型参数值向所述第二计算节点发送。

4.根据权利要求1所述的方法，其特征在于，所述第一计算节点接收第一聚合参数值，所述第一聚合参数值基于所述第三模型参数值以及第四模型参数值得到包括：
所述第一计算节点将所述第三模型参数值向第三计算节点发送，以使得所述第三计算节点将所述第三模型参数值以及来自所述第二计算节点的所述第四模型参数值进行聚合，以得到所述第一聚合参数值；
所述第一计算节点接收来自所述第三计算节点的所述第一聚合参数值。

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：
所述第一计算节点将更新得到的第一模型参数值和更新得到的第二模型参数值向所述第三计算节点发送。

6.一种基于联邦迁移学习的模型训练方法，其特征在于，包括：
第二计算节点获取第二聚合参数值，所述第二聚合参数值基于一个或多个第一计算节点上各自训练后的第一模型的第一模型参数值得到，其中，每个第一计算节点上的第一模型由所述第一计算节点采用所述第一计算节点的第一数据集进行训练，所述第一模型用于对输入数据进行特征提取；
在所述第二计算节点上的第一模型的模型参数取值为所述第二聚合参数值的情况下，所述第二计算节点采用所述第二计算节点上的第二数据集对所述第二计算节点上的第三模型进行训练，以得到所述第二计算节点上的第三模型的第四模型参数值，其中，所述第三模型用于鉴别由所述第一模型提取出的特征的源域。

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：
所述第二计算节点获取第一聚合参数值，所述第一聚合参数值基于第三模型参数值以及所述第四模型参数值得到，所述第三模型参数值为所述第一计算节点采用所述第一数据集对所述第一计算节点上的第三模型进行训练得到的模型参数取值；
所述第二计算节点将所述第四模型参数值更新为所述第一聚合参数值，并在保持所述第四模型参数值为所述第一聚合参数值不变的情况下，采用所述第二数据集对所述第二计算节点上的第一模型、第二模型进行训练，并更新所述第二计算节点上的第一模型的模型参数值和所述第二计算节点上的第二模型的模型参数值。

8.根据权利要求7所述的方法，其特征在于，所述第二计算节点获取第一聚合参数值，所述第一聚合参数值基于第三模型参数值以及所述第四模型参数值得到包括：
所述第二计算节点接收由一个或多个所述第一计算节点各自发送的第三模型参数值；
所述第二计算节点将所述第四模型参数值和每个所述第三模型参数值进行聚合，以得到所述第一聚合参数值。

9.根据权利要求7或8所述的方法，其特征在于，所述第二计算节点获取第二聚合参数值，所述第二聚合参数值基于一个或多个第一计算节点上各自训练后的第一模型的第一模型参数值得到包括：
所述第二计算节点接收由一个或多个所述第一计算节点各自发送的第一模型参数值，并将每个所述第一模型参数值和所述第二计算节点上的第一模型的模型参数值进行聚合，以得到所述第二聚合参数值。

10.根据权利要求9所述的方法，其特征在于，所述方法还包括：
所述第二计算节点基于来自一个或多个所述第一计算节点的最后一次更新的所述第一模型参数值，最后一次更新所述第二聚合参数值；
所述第二计算节点接收由一个或多个所述第一计算节点发送的更新后的第二模型参数值，并将每个所述更新后的第二模型参数值和更新后的所述第二计算节点上的第二模型的模型参数值进行聚合，以得到第四聚合参数值；
所述第二计算节点根据所述第二计算节点上的第一模型、第二模型执行目标任务，其中，所述第二计算节点上的第一模型的模型参数取值为所述最后一次更新得到的第二聚合参数值，所述第二计算节点上的第二模型的模型参数取值为所述第四聚合参数值。

11.根据权利要求6所述的方法，其特征在于，所述第二计算节点获取第二聚合参数值，所述第二聚合参数值基于一个或多个第一计算节点上各自训练后的第一模型的第一模型参数值得到包括：
所述第二计算节点接收由每个第一计算节点各自发送的第一模型参数值，并对接收到的每个所述第一模型参数值进行聚合，以得到所述第二聚合参数值。

12.根据权利要求11所述的方法，其特征在于，所述方法还包括：
所述第二计算节点基于来自一个或多个所述第一计算节点的最后一次更新的所述第一模型参数值，最后一次更新所述第二聚合参数值；所述第二计算节点接收由每个第一计算节点各自发送的最后一次更新得到的第二模型参数值，对每个所述最后一次更新得到的第二模型参数值进行聚合，以得到第三聚合参数值；
所述第二计算节点根据所述第二计算节点上的第一模型、第二模型执行目标任务，其中，所述第二计算节点上的第一模型的模型参数取值为最后一次更新得到的第二聚合参数值，所述第二计算节点上的第二模型的模型参数取值为所述第三聚合参数值。

13.根据权利要求7所述的方法，其特征在于，所述第二计算节点获取第一聚合参数值，所述第一聚合参数值基于第三模型参数值以及所述第四模型参数值得到包括：
所述第二计算节点向第三计算节点发送所述第四模型参数值；
所述第二计算节点接收来自所述第三计算节点的第一聚合参数值，所述第一聚合参数值由所述第三计算节点对来自一个或多个所述第一计算节点的每个第三模型参数值和所述第四模型参数值聚合得到。

14.根据权利要求7所述的方法，其特征在于，所述第二计算节点获取第二聚合参数值，所述第二聚合参数值基于一个或多个第一计算节点上各自训练后的第一模型的第一模型参数值得到包括：
所述第二计算节点向第三计算节点发送更新后的所述第二计算节点上的第一模型的模型参数值；
所述第二计算节点接收来自所述第三计算节点的所述第二聚合参数值，所述第二聚合参数值由所述第三计算节点对所述更新后的所述第二计算节点上的第一模型的模型参数值以及来自一个或多个所述第一计算节点的每个更新的第一模型参数值聚合得到。

15.根据权利要求14所述的方法，其特征在于，所述方法还包括：
所述第二计算节点将更新后的所述第二计算节点上的第二模型的模型参数值向所述第三计算节点发送，以使得所述第三计算节点对所述更新后的所述第二计算节点上的第二模型的模型参数值以及从一个或多个所述第一计算节点各自接收到的每个最后一次更新得到的第二模型参数值进行聚合，以得到第四聚合参数值；
所述第二计算节点接收来自所述第三计算节点的所述第四聚合参数值；
所述第二计算节点根据所述第二计算节点上的第一模型、第二模型执行目标任务，其中，所述第二计算节点上的第一模型的模型参数取值为来自所述第三计算节点的最后一次更新得到的第二聚合参数值，所述第二计算节点上的第二模型的模型参数取值为所述第四聚合参数值。

16.根据权利要求6所述的方法，其特征在于，所述第二计算节点获取第二聚合参数值，所述第二聚合参数值基于一个或多个第...

【专利技术属性】
技术研发人员：詹德川，施意，李新春，宋绍铭，邵云峰，李秉帅，钱莉，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人