基于联邦学习的知识迁移方法、装置、设备及介质制造方法及图纸

技术编号：24094085 阅读：37 留言：0更新日期：2020-05-09 09:26

本申请公开了一种基于联邦学习的知识迁移方法、装置、设备和介质，所述基于联邦学习的知识迁移方法包括：接收不同训练任务的各强化学习训练模型，并对各所述强化学习训练模型进行适配，获得强化学习适配模型，对各所述强化学习适配模型进行联邦处理，获得联邦模型，对所述联邦模型进行适配，获得联邦适配模型，将各所述联邦适配模型发送至各所述强化学习训练模型对应的训练设备，以对各所述强化学习训练模型进行迭代训练。本申请解决了知识迁移效率低的技术问题。

Knowledge transfer methods, devices, devices and media based on Federated learning

全部详细技术资料下载

【技术实现步骤摘要】
基于联邦学习的知识迁移方法、装置、设备及介质
本申请涉及金融科技(Fintech)的机器学习
，尤其涉及一种基于联邦学习的知识迁移方法、装置、设备及介质。
技术介绍
随着金融科技，尤其是互联网科技金融的不断发展，越来越多的技术(如分布式、区块链Blockchain、人工智能等)应用在金融领域，但金融业也对技术提出了更高的要求，如对金融业对应待办事项的分发也有更高的要求。随着计算机软件和人工智能的不断发展，机器学习建模的应用也越来越广泛，在现有技术中，强化学习训练模型通常利用自身收集的数据进行学习、优化和控制，强化学习训练模型的知识也是可迁移的，例如，将无人车的控制知识迁移到扫地机器人的控制上，目前，通常是通过离线的迁移模型进行强化学习训练模型的知识的迁移，但是，这种离线迁移的方法在训练过程中需要花费大量的训练时间，进而导致强化学习训练模型的知识迁移效率极低，且导致训练过程中消耗的计算资源和传输资源过高，所以，现有技术中存在知识迁移效率低的技术问题。
技术实现思路
本申请的主要目的在于提供一种基于联邦学习的知识迁移方法、装置、设备和介质，旨在解决现有技术中知识迁移效率低的技术问题。为实现上述目的，本申请提供一种基于联邦学习的知识迁移方法，所述基于联邦学习的知识迁移方法应用于基于联邦学习的知识迁移设备，所述基于联邦学习的知识迁移方法包括：接收不同训练任务的各强化学习训练模型，并对各所述强化学习训练模型进行适配，获得强化学习适配模型；对各所述强化学习适配模型进行联邦...

【技术保护点】
1.一种基于联邦学习的知识迁移方法，其特征在于，所述基于联邦学习的知识迁移方法包括：/n接收不同训练任务的各强化学习训练模型，并对各所述强化学习训练模型进行适配，获得强化学习适配模型；/n对各所述强化学习适配模型进行联邦处理，获得联邦模型；/n对所述联邦模型进行适配，获得联邦适配模型；/n将各所述联邦适配模型发送至各所述强化学习训练模型对应的训练设备，以对各所述强化学习训练模型进行迭代训练。/n

【技术特征摘要】
1.一种基于联邦学习的知识迁移方法，其特征在于，所述基于联邦学习的知识迁移方法包括：
接收不同训练任务的各强化学习训练模型，并对各所述强化学习训练模型进行适配，获得强化学习适配模型；
对各所述强化学习适配模型进行联邦处理，获得联邦模型；
对所述联邦模型进行适配，获得联邦适配模型；
将各所述联邦适配模型发送至各所述强化学习训练模型对应的训练设备，以对各所述强化学习训练模型进行迭代训练。

2.如权利要求1所述基于联邦学习的知识迁移方法，其特征在于，所述对各所述强化学习训练模型进行适配，获得强化学习适配模型的步骤包括：
获取各所述强化学习训练模型的模型输入和模型输出；
对各所述模型输入和各所述模型输出进行校正，获得所述强化学习适配模型。

3.如权利要求2所述基于联邦学习的知识迁移方法，其特征在于，所述模型输入包括环境参数，所述模型输出包括模型控制变量，
所述对各所述模型输入和各所述模型输出进行校正，获得所述强化学习适配模型的步骤包括：
对各所述环境参数进行量纲校正，获得模型输入校正结果；
对各所述控制变量进行量纲校正和对齐处理，获得模型输出校正结果；
基于所述模型输入校正结果和所述模型输出校正结果，获取所述强化学习适配模型。

4.如权利要求3所述基于联邦学习的知识迁移方法，其特征在于，所述对各所述环境参数进行量纲校正，获得模型输入校正结果的步骤包括：
获取预设标准环境参数，并将各所述环境参数与所述预设标准环境参数进行比对，获得环境参数差异度；
基于各所述环境参数差异度，对各所述环境参数进行量纲校正，获得所述模型输入校正结果。

5.如权利要求3所述基于联邦学习的知识迁移方法，其特征在于，所述对各所述控制变量进行量纲校正和对齐处理，获得模型输出校正结果的步骤包括：
对各所述控制变量进行对齐处理，获得对齐处理结果；
获取预设标准控制变量，并基于所述预设标准控制变量和所述...

【专利技术属性】
技术研发人员：梁新乐，刘洋，陈天健，董苗波，
申请(专利权)人：深圳前海微众银行股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人