基于对抗性显式任务分布生成的鲁棒适应方法及装置制造方法及图纸

技术编号：43341336 阅读：38 留言：0更新日期：2024-11-15 20:36

本申请涉及计算机技术领域，特别涉及一种基于对抗性显式任务分布生成的鲁棒适应方法及装置，其中，方法包括：利用预设生成模型参数化元学习器和分布对手，得到参数化的元学习器和参数化的分布对手；分别对参数化的元学习器和参数化的分布对手进行目标梯度更新处理，并利用梯度更新结果确定参数化的元学习器和参数化的分布对手均满足预设均衡条件的目标均衡解，使得基于对抗性显式任务分布生成的目标模型满足预设适应条件。由此，解决了相关技术中采用人工设计或简单的先验任务分布，导致在任务空间中发生分布偏移时，得到的人工设计或简单的任务采样器会在实际场景中遭受灾难性故障，降低了元学习器的适应性和鲁棒性等问题。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机，特别涉及一种基于对抗性显式任务分布生成的鲁棒适应方法及装置。

技术介绍

1、深度学习在过去十年中无论在学术界还是工业界都取得了显著进展。然而，训练深度学习模型通常很耗时，并且在面对没有见过的场景时，先前在一项任务上训练的模型在部署中可能表现不佳。

2、相关技术中，通过元学习提供一种将学到的知识推广到没有见过的场景的方案，这种学习方式是利用过去的经验，提取元知识作为先验知识，并利用一些镜头示例在任务之间转移技能。这样，可以避免从头开始学习，并快速调整模型以适应看不见但类似的任务，满足实际需求，例如，在各种场景中快速自动驾驶等，由于这些理想的特性，这种学习范式在构建基础模型方面发挥着越来越重要的作用。

3、然而，相关技术中，由于任务发布与模型的泛化评估密切相关，可以利用任务标识符配置任务，如，大语言模型语料库中的主题类型，正弦函数中的振幅和相位或者机器人操纵器中的自由度等，可以采用人工设计或简单的先验任务分布，如，均匀分布的任务标识符等，但是在任务空间中发生分布偏移时，得到的人工设计或简单的任务采样...

【技术保护点】

1.一种基于对抗性显式任务分布生成的鲁棒适应方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述分别对所述参数化的元学习器和所述参数化的分布对手进行目标梯度更新处理，包括：

3.根据权利要求2所述的方法，其特征在于，所述第一目标梯度的分数方程为：

4.根据权利要求2所述的方法，其特征在于，所述第二目标梯度的分数方程为：

5.一种基于对抗性显式任务分布生成的鲁棒适应装置，其特征在于，包括：

6.根据权利要求5所述的装置，其特征在于，所述处理模块包括：

7.根据权利要求6所述的装置，其特征在于...

【技术特征摘要】

1.一种基于对抗性显式任务分布生成的鲁棒适应方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述分别对所述参数化的元学习器和所述参数化的分布对手进行目标梯度更新处理，包括：

3.根据权利要求2所述的方法，其特征在于，所述第一目标梯度的分数方程为：

4.根据权利要求2所述的方法，其特征在于，所述第二目标梯度的分数方程为：

5.一种基于对抗性显式任务分布生成的鲁棒适应装置，其特征在于，包括：

6.根据权利要求5所述的装置，其特征在于，所述处理模块包括：

7.根据权利要求6所述的装置，其特征在于，所述...

【专利技术属性】
技术研发人员：季向阳，王琦，曲云，毛逸休，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人