【技术实现步骤摘要】
本申请涉及计算机,特别涉及一种基于对抗性显式任务分布生成的鲁棒适应方法及装置。
技术介绍
1、深度学习在过去十年中无论在学术界还是工业界都取得了显著进展。然而,训练深度学习模型通常很耗时,并且在面对没有见过的场景时,先前在一项任务上训练的模型在部署中可能表现不佳。
2、相关技术中,通过元学习提供一种将学到的知识推广到没有见过的场景的方案,这种学习方式是利用过去的经验,提取元知识作为先验知识,并利用一些镜头示例在任务之间转移技能。这样,可以避免从头开始学习,并快速调整模型以适应看不见但类似的任务,满足实际需求,例如,在各种场景中快速自动驾驶等,由于这些理想的特性,这种学习范式在构建基础模型方面发挥着越来越重要的作用。
3、然而,相关技术中,由于任务发布与模型的泛化评估密切相关,可以利用任务标识符配置任务,如,大语言模型语料库中的主题类型,正弦函数中的振幅和相位或者机器人操纵器中的自由度等,可以采用人工设计或简单的先验任务分布,如,均匀分布的任务标识符等,但是在任务空间中发生分布偏移时,得到的人工设计或简单的任务采样
...【技术保护点】
1.一种基于对抗性显式任务分布生成的鲁棒适应方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述分别对所述参数化的元学习器和所述参数化的分布对手进行目标梯度更新处理,包括:
3.根据权利要求2所述的方法,其特征在于,所述第一目标梯度的分数方程为:
4.根据权利要求2所述的方法,其特征在于,所述第二目标梯度的分数方程为:
5.一种基于对抗性显式任务分布生成的鲁棒适应装置,其特征在于,包括:
6.根据权利要求5所述的装置,其特征在于,所述处理模块包括:
7.根据权利要求6所
...【技术特征摘要】
1.一种基于对抗性显式任务分布生成的鲁棒适应方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述分别对所述参数化的元学习器和所述参数化的分布对手进行目标梯度更新处理,包括:
3.根据权利要求2所述的方法,其特征在于,所述第一目标梯度的分数方程为:
4.根据权利要求2所述的方法,其特征在于,所述第二目标梯度的分数方程为:
5.一种基于对抗性显式任务分布生成的鲁棒适应装置,其特征在于,包括:
6.根据权利要求5所述的装置,其特征在于,所述处理模块包括:
7.根据权利要求6所述的装置,其特征在于,所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。