【技术实现步骤摘要】
一种任务处理方法及相关装置
[0001]本申请涉及人工智能
,尤其涉及一种任务处理方法及相关装置
。
技术介绍
[0002]如今,预训练微调范式已在很多领域取得了显著的成功
。
但是,随着预训练模型的模型参数越来越庞大,所应用的下游任务越来越多,为每个下游任务均单独微调预训练模型的所有模型参数所需耗费的成本极高,需要很高的算力和存储资源支持
。
[0003]基于此,适配器(
Adapter
)应运而生,其是插入到预训练模型中的一种可学习参数量极少的瓶颈结构
。
针对下游任务微调预训练模型时,可以只对适配器的模型参数进行训练调整,而保持预训练模型原有的模型参数不变,并且可以达到和微调预训练模型中所有模型参数相近
、
甚至更优的效果
。
[0004]当将预训练模型同时应用于多个下游任务时,相关技术中基于适配器的预训练模型微调方案的实现效果普遍不够理想,插入适配器的预训练模型在下游任务中的性能不佳
。
技术实现思路
[0005]本申请实施例提供了一种任务处理方法及相关装置,以提高插入有适配器的预训练模型在下游任务中的性能
。
[0006]本申请第一方面提供了一种任务处理方法,该方法包括:获取待处理数据;通过多任务处理模型中的预训练模型,根据待处理数据,确定目标通用特征;多任务处理模型用于基于输入的数据执行多个任务;通过多任务处理模型中的适配器,根据待处理数据或者预训练模型处理
【技术保护点】
【技术特征摘要】
1.
一种任务处理方法,其特征在于,所述方法包括:获取待处理数据;通过多任务处理模型中的预训练模型,根据所述待处理数据,确定目标通用特征;所述多任务处理模型用于基于输入的数据执行多个任务;通过所述多任务处理模型中的适配器,根据所述待处理数据或者所述预训练模型处理所述待处理数据时生成的参考特征,确定所述多个任务各自的目标私有特征;所述适配器中包括共享投影结构和所述多个任务各自对应的知识提取结构,所述共享投影结构用于提取参考通用特征,所述知识提取结构用于基于所述参考通用特征提取其对应的任务的参考私有特征,所述任务的目标私有特征根据所述任务的参考私有特征确定;通过所述多任务处理模型中的每个解码器,根据所述解码器对应的任务的目标私有特征以及所述目标通用特征,确定所述解码器对应的任务的处理结果;所述多任务处理模型中包括所述多个任务各自对应的解码器
。2.
根据权利要求1所述的方法,其特征在于,所述通过所述多任务处理模型中的适配器,根据所述待处理数据或者所述预训练模型处理所述待处理数据时生成的参考特征,确定所述多个任务各自的目标私有特征,包括:通过所述适配器中的所述共享投影结构,根据所述待处理数据或者所述参考特征,确定所述参考通用特征;通过所述适配器中的门控结构,根据所述参考通用特征,确定第一子参考通用特征和第二子参考通用特征;通过所述适配器中的每个所述知识提取结构,根据所述第二子参考通用特征,确定所述知识提取结构对应的任务的参考私有特征;针对每个所述任务,根据所述第一子参考通用特征以及所述任务的参考私有特征,确定所述任务的目标私有特征
。3.
根据权利要求2所述的方法,其特征在于,所述通过所述适配器中的所述共享投影结构,根据所述待处理数据或者所述参考特征,确定所述参考通用特征,包括:通过所述共享投影结构中的下采样投影层,对所述待处理数据或者所述参考特征进行下采样处理,得到参考下采样特征;通过所述共享投影结构中的非线性层,对所述参考下采样特征进行非线性变换处理,得到参考变换特征;通过所述共享投影结构中的上采样投影层,对所述参考变换特征进行上采样处理,得到所述参考通用特征
。4.
根据权利要求2所述的方法,其特征在于,所述通过所述适配器中的每个所述知识提取结构,根据所述第二子参考通用特征,确定所述知识提取结构对应的任务的参考私有特征,包括:通过所述知识提取结构中的比例因子,对所述第二子参考通用特征进行缩放处理,得到参考缩放特征;通过所述知识提取结构中的移位因子,对所述参考缩放特征进行移位处理,得到所述任务的参考私有特征
。5.
根据权利要求1至4任一项所述的方法,其特征在于,所述预训练模型中包括多个子
编码结构,所述多任务处理模型中包括所述多个子编码结构各自对应的适配器;所述通过多任务处理模型中的预训练模型,根据所述待处理数据,确定目标通用特征,包括:通过所述预训练模型中的每个所述子编码结构,根据所述子编码结构的输入数据,确定所述子编码结构输出的目标通用特征;所述子编码结构的输入数据为所述待处理数据
、
或者其它所述子编码结构输出的目标通用特征;所述通过所述多任务处理模型中的适配器,根据所述待处理数据或者所述预训练模型处理所述待处理数据时生成的...
【专利技术属性】
技术研发人员:辛毅,杜俊珑,鄢科,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。