一种多任务模型的使用方法及装置制造方法及图纸

技术编号:42091386 阅读:28 留言:0更新日期:2024-07-19 17:05
本申请提供了一种多任务模型的使用方法及装置,所述方法包括:获取多类训练文本集和每类训练文本集对应的任务标签,其中,所述任务标签用于确定模型输出的向量的类型;根据所述多类训练文本集和所述任务标签进行模型训练,得到多任务模型;输入带有掩码标记的第一测试文本至所述多任务模型,得到所述掩码标记对应真实词汇的词汇向量,其中,所述第一测试文本携带有第一任务标签;或,输入完整的第二测试文本至所述多任务模型,得到所述第二测试文本的摘要向量,其中,所述第二测试文本携带有第二任务标签。本申请在得到多种类型向量的情况下提高模型训练效率。

【技术实现步骤摘要】

本申请涉及神经网络,尤其涉及一种多任务模型的使用方法及装置


技术介绍

1、embedding是用来表征文本的常用方法,不同的建模方法得到的embedding效果不同。常用的word2vec模型利用上下文建模得到词向量,因为当上下文接近时,得到的词向量也会接近,因此利用word2vec可以找到一些词性相近但是含义不一定相同的词。同样,利用生成类模型也可以得到词向量或句向量,这种向量获取方式一般是选择模型的某一层的表征,这种建模方式得到的向量,典型特点是可以聚合到含义相同的但词性不一定相同的词。

2、上述两种建模方法分别适用于各自合适的场景,当同时需要上述两种性质(词性相近、含义不一定相同和含义相同、词性不一定相同)的向量时,需要训练两种类型的模型,才能获取到所需的两种向量,但训练两种模型非常耗时。


技术实现思路

1、为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种多任务模型的使用方法及装置。

2、第一方面,本申请提供了一种多任务模型的使用方法,所述方法包括:获取多类本文档来自技高网...

【技术保护点】

1.一种多任务模型的使用方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述多类训练文本集和所述任务标签进行模型训练,得到多任务模型包括:

3.根据权利要求2所述的方法,其特征在于,将所述训练文本中的训练输入文本转化为输入向量数组,并将所述训练文本中的训练输出文本转化为输出向量数组包括:

4.根据权利要求2所述的方法,其特征在于,根据每条训练文本的输入向量数组、输出向量数组以及任务标签,对初始模型进行训练包括:

5.根据权利要求2所述的方法,其特征在于,将验证输入文本和所述验证输入文本的任务标签输入训练完...

【技术特征摘要】

1.一种多任务模型的使用方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述多类训练文本集和所述任务标签进行模型训练,得到多任务模型包括:

3.根据权利要求2所述的方法,其特征在于,将所述训练文本中的训练输入文本转化为输入向量数组,并将所述训练文本中的训练输出文本转化为输出向量数组包括:

4.根据权利要求2所述的方法,其特征在于,根据每条训练文本的输入向量数组、输出向量数组以及任务标签,对初始模型进行训练包括:

5.根据权利要求2所述的方法,其特征在于,将验证输入文本和所述验证输入文本的任务标签输入训练完成的模型,得到每条验证输出文本对应的向量数组的概率包括:

【专利技术属性】
技术研发人员:申利彬
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1