多任务处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36044476 阅读:21 留言:0更新日期:2022-12-21 10:52
本发明专利技术涉及人工智能领域的自然语言处理技术,揭露一种多任务处理方法,包括:利用文本转换模板对训练文本进行格式转换,得到标准训练文本;根据训练文本对应的任务标签确定该训练文本对应的标准训练文本的训练标签;利用标准训练文本及训练标签对预构建的生成模型进行训练,得到多任务模型;当获取待处理任务文本及对应的任务处理类别时,利用任务处理类别筛选文本转换模板对待处理任务文本进行格式转换,得到标准待处理任务文本;利用多任务模型对标准待处理文本进行处理,得到任务处理结果。本发明专利技术还涉及一种区块链技术,所述多任务模型可以存储在区块链节点中。本发明专利技术还提出一种多任务处理装置、设备以及介质。本发明专利技术可以多任务处理的准确率。多任务处理的准确率。多任务处理的准确率。

【技术实现步骤摘要】
多任务处理方法、装置、电子设备及存储介质


[0001]本专利技术涉及人工智能领域的自然语言处理技术,尤其涉及一种多任务处理方法、装置、电子设备及存储介质。

技术介绍

[0002]近年来,随着人工智能的发展,为了提高任务处理的效率,多任务处理研究越来越受到人们的关注。
[0003]多任务处理通常是训练多任务模型实现多任务处理,由于某些任务类型的训练样本数据较少,训练的多任务模型的鲁棒性较差,导致多任务处理的准确率较差。

技术实现思路

[0004]本专利技术提供一种多任务处理方法、装置、电子设备及存储介质,其主要目的在于提高了多任务处理的准确率。
[0005]获取不同任务类别对应的训练文本集,其中,所述训练文本集中每个训练文本都有对应的任务标签;
[0006]获取所述任务类别对应的文本转换模板,利用所述文本转换模板对所述训练文本进行格式转换,得到所述训练文本对应的标准训练文本;
[0007]根据所述训练文本对应的任务标签确定该训练文本对应的标准训练文本的训练标签;
[0008]利用所述标准训练文本及所述训练标签对预构建的生成模型进行训练,得到多任务模型;
[0009]当获取待处理任务文本及对应的任务处理类别时,利用所述任务处理类别筛选所述文本转换模板对所述待处理任务文本进行格式转换,得到标准待处理任务文本;
[0010]利用所述多任务模型对所述标准待处理文本进行处理,得到任务处理结果。
[0011]可选地,所述利用所述文本转换模板对所述训练文本进行格式转换,得到所述训练文本对应的标准训练文本,包括:
[0012]将所述文本转换模板对应的任务类别确定为目标任务类别;
[0013]将所述目标任务类别对应的训练文本集确定为目标训练文本集;
[0014]将所述目标训练文本集中的每个所述训练文本插入所述文本转换模板中,得到每个所述训练文本对应的所述标准训练文本。
[0015]可选地,所述利用所述标准训练文本及所述训练标签对预构建的生成模型进行训练,得到多任务模型,包括:
[0016]将所有所述标准训练文本进行汇总,得到标准训练文本集;
[0017]利用所述生成模型对所述标准训练文本集中的标准训练文本进行特征提取,得到文本特征矩阵;
[0018]利用所述生成模型中的解码器对所述文本特征矩阵进行解码,以将所述文本特征
矩阵映射为文本,得到分析文本;
[0019]基于预设的损失函数,衡量所述文本特征矩阵对应的标准训练文本的训练标签与所述分析文本的差异,得到损失值;
[0020]当所述任务损失值大于或等于所述损失阈值,更新所述生成模型的模型参数,返回所述利用所述生成模型对所述标准训练文本集中的标准训练文本进行特征提取步骤;
[0021]当所述任务损失值小于所述损失阈值,输出生成模型,得到所述多任务模型。
[0022]可选地,所述利用所述生成模型对所述标准训练文本集中的标准训练文本进行特征提取,得到文本特征矩阵,包括:
[0023]选取所述标准训练文本集中任意一条训练文本,得到目标标准训练文本,并将所述标准训练文本集中的目标标准训练文本删除,以得到更新后的标准训练文本集;
[0024]将所述目标标准训练文本进行分词,得到多个分词词语;
[0025]利用所述生成模型中的编码器将所述分词词语转化为向量,得到词语向量;
[0026]将所有所述词语向量按照对应的分词词语在所述目标标准训练文本中的先后顺序进行组合,得到所述文本特征矩阵。
[0027]可选地,所述将所有所述词语向量按照对应的分词词语在所述目标标准训练文本中的先后顺序进行组合,得到所述文本特征矩阵,包括:
[0028]利用预设的位置编码公式计算每个所述分词词语的位置向量;
[0029]将每个所述分词词语的位置向量及词语向量进行组合,得到对应的特征词语向量;
[0030]将所有所述特征词语向量按照对应的分词词语在所述目标标准训练文本中的先后顺序进行组合,得到特征组合矩阵;
[0031]利用基于多头注意力机制构建的注意力机制网络对所述特征组合矩阵进行注意力加权,得到文本特征矩阵。
[0032]可选地,所述利用所述任务处理类别筛选所述文本转换模板对所述待处理任务文本进行格式转换,得到标准待处理任务文本,包括:
[0033]将与所述任务处理类别相同的任务类别确定为目标类别;
[0034]获取所述目标类别对应的标签类型;
[0035]将所述目标类别对应的文本转换模板确定为目标文本转换模板;
[0036]将所述待处理任务文本及所述标签类型插入所述目标文本转换模板,得到所述标准待处理文本。
[0037]为了解决上述问题,本专利技术还提供一种多任务处理装置,所述装置包括:
[0038]文本转换模块,用于获取不同任务类别对应的训练文本集,其中,所述训练文本集中每个训练文本都有对应的任务标签;获取所述任务类别对应的文本转换模板,利用所述文本转换模板对所述训练文本进行格式转换,得到所述训练文本对应的标准训练文本;根据所述训练文本对应的任务标签确定该训练文本对应的标准训练文本的训练标签;
[0039]模型训练模块,用于利用所述标准训练文本及所述训练标签对预构建的生成模型进行训练,得到多任务模型;
[0040]任务处理模块,用于当获取待处理任务文本及对应的任务处理类别时,利用所述任务处理类别筛选所述文本转换模板对所述待处理任务文本进行格式转换,得到标准待处
理任务文本;利用所述多任务模型对所述标准待处理文本进行处理,得到任务处理结果。
[0041]可选地,所述利用所述任务处理类别筛选所述文本转换模板对所述待处理任务文本进行格式转换,得到标准待处理任务文本,包括:
[0042]将与所述任务处理类别相同的任务类别确定为目标类别;
[0043]获取所述目标类别对应的标签类型;
[0044]将所述目标类别对应的文本转换模板确定为目标文本转换模板;
[0045]将所述待处理任务文本及所述标签类型插入所述目标文本转换模板,得到所述标准待处理文本。
[0046]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:
[0047]存储器,存储至少一个计算机程序;及
[0048]处理器,执行所述存储器中存储的计算机程序以实现上述所述的多任务处理方法。
[0049]为了解决上述问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的多任务处理方法。
[0050]本专利技术实施例利用所述文本转换模板对所述训练文本进行格式转换,得到所述训练文本对应的标准训练文本;根据所述训练文本对应的任务标签确定该训练文本对应的标准训练文本的训练标签;利用所述标准训练文本及所述训练标签对预构建的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多任务处理方法,其特征在于,所述方法包括:获取不同任务类别对应的训练文本集,其中,所述训练文本集中每个训练文本都有对应的任务标签;获取所述任务类别对应的文本转换模板,利用所述文本转换模板对所述训练文本进行格式转换,得到所述训练文本对应的标准训练文本;根据所述训练文本对应的任务标签确定该训练文本对应的标准训练文本的训练标签;利用所述标准训练文本及所述训练标签对预构建的生成模型进行训练,得到多任务模型;当获取待处理任务文本及对应的任务处理类别时,利用所述任务处理类别筛选所述文本转换模板对所述待处理任务文本进行格式转换,得到标准待处理任务文本;利用所述多任务模型对所述标准待处理文本进行处理,得到任务处理结果。2.如权利要求1所述的多任务处理方法,其特征在于,所述利用所述文本转换模板对所述训练文本进行格式转换,得到所述训练文本对应的标准训练文本,包括:将所述文本转换模板对应的任务类别确定为目标任务类别;将所述目标任务类别对应的训练文本集确定为目标训练文本集;将所述目标训练文本集中的每个所述训练文本插入所述文本转换模板中,得到每个所述训练文本对应的所述标准训练文本。3.如权利要求1所述的多任务处理方法,其特征在于,所述利用所述标准训练文本及所述训练标签对预构建的生成模型进行训练,得到多任务模型,包括:将所有所述标准训练文本进行汇总,得到标准训练文本集;利用所述生成模型对所述标准训练文本集中的标准训练文本进行特征提取,得到文本特征矩阵;利用所述生成模型中的解码器对所述文本特征矩阵进行解码,以将所述文本特征矩阵映射为文本,得到分析文本;基于预设的损失函数,衡量所述文本特征矩阵对应的标准训练文本的训练标签与所述分析文本的差异,得到损失值;当所述任务损失值大于或等于所述损失阈值,更新所述生成模型的模型参数,返回所述利用所述生成模型对所述标准训练文本集中的标准训练文本进行特征提取步骤;当所述任务损失值小于所述损失阈值,输出生成模型,得到所述多任务模型。4.如权利要求3所述的多任务处理方法,其特征在于,所述利用所述生成模型对所述标准训练文本集中的标准训练文本进行特征提取,得到文本特征矩阵,包括:选取所述标准训练文本集中任意一条训练文本,得到目标标准训练文本,并将所述标准训练文本集中的目标标准训练文本删除,以得到更新后的标准训练文本集;将所述目标标准训练文本进行分词,得到多个分词词语;利用所述生成模型中的编码器将所述分词词语转化为向量,得到词语向量;将所有所述词语向量按照对应的分词词语在所述目标标准训练文本中的先后顺序进行组合,得到所述文本特征矩阵。5.如权利要求4所述的多任务处理方法,其特征在于,所述将所有所述词语向量按照对应的分词词语在所述目标标准训练...

【专利技术属性】
技术研发人员:蒋宏达
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1