面向多任务对话的大语言模型训练方法和交互方法技术

技术编号:39000321 阅读:14 留言:0更新日期:2023-10-07 10:32
本发明专利技术提供一种面向多任务对话的大语言模型训练方法和交互方法,其中面向多任务对话的大语言模型训练方法包括:获取通用对话数据和任务对话数据,并确定所述任务对话数据对应的任务类别和任务目标;基于所述通用对话数据,对初始大语言模型进行模型微调,得到第一大语言模型;基于所述任务类别和所述任务目标,对所述任务对话数据进行任务标注,得到目标对话数据;基于所述目标对话数据,对所述第一大语言模型进行模型微调,得到大语言模型,不仅在极大程度上保留了模型的闲聊交互能力,还最大限度的提升了模型的任务识别能力和任务执行能力,使其能够具备快速准确地识别任务类别和任务目标的能力,优化了模型性能。优化了模型性能。优化了模型性能。

【技术实现步骤摘要】
面向多任务对话的大语言模型训练方法和交互方法


[0001]本专利技术涉及自然语言处理
,尤其涉及一种面向多任务对话的大语言模型训练方法和交互方法。

技术介绍

[0002]对话系统,作为自然语言处理技术的重要应用之一,其可以学习模仿人与人之间的交流,并据此实现人机交互。目前,对话系统的对话可以分为开放域对话和任务型对话。开放域对话旨在同用户闲聊来达成交互,任务型对话则旨在通过与用户交互完成特定任务。并且,任务型对话较为复杂,为能准确完成任务,通常需要语言理解、对话状态追踪、对话策略学习、回复生成等多个模块进行协同工作。
[0003]然而,大多数传统的任务型对话系统采取流水线式的架构,各个模块之间结构复杂,且过程中错误易累计传播放大,并且在通用领域文本上训练的模型在任务型对话上的效果往往不佳。此外,传统的任务型对话系统往往专注于任务的完成,丧失了闲聊能力,其与用户之间的交互性较弱。进一步地,若任务数量不止一种,则传统的任务型对话系统处理起来会更加复杂。因此,面向多任务对话,并具备一定的闲聊交互能力的交互模型的研究是当下具有重要意义的课题。

技术实现思路

[0004]本专利技术提供一种面向多任务对话的大语言模型训练方法和交互方法,用以解决现有技术中任务型对话系统各模块间结构复杂、易放大错误传播,以及与用户间的交互性较弱的缺陷,实现了交互能力的提升,同时,利用大语言模型的先验知识和推理能力,极大地缩减了训练成本,增加了易用性与可解释性,优化了训练所得模型的性能。
[0005]本专利技术提供一种面向多任务对话的大语言模型训练方法,包括:
[0006]获取通用对话数据和任务对话数据,并确定所述任务对话数据对应的任务类别和任务目标;
[0007]基于所述通用对话数据,对初始大语言模型进行模型微调,得到第一大语言模型;
[0008]基于所述任务类别和所述任务目标,对所述任务对话数据进行任务标注,得到目标对话数据;
[0009]基于所述目标对话数据,对所述第一大语言模型进行模型微调,得到大语言模型。
[0010]根据本专利技术提供的一种面向多任务对话的大语言模型训练方法,所述基于所述任务类别和所述任务目标,对所述任务对话数据进行任务标注,得到目标对话数据,包括:
[0011]在所述任务对话数据为多模态的对话数据的情况下,确定所述任务对话数据中的音频对话数据和/或图像对话数据;
[0012]对所述音频对话数据和/或所述图像对话数据进行转换,得到所述音频对话数据和/或所述图像对话数据对应的语言描述或字符标识;
[0013]以所述语言描述或所述字符标识替换所述任务对话数据中对应的音频对话数据
和/或图像对话数据,并基于所述任务类别和所述任务目标,对替换后的任务对话数据进行任务标注,得到目标对话数据;
[0014]所述多模态包括音频模态、图像模态、文本模态中的至少两种。
[0015]根据本专利技术提供的一种面向多任务对话的大语言模型训练方法,所述基于所述任务类别和所述任务目标,对替换后的任务对话数据进行任务标注,得到目标对话数据,包括:
[0016]确定替换后的任务对话数据中的用户输入语句和模型输出语句;
[0017]基于所述任务类别和所述任务目标,对所述模型输出语句进行任务标注,得到目标输出语句;
[0018]基于所述用户输入语句和所述目标输出语句,确定目标对话数据。
[0019]根据本专利技术提供的一种面向多任务对话的大语言模型训练方法,所述基于所述通用对话数据,对初始大语言模型进行模型微调,得到第一大语言模型,包括:
[0020]确定所述通用对话数据中的用户输入语句和模型输出语句;
[0021]对所述用户输入语句和所述模型输出语句进行分词,得到所述用户输入语句和所述模型输出语句中的各分词;
[0022]对所述用户输入语句和所述模型输出语句分别进行角色标注,得到所述用户输入语句和所述模型输出语句各自对应的角色标识;
[0023]基于所述角色标识,对所述用户输入语句和所述模型输出语句中的各分词进行拼接,得到第一对话数据;
[0024]基于所述第一对话数据,对初始大语言模型进行模型微调,得到第一大语言模型。
[0025]根据本专利技术提供的一种面向多任务对话的大语言模型训练方法,所述确定所述任务对话数据对应的任务类别和任务目标,包括:
[0026]基于所述任务对话数据,进行用户意图识别,得到用户意图;
[0027]基于所述用户意图,以及意图类别映射关系,确定所述任务类别;
[0028]基于所述任务对话数据,进行任务内容提取,得到关键内容;
[0029]基于所述关键内容,以及所述任务类别,确定所述任务目标。
[0030]本专利技术还提供一种交互方法,应用于大语言模型,包括:
[0031]获取用户输入信息,并确定所述用户输入信息中各任务的任务类别和任务目标;基于所述各任务的任务类别和任务目标,从所述各任务中筛选与大语言模型相匹配的第一任务和不相匹配的第二任务;
[0032]基于所述第一任务的任务类别和任务目标,确定第一交互信息;
[0033]基于所述第二任务的任务类别和任务目标,生成调用指令,并将所述调用指令发送至所述第二任务对应的任务模型,以请求所述任务模型基于所述调用指令,确定第二交互信息;
[0034]接收所述任务模型返回的所述第二交互信息,展示所述第一交互信息和所述第二交互信息;所述大语言模型是基于如上述任一项所述的面向多任务对话的大语言模型训练方法训练得到的。
[0035]本专利技术还提供一种面向多任务对话的大语言模型训练装置,包括:
[0036]数据获取单元,用于获取通用对话数据和任务对话数据,并确定所述任务对话数
据对应的任务类别和任务目标;
[0037]通用训练单元,用于基于所述通用对话数据,对初始大语言模型进行模型微调,得到第一大语言模型;
[0038]任务标注单元,用于基于所述任务类别和所述任务目标,对所述任务对话数据进行任务标注,得到目标对话数据;
[0039]任务训练单元,用于基于所述目标对话数据,对所述第一大语言模型进行模型微调,得到大语言模型。
[0040]本专利技术还提供一种交互装置,应用于大语言模型,包括:
[0041]任务筛选单元,用于获取用户输入信息,并确定所述用户输入信息中各任务的任务类别和任务目标;基于所述各任务的任务类别和任务目标,从所述各任务中筛选与大语言模型相匹配的第一任务和不相匹配的第二任务;
[0042]第一确定单元,用于基于所述第一任务的任务类别和任务目标,确定第一交互信息;
[0043]第二确定单元,用于基于所述第二任务的任务类别和任务目标,生成调用指令,并将所述调用指令发送至所述第二任务对应的任务模型,以请求所述任务模型基于所述调用指令,确定第二交互信息;
[0044]信息展示单元,用于接收所述任务模型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向多任务对话的大语言模型训练方法,其特征在于,包括:获取通用对话数据和任务对话数据,并确定所述任务对话数据对应的任务类别和任务目标;基于所述通用对话数据,对初始大语言模型进行模型微调,得到第一大语言模型;基于所述任务类别和所述任务目标,对所述任务对话数据进行任务标注,得到目标对话数据;基于所述目标对话数据,对所述第一大语言模型进行模型微调,得到大语言模型。2.根据权利要求1所述的面向多任务对话的大语言模型训练方法,其特征在于,所述基于所述任务类别和所述任务目标,对所述任务对话数据进行任务标注,得到目标对话数据,包括:在所述任务对话数据为多模态的对话数据的情况下,确定所述任务对话数据中的音频对话数据和/或图像对话数据;对所述音频对话数据和/或所述图像对话数据进行转换,得到所述音频对话数据和/或所述图像对话数据对应的语言描述或字符标识;以所述语言描述或所述字符标识替换所述任务对话数据中对应的音频对话数据和/或图像对话数据,并基于所述任务类别和所述任务目标,对替换后的任务对话数据进行任务标注,得到目标对话数据;所述多模态包括音频模态、图像模态、文本模态中的至少两种。3.根据权利要求2所述的面向多任务对话的大语言模型训练方法,其特征在于,所述基于所述任务类别和所述任务目标,对替换后的任务对话数据进行任务标注,得到目标对话数据,包括:确定替换后的任务对话数据中的用户输入语句和模型输出语句;基于所述任务类别和所述任务目标,对所述模型输出语句进行任务标注,得到目标输出语句;基于所述用户输入语句和所述目标输出语句,确定目标对话数据。4.根据权利要求1至3中任一项所述的面向多任务对话的大语言模型训练方法,其特征在于,所述基于所述通用对话数据,对初始大语言模型进行模型微调,得到第一大语言模型,包括:确定所述通用对话数据中的用户输入语句和模型输出语句;对所述用户输入语句和所述模型输出语句进行分词,得到所述用户输入语句和所述模型输出语句中的各分词;对所述用户输入语句和所述模型输出语句分别进行角色标注,得到所述用户输入语句和所述模型输出语句各自对应的角色标识;基于所述角色标识,对所述用户输入语句和所述模型输出语句中的各分词进行拼接,得到第一对话数据;基于所述第一对话数据,对初始大语言模型进行模型微调,得到第一大语言模型。5.根据权利要求1至3中任一项所述的面向多任务对话的大语言模型训练方法,其特征在于,所述确定所述任务对话数据对应的任务类别和任务目标,包括:基于所述任务对话数据,进行用户意图识别,得到用户意图;
基于所述用户意图,以及意图类别映射关系,确定所述任务类别;基于所述任务对话数据,进行任务内容提取,得到关...

【专利技术属性】
技术研发人员:张家俊彭天宇宗成庆
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1