面向多任务对话的大语言模型训练方法和交互方法技术

技术编号：39000321 阅读：14 留言：0更新日期：2023-10-07 10:32

本发明专利技术提供一种面向多任务对话的大语言模型训练方法和交互方法，其中面向多任务对话的大语言模型训练方法包括：获取通用对话数据和任务对话数据，并确定所述任务对话数据对应的任务类别和任务目标；基于所述通用对话数据，对初始大语言模型进行模型微调，得到第一大语言模型；基于所述任务类别和所述任务目标，对所述任务对话数据进行任务标注，得到目标对话数据；基于所述目标对话数据，对所述第一大语言模型进行模型微调，得到大语言模型，不仅在极大程度上保留了模型的闲聊交互能力，还最大限度的提升了模型的任务识别能力和任务执行能力，使其能够具备快速准确地识别任务类别和任务目标的能力，优化了模型性能。优化了模型性能。优化了模型性能。

全部详细技术资料下载

【技术实现步骤摘要】
面向多任务对话的大语言模型训练方法和交互方法

[0001]本专利技术涉及自然语言处理
，尤其涉及一种面向多任务对话的大语言模型训练方法和交互方法。

技术介绍

[0002]对话系统，作为自然语言处理技术的重要应用之一，其可以学习模仿人与人之间的交流，并据此实现人机交互。目前，对话系统的对话可以分为开放域对话和任务型对话。开放域对话旨在同用户闲聊来达成交互，任务型对话则旨在通过与用户交互完成特定任务。并且，任务型对话较为复杂，为能准确完成任务，通常需要语言理解、对话状态追踪、对话策略学习、回复生成等多个模块进行协同工作。
[0003]然而，大多数传统的任务型对话系统采取流水线式的架构，各个模块之间结构复杂，且过程中错误易累计传播放大，并且在通用领域文本上训练的模型在任务型对话上的效果往往不佳。此外，传统的任务型对话系统往往专注于任务的完成，丧失了闲聊能力，其与用户之间的交互性较弱。进一步地，若任务数量不止一种，则传统的任务型对话系统处理起来会更加复杂。因此，面向多任务对话，并具备一定的闲聊交互能力的交互模型的研究是当下具有重要意义的课题。

技术实现思路

[0004]本专利技术提供一种面向多任务对话的大语言模型训练方法和交互方法，用以解决现有技术中任务型对话系统各模块间结构复杂、易放大错误传播，以及与用户间的交互性较弱的缺陷，实现了交互能力的提升，同时，利用大语言模型的先验知识和推理能力，极大地缩减了训练成本，增加了易用性与可解释性，优化了训练所得模型的性能。
[0005]本专利技术提...

【技术保护点】

【技术特征摘要】
1.一种面向多任务对话的大语言模型训练方法，其特征在于，包括：获取通用对话数据和任务对话数据，并确定所述任务对话数据对应的任务类别和任务目标；基于所述通用对话数据，对初始大语言模型进行模型微调，得到第一大语言模型；基于所述任务类别和所述任务目标，对所述任务对话数据进行任务标注，得到目标对话数据；基于所述目标对话数据，对所述第一大语言模型进行模型微调，得到大语言模型。2.根据权利要求1所述的面向多任务对话的大语言模型训练方法，其特征在于，所述基于所述任务类别和所述任务目标，对所述任务对话数据进行任务标注，得到目标对话数据，包括：在所述任务对话数据为多模态的对话数据的情况下，确定所述任务对话数据中的音频对话数据和/或图像对话数据；对所述音频对话数据和/或所述图像对话数据进行转换，得到所述音频对话数据和/或所述图像对话数据对应的语言描述或字符标识；以所述语言描述或所述字符标识替换所述任务对话数据中对应的音频对话数据和/或图像对话数据，并基于所述任务类别和所述任务目标，对替换后的任务对话数据进行任务标注，得到目标对话数据；所述多模态包括音频模态、图像模态、文本模态中的至少两种。3.根据权利要求2所述的面向多任务对话的大语言模型训练方法，其特征在于，所述基于所述任务类别和所述任务目标，对替换后的任务对话数据进行任务标注，得到目标对话数据，包括：确定替换后的任务对话数据中的用户输入语句和模型输出语句；基于所述任务类别和所述任务目标，对所述模型输出语句进行任务标注，得到目标输出语句；基于所述用户输入语句和所述目标输出语句，确定目标对话数据。4.根据权利要求1至3中任一项所述的面向多任务对话的大语言模型训练方法，其特征在于，所述基于所述通用对话数据，对初始大语言模型进行模型微调，得到第一大语言模型，包括：确定所述通用对话数据中的用户输入语句和模型输出语句；对所述用户输入语句和所述模型输出语句进行分词，得到所述用户输入语句和所述模型输出语句中的各分词；对所述用户输入语句和所述模型输出语句分别进行角色标注，得到所述用户输入语句和所述模型输出语句各自对应的角色标识；基于所述角色标识，对所述用户输入语句和所述模型输出语句中的各分词进行拼接，得到第一对话数据；基于所述第一对话数据，对初始大语言模型进行模型微调，得到第一大语言模型。5.根据权利要求1至3中任一项所述的面向多任务对话的大语言模型训练方法，其特征在于，所述确定所述任务对话数据对应的任务类别和任务目标，包括：基于所述任务对话数据，进行用户意图识别，得到用户意图；
基于所述用户意图，以及意图类别映射关系，确定所述任务类别；基于所述任务对话数据，进行任务内容提取，得到关...

【专利技术属性】
技术研发人员：张家俊，彭天宇，宗成庆，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人