基于向量检索和大语言模型的任务型对话方法技术

技术编号：40949895 阅读：3 留言：0更新日期：2024-04-18 20:24

本发明专利技术实施例提供一种基于向量检索和大语言模型的任务型对话方法。该方法包括：接收用户输入的第n对话轮次的语句，根据历史对话数据中第n‑1对话轮次的对话节点，在机器人仓库内查找出第n对话轮次的至少一个期望对话节点，根据期望对话节点确定出对应的期望意图‑语义槽；将期望意图‑语义槽输入至向量检索服务进行相似度检索，获取用于帮助大型语言模型理解任务型对话场景的学习样本；至少将学习样本输入至大语言模型，得到预测意图‑语义槽；通过对话管理引擎根据预测意图‑语义槽以及历史对话数据确定出第n对话轮次的语句的对话反馈。本发明专利技术实施例基于向量检索和大模型的意图、槽位识别，可以准确、人性化的完成任务型对话交互。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及智能领域，尤其涉及一种基于向量检索和大语言模型的任务型对话方法，以及基于向量检索和大语言模型的任务型对话设备、存储介质、计算机程序产品以及电子设备。

技术介绍

1、随着深度学习技术的突破，人工智能成功进入大众视野，改变了人们的日常生活。在智能语音对话中，对话式ai(artificial intelligence，人工智能)技术是必不可少的一环，目前，对话式ai主要应用的场景有三种，分别是闲聊型、问答型和任务型。其中，任务型有以下特点：1、任务型多用于b2c类应用，能够将非结构化数据充分利用起来，沉淀企业知识，是企业数字化转型赛道上的关键技术。2、任务型多轮对话是对话式ai的外延之一，专注于封闭域下的问题解决。3、任务型多轮对话依赖专家经验，需要预先梳理出领域本体结构，用户的意图及每个意图对应的槽位，针对每个任务还需要设计其对应的故事线，因此不同行业、甚至不同公司都需要根据具体情况来定制。

2、在实现任务型多轮对话有以下方案：1、预训练对话模型方案，根据具体业务、具体场景准备训练数据以及语料，通过定义模型的训练任务与损失函数，以决定训练方向从而达到最终的效果，每一个业务、场景都需要定制自己的语料数据和训练。2、硬编码方案，将对话管理模块以编码方式实现，当用户输入信息后，先对输入进行解析，然后将解析出的意图和槽位作为对话管理模块的输入数据，对话管理服务会根据当前的历史状态以及输入信息来判断业务的下一个状态以及输出。3、形式化定义流程方案，将对话管理模块开发为一个对话管理引擎，用形式化定义的方式来描述业务的流

3、在实现本专利技术过程中，专利技术人发现相关技术中至少存在如下问题：

4、1、预训练对话模型方案，在应对不同的场景都需要构建自己的模型。由于任务型多轮对话天生的属性决定的，每个行业、每个场景都会有不同对话流程，如：订餐、订票、送快递、银行催款、营销等每一个场景的对话流程都是完全不一样的，即使同一个场景在不同的公司或不同的运营人员设计出来的对话流程也是不一样的。这就使得预训练对话模型方案不通用，更新、修改不方便，不便于大规模量产使用。且预训练对话模型不可控、逻辑能力差一直以来也是模型的一个通病，模型本身就是黑盒的，无法直接修改逻辑，只能通过大量的数据训练来影响他的结果。

5、2、硬编码方案，会增加代码开发和代码维护工作，并在业务逻辑复杂到一定程度的时候导致代码的可维护性明显降低，甚至崩溃。而且每增加一个场景都需要重新做一套流程，严重影响开发效率。更新、修改都需要开发人员接入并需要升级软件服务，不通用且不便于大规模量产使用。

6、3、形式化定义流程方案，其存在一个缺陷是意图的通用性、准确性和专业性的问题。在定制业务流程时，需要定义很多的意图，而意图一般由统计意图和规则意图两种，统计意图由算法开发人员实现，专业性高，更新复杂；规则意图虽然专业性降低很多，但也还是有一定的门槛，而且泛化能力有限，长期维护还可能会出现规则冲突。如：输入“苹果”的对话，有可能是水果也有可能是公司。要想提高意图识别的准确性就必须把专业的事交给专业的人去做，对技术的要求就会很高。

技术实现思路

1、为了至少解决现有技术中上述说明的任务型多轮对话的通用性、专业性的问题。

2、第一方面，本专利技术实施例提供一种基于向量检索和大语言模型的任务型对话方法，包括：

3、接收用户输入的第n对话轮次的语句，根据历史对话数据中第n-1对话轮次的对话节点，在机器人仓库内查找出所述第n对话轮次的至少一个期望对话节点，根据所述期望对话节点确定出对应的期望意图-语义槽，其中，所述机器人仓库内存储了由推理跳转路径关联的带有意图和语义槽的多个对话节点；

4、将所述期望意图-语义槽输入至向量检索服务进行相似度检索，获取用于帮助大型语言模型理解任务型对话场景的学习样本；

5、至少将所述学习样本、所述第n对话轮次的语句、所述期望意图-语义槽输入至所述大语言模型，得到预测意图-语义槽；

6、通过对话管理引擎根据所述预测意图-语义槽以及所述历史对话数据确定第n对话轮次的对话节点，基于所述第n对话轮次的对话节点确定出所述第n对话轮次的语句的对话反馈。

7、第二方面，本专利技术实施例提供一种基于向量检索和大语言模型的任务型对话设备，包括：

8、期望对话节点确定模块，用于接收用户输入的第n对话轮次的语句，根据历史对话数据中第n-1对话轮次的对话节点，在机器人仓库内查找出所述第n对话轮次的至少一个期望对话节点，根据所述期望对话节点确定出对应的期望意图-语义槽，其中，所述机器人仓库内存储了由推理跳转路径关联的带有意图和语义槽的多个对话节点；

9、学习样本确定模块，用于将所述期望意图-语义槽输入至向量检索服务进行相似度检索，获取用于帮助大型语言模型理解任务型对话场景的学习样本；

10、预测模块，用于至少将所述学习样本、所述第n对话轮次的语句、所述期望意图-语义槽输入至所述大语言模型，得到预测意图-语义槽；

11、任务对话模块，用于通过对话管理引擎根据所述预测意图-语义槽以及所述历史对话数据确定第n对话轮次的对话节点，基于所述第n对话轮次的对话节点确定出所述第n对话轮次的语句的对话反馈。

12、第三方面，提供一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本专利技术任一实施例的基于向量检索和大语言模型的任务型对话方法的步骤。

13、第四方面，本专利技术实施例提供一种存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现本专利技术任一实施例的基于向量检索和大语言模型的任务型对话方法的步骤。

14、第五方面，本专利技术实施例提供一种计算机程序产品，其在存储介质上嵌入有指令，所述指令实现基于向量检索和大语言模型的任务型对话方法的步骤。

15、本专利技术实施例的有益效果在于：本方法基于向量检索和大模型的意图、槽位识别。可以应用于各场景的不同对话流程的任务型对话交互，且可适应不同用户的语言表述，准确的确定任务型对话的意图及语义槽，进而更加准确、人性化的完成任务型对话交互。

本文档来自技高网...

【技术保护点】

1.一种基于向量检索和大语言模型的任务型对话方法，包括：

2.根据权利要求1所述的方法，其中，所述机器人仓库的构建包括：

3.根据权利要求1所述的方法，其中，所述基于所述第n对话轮次的对话节点确定出所述第n对话轮次的语句的对话反馈包括：

4.根据权利要求3所述的方法，其中，所述方法还包括：

5.根据权利要求1所述的方法，其中，所述至少将所述学习样本、所述第n对话轮次的语句、所述期望意图-语义槽输入至所述大语言模型包括：

6.根据权利要求1所述的方法，其中，所述机器人仓库由图形化的流程定制工具构建，包括：

7.一种基于向量检索和大语言模型的任务型对话设备，包括：

8.一种存储介质，其上存储有计算机程序产品，其特征在于，该程序被处理器执行时实现权利要求1-6中任一项所述方法的步骤。

9.一种计算机程序产品，其在存储介质上嵌入有指令，所述指令实现权利要求1-6中任一项所述方法的步骤。

10.一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述

...

【技术特征摘要】