一种意图识别和问答方法技术

技术编号:39715623 阅读:7 留言:0更新日期:2023-12-17 23:23
本发明专利技术公开了一种意图识别和问答方法

【技术实现步骤摘要】
一种意图识别和问答方法、装置、电子设备及存储介质


[0001]本专利技术涉及自然语言处理
,尤其涉及一种意图识别和问答方法

装置

电子设备及存储介质


技术介绍

[0002]目前存在以大语言模型(
Large Language Model

LLM
)为基础的知识问答系统,其中一类方法尝试首先利用
LLM
对已有信息提取抽象特征生成向量表达,并存入数据库;之后利用
LLM
对用户问题提取特征生成向量表达,通过向量召回的方式搜索数据库中与问题匹配的内容最后利用
LLM
处理问题和搜索结果得到相应答案

[0003]该方案存在以下问题:使用场景中用户问题格式多样,向量召回准确率下降;使用场景中用户提出跨主题问题,该方案召回内容与问题不匹配;复杂问题大模型推理过程与推理结论不匹配

[0004]因此,如何提高复杂问题的回答准确率是目前亟待解决的技术问题


技术实现思路

[0005]本专利技术提供了一种意图识别和问答方法

装置

电子设备及存储介质,以实现对复杂问题的准确回答,减少用户提问方式的限制,提高问答系统的鲁棒性

[0006]根据本专利技术的一方面,提供了一种意图识别和问答方法,包括:基于待回答问题对应的本地知识生成图结构数据,基于所述图结构数据构建本地知识库,并生成所述本地知识库的图结构信息;根据所述图结构信息,通过大语言模型构建所述待回答问题对应的思维链;基于所述思维链在所述本地知识库中执行图查询,得到所述待回答问题的回答结果

[0007]根据本专利技术的另一方面,提供了一种意图识别和问答装置,包括:知识库构建模块,用于基于待回答问题对应的本地知识生成图结构数据,基于所述图结构数据构建本地知识库,并生成所述本地知识库的图结构信息;思维链确定模块,用于根据所述图结构信息,通过大语言模型构建所述待回答问题对应的思维链;图查询模块,用于基于所述思维链在所述本地知识库中执行图查询,得到所述待回答问题的回答结果

[0008]根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的意图识别和问答方法

[0009]根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的意图识别和问答方法

[0010]本专利技术实施例的技术方案,通过待回答问题对应的本地知识生成图结构数据,基于图结构数据构建本地知识库,并生成本地知识库的图结构信息;根据图结构信息,通过大语言模型构建待回答问题对应的思维链;基于思维链在本地知识库中执行图查询,得到待回答问题的回答结果

解决了现有的知识问答系统,当用户问题格式多样时,向量召回准确率下降的问题;在用户提出跨主题问题,召回内容与问题不匹配的问题;以及,复杂问题大模型推理过程与推理结论不匹配的问题,实现了减少用户提问方式的限制,提高知识问答系统的鲁棒性,以及对复杂问题的理解与推理总结准确率

[0011]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围

本专利技术的其它特征将通过以下的说明书而变得容易理解

附图说明
[0012]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0013]图1为本专利技术实施例提供了一种意图识别和问答方法的流程图;图2为本专利技术又一实施例提供的一种意图识别和问答方法的流程图;图3为本专利技术又一实施例提供的一种问答流程图;图4为本专利技术实施例提供的一种意图识别和问答装置的结构示意图;图5为实施本专利技术的实施例的电子设备的结构示意图

具体实施方式
[0014]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例

基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围

[0015]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序

应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施

此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程

方法

系统

产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程

方法

产品或设备固有的其它步骤或单元

[0016]为进一步明确本专利技术的技术效果,在引入具体实施例之前,对现有技术进一步做如下说明:
目前存在以
LLM
为基础的知识问答系统,该系统首先利用
LLM
对已有信息提取抽象特征生成向量表达,并存入数据库;之后利用
LLM
对用户问题提取特征生成向量表达,通过向量召回的方式搜索数据库中与问题匹配的内容;最后利用
LLM
处理问题和搜索结果,得到相应答案

该方案存在以下问题:使用场景中用户问题格式多样,向量召回准确率下降

例如,当用户问题为:一周前买了马拉松跑鞋,收到货之后发现存在质量问题,怀疑是假货;和商家沟通后,商家认为买家掉包了,该怎么办
。LLM
基于用户问题文本进行特征提取生成向量表达式,在数据库中查找匹配的相似特征向量以及将相似特征向量对应的文本作为搜索结果;进而将用户问题和搜索结果作为
LLM
的输入,得到与用户问题对应的答案

然而,在提取特征向量的过程中,由于提取的是整个问题文本对应的向量特征,实际上仅需提取“遇到假货该怎么办”这一文本的向量特征;也即,用户问题对应的特征向量中存在干扰信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种意图识别和问答方法,其特征在于,包括:基于待回答问题对应的本地知识生成图结构数据,基于所述图结构数据构建本地知识库,并生成所述本地知识库的图结构信息;根据所述图结构信息,通过大语言模型构建所述待回答问题对应的思维链;基于所述思维链在所述本地知识库中执行图查询,得到所述待回答问题的回答结果
。2.
根据权利要求1所述的方法,其特征在于,所述基于待回答问题对应的本地知识生成图结构数据,基于所述图结构数据构建本地知识库,包括:获取待回答问题对应的本地文档,将所述本地文档解析得到图结构数据,并将所述图结构数据存储到图数据库中,以得到所述本地知识库;其中,所述待回答问题与所述本地文档的领域相对应
。3.
根据权利要求1所述的方法,其特征在于,所述根据所述图结构信息,通过大语言模型构建所述待回答问题对应的思维链,包括:根据所述图结构信息,通过大语言模型将所述待回答问题拆分为多个子问题;针对每个所述子问题,根据所述图结构信息,通过大语言模型生成所述子问题对应的思维子链
。4.
根据权利要求3所述的方法,其特征在于,所述根据所述图结构信息,通过大语言模型将所述待回答问题拆分为多个子问题,包括:基于引导工程中的问题拆分引导信息,引导所述大语言模型,按照所述图结构信息,将所述待回答问题拆分成为多个所述子问题;其中,所述待回答问题的意图和多个所述子问题的意图一致
。5.
根据权利要求4所述的方法,其特征在于,所述针对每个所述子问题,根据所述图结构信息,通过大语言模型生成所述子问题对应的思维子链,包括:基于所述引导工程中的思维链生成引导信息,引导所述大语言模型,按照所述图结构信息,生成与所述子问题对应的思维子链
。6...

【专利技术属性】
技术研发人员:韩纪飞高雪峰仲光庆杨成虎
申请(专利权)人:北京枫清科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1