具有认知推理能力的问答交互模型的构建方法及应用技术

技术编号:39316634 阅读:8 留言:0更新日期:2023-11-12 15:59
本发明专利技术提供一种具有认知推理能力的问答交互模型的构建方法及应用,构建认知推理框架,将认知推理框架作用于基于LLM的问答模型上;认知推理框架的意图学习模块内构建意图学习库,意图学习库包括构建好的问题类别识别模型以及意图识别模板,其中问题类型识别模型将输入的问题文本映射为用问题意图类型表示的多维向量,意图识别模板内记录问题意图类型及对应的意图指令,采用标记已知问题意图类型的问题文本对意图学习库进行训练学习;所述推理模块内记录对应不同思维模式的思维模板,其中每一思维模板以数学形式记录当前思维模式的推理过程,通过认知推理框架提高基于LLM的问答系统的认知推理能力,使其在应对复杂问题时可以给出更准确的回答。可以给出更准确的回答。可以给出更准确的回答。

【技术实现步骤摘要】
具有认知推理能力的问答交互模型的构建方法及应用


[0001]本申请涉及大数据模型领域,特别是涉及一种具有认知推理能力的问答交互模型的构建方法及应用。

技术介绍

[0002]大语言模型(LLM)是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或者理解语言文本的含义,进而实现处理类似于文本分类、问答及对话等自然对话任务的效果。大语言模型最大的特点优势是能够自动从大量文本数据中学习语言知识,避免了手动特征工程的繁琐过程,即可以在不需要大量人工标注的情况下,让大语言模型进行自动学习和推理。
[0003]问答系统是大语言模型的流行应用之一,使用户能够使用自然语言直接和计算机进行交互以快速获取准确的答案。然而目前基于大语言模型的问答系统对于复杂的自然语言理解能力不足,特别是存在语言歧义以及存在大量上下文的自然语言问题,以及在面对复杂问题时也缺乏深入推理和复杂推断的能力,导致其难以准确地理解问题导致其给出的答案同人类给出的答案存在偏差,究其根本是由于现有技术的基于LLM的大语言模型缺乏强大的认知推理能力。

技术实现思路

[0004]本申请实施例提供了一种具有认知推理能力的问答交互模型的构建方法及应用,在传统的大语言模型基础上引入了具有意图增强能力、记忆能力以及推理能力的认知推理框架,以使得训练得到的问答交互模型具有认知推理能力以解决复杂的推理问题,提高问答交互模型的智能水平和实用性。
[0005]第一方面,本申请实施例提供了一种一种具有认知推理能力的问答交互模型的构建方法,包括以下步骤:
[0006]构建认知推理框架,将所述认知推理框架作用于基于LLM的问答模型上;
[0007]所述认知推理框架包括意图学习模块、推理模块以及选择模块,其中所述意图学习模块内构建意图学习库,所述意图学习库包括构建好的问题类别识别模型以及意图识别模板,其中所述问题类型识别模型将输入的问题文本映射为用问题意图类型表示的多维向量,所述意图识别模板内记录解决问题的意图指令,采用标记已知问题意图类型的问题文本对意图学习库进行训练学习;所述推理模块内记录对应不同思维模式的思维模板,其中每一思维模板以数学形式记录当前思维模式的推理过程;
[0008]将提问问题通过意图学习模块转换为带有问题意图类型提示的意图提问,并带有问题意图类型提示的意图提问输入基于LLM的问答模型获取不同思维模式下的推理答案,其中基于LLM的问答模型采用推理模块记录的思维模板以及意图学习库的意图识别模板进行学习;所述选择模块剔除多个推理答案中的错误答案后筛选优选答案作为针对提问问题的回答。
[0009]第二方面,本申请实施例提供了一种具有认知推理能力的问答交互模型的应用方法,用户将提问问题输入到具有认知推理能力的问答交互模型的构建方法构建得到的具有认知推理能力的问答交互模型中得到回答。
[0010]第三方面,本申请实施例提供了一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述的具有认知推理能力的问答交互模型的构建方法。
[0011]第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序包括用于控制过程以执行过程的程序代码,所述过程包括任一所述的具有认知推理能力的问答交互模型的构建方法。
[0012]本专利技术的主要贡献和创新点如下:
[0013]本申请实施例提供了一种具有认知推理能力的问答交互模型的构建方法及应用,该方案构建了具有认知推理能力的认知推理框架,并将该认知推理框架赋予给基于LLM的问答模型中,以提高基于LLM的问答模型的认知推理能力,使得得到的具有认知推理能力的问答交互模型在面对复杂、需要推理的问题时也能得到准确的回答;且该认知框架的内容便于调整和训练以得到不同训练需求的问答交互模型。
[0014]本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
[0015]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0016]图1是本方案的一种具有认知推理能力的问答交互模型的构建方法的流程示意图;
[0017]图2是不同思维方式的推理过程示意图;
[0018]图3是本方案的认知推理框架的示意图;
[0019]图4是根据本申请实施例的电子装置的硬件结构示意图。
具体实施方式
[0020]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
[0021]需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
[0022]实施例一
[0023]本方案提供了一种具有认知推理能力的问答交互模型的构建方法,通过认知推理框架的意图增强、记忆、推理能力将类似于人类的认知推理能力应用在基于LLM的问答模型中构建问题交互模型,使得问题交互模型可以具有认知推理能力以像人类一样解决提问问题得到准确的回答答案,提高了问题交互模型的智能水平和实用性。
[0024]以“商店销售某种商品,打八折销售时卖2件的利润与按定价销售时卖1件的利润相同,相当于降价120元/件销售时卖3件的利润。问该商品的定价为多少元/件”的问题为例,现有技术的基于LLM的问答模型的解答逻辑如下;“设该商品的定价为X元/件。根据题意,打八折销售时卖2件的利润与按定价销售时卖1件的利润相同,可以列出以下等式:2*(X*0.8)

X=X;化简得:1.6X

X=X;0.6X=X;0.6X

X=0;

0.4X=0,则计算得到利润为0,;再按照降价120元/件销售时卖3件的利润等于按定价销售时卖1件的利润,可以列出以下等式:3*(X

120)

X=0;化简得:3X

360

X=0;2X

360=0;2X=360;X=180;因此,该商品的定价为180元/件,该商品的定价为180元/件”,然而现有技术的基于LLM的问答模型混淆了“售价”和“利润”的概念,其并没有“成本”的概念,进而导致其回答的答案出现了问题。...

【技术保护点】

【技术特征摘要】
1.一种具有认知推理能力的问答交互模型的构建方法,其特征在于,包括以下步骤:构建认知推理框架,将所述认知推理框架作用于基于LLM的问答模型上;所述认知推理框架包括意图学习模块、推理模块以及选择模块,其中所述意图学习模块内构建意图学习库,所述意图学习库包括构建好的问题类别识别模型以及意图识别模板,其中所述问题类型识别模型将输入的问题文本映射为用问题意图类型表示的多维向量,所述意图识别模板内记录解决问题的意图指令,采用标记已知问题意图类型的问题文本对意图学习库进行训练学习;所述推理模块内记录对应不同思维模式的思维模板,其中每一思维模板以数学形式记录当前思维模式的推理过程;将提问问题通过意图学习模块转换为带有问题意图类型提示的意图提问,并带有问题意图类型提示的意图提问输入基于LLM的问答模型获取不同思维模式下的推理答案,其中基于LLM的问答模型采用推理模块记录的思维模板以及意图学习库的意图识别模板进行学习;所述选择模块剔除多个推理答案中的错误答案后筛选优选答案作为针对提问问题的回答。2.根据权利要求1所述的具有认知推理能力的问答交互模型的构建方法,其特征在于,在“所述问题类型识别模型将输入的问题文本映射为用问题意图类型表示的多维向量”步骤中,将提问问题的问题文本映射为该提问问题的n维向量,其中n维向量上对应该提问问题的问题意图类型的值表示为1,其余问题意图类型的值表示为0。3.根据权利要求1所述的具有认知推理能力的问答交互模型的构建方法,其特征在于,意图学习模块进一步包括状态会话模型,所述状态会话模型存储用户最近几次的提问问题及问答交互模型给出的优选答案作为历史状态,将当前提问问题输入到状态会话模型中得到增强当前提问问题得到新的提问问题,新的提问问题依旧是通过意图学习模块转换为带有问题意图类型提示的意图提问。4.根据权利要求3所述的具有认知推理能力的问答交互模型的构建方法,其特征在于,获取提问问题,当提问问题不超过设定字数或者满足约束条件时将提...

【专利技术属性】
技术研发人员:方敏刘军许振影张旷方震宇付超应晶
申请(专利权)人:浙江一山智慧医疗研究有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1