当前位置: 首页 > 专利查询>清华大学专利>正文

大语言模型驱动的开放域自然语言推理问答系统及方法技术方案

技术编号:39178014 阅读:12 留言:0更新日期:2023-10-27 08:25
本发明专利技术提供一种大语言模型驱动的开放域自然语言推理问答系统及方法,问题改写模块将用户问题改写为改写问题;中心计算和管理模块管理大语言模型的计算和知识资源,根据改写问题的类型将改写问题和问题核心引擎模块所需的大语言模型的计算和知识资源输出至问答核心引擎模块中的一个或多个子问答模块;问答核心引擎模块根据改写问题和大语言模型的计算和知识资源推理得到一个或多个改写问题的候选答案和候选答案的可解释性说明信息;聚合推理模块根据一个或多个改写问题的候选答案和候选答案的可解释性说明信息聚合推理得到改写问题的最终答案和最终答案的可解释性说明信息,采用大语言模型支撑,支持问题类型全面、易扩展、可解释且通用性强。可解释且通用性强。可解释且通用性强。

【技术实现步骤摘要】
大语言模型驱动的开放域自然语言推理问答系统及方法


[0001]本专利技术涉及自然语言处理
,尤其涉及一种大语言模型驱动的开放域自然语言推理问答系统及方法。

技术介绍

[0002]随着互联网的发展以及数字信息爆炸式增长,如何提高智能问答的高效性和准确性成为一个研究热点。智能问答(Question Answering,QA)旨在为用户提出的自然语言问题自动提供答案,是自然语言处理(Nature Language Processing,NLP)领域最具代表性的任务之一。通过统一任务学习或指令学习等技术,各种NLP任务都可以统一成问答任务,目前已经成为NLP发展的重要趋势。
[0003]现有的开放域自然语言推理问答系统一般包括三个阶段:问题分析、知识检索和答案生成,但是存在推理类型支持覆盖度低、可扩展性差、可解释性弱等问题。目前开放域对话大语言模型ChatGPT,由于不能利用大规模结构化知识图谱、外部文本资源(包括本地和互联网文本资源)等信息进行知识推理和问题回答,仍然存在信息时效性弱、不可信等问题,特别是在处理领域专业任务。

技术实现思路

[0004]本专利技术提供一种大语言模型驱动的开放域自然语言推理问答系统及方法,用以解决现有技术的问答系统存在推理类型支持覆盖度低、可扩展性差、可解释性弱等缺陷,采用大语言模型支撑,支持问题类型全面、易扩展、可解释且通用性强。
[0005]本专利技术提供一种大语言模型驱动的开放域自然语言推理问答系统,包括问题改写模块、中心计算和管理模块、问答核心引擎模块和聚合推理模块;所述问答核心引擎模块包括多个子问答模块,多个所述子问答模块的问题推理逻辑不同;所述问题改写模块的输出端与所述中心计算和管理模块的输入端连接,用于对用户问题进行改写,得到改写问题;所述中心计算和管理模块的输出端与所述问答核心引擎模块的输入端连接,用于管理所述大语言模型的计算和知识资源,并根据所述改写问题的类型将所述改写问题和所述问题核心引擎模块所需的所述大语言模型的计算和知识资源输出至所述问答核心引擎模块中的一个或多个所述子问答模块;所述问答核心引擎模块的输出端与所述聚合推理模块的输入端连接,用于根据所述改写问题和所述大语言模型的计算和知识资源推理得到一个或多个所述改写问题的候选答案和所述候选答案的可解释性说明信息;所述聚合推理模块用于根据一个或多个所述改写问题的候选答案和所述候选答案的可解释性说明信息聚合推理得到所述改写问题的最终答案和所述最终答案的可解释性说明信息。
[0006]根据本专利技术提供的一种大语言模型驱动的开放域自然语言推理问答系统,还包括:输入端与所述聚合推理模块的输出端连接的回复生成模块,用于对所述改写问题的最终答案和所述最终答案的可解释性说明信息进行机器回复转换,得到所述用户问题的回复答案和所述回复答案的可解释性说明信息;与所述回复生成模块连接的对话交互模块,用
于根据所述用户问题的回复答案和所述回复答案的可解释性说明信息与所述用户问题进行对话交互。
[0007]根据本专利技术提供的一种大语言模型驱动的开放域自然语言推理问答系统,所述问题改写模块具体用于根据历史问答数据对所述用户问题进行指代消解或省略消解以得到改写问题,并在所述改写问题与所述用户问题相同时不触发改写提示,在所述改写问题与所述用户问题不相同时触发改写提示,供用户选择。
[0008]根据本专利技术提供的一种大语言模型驱动的开放域自然语言推理问答系统,所述中心计算和管理模块包括:知识图谱库管理模块,用于提供知识图谱库的知识查询和推理执行;文本资源库管理模块,用于提供本地文本资源库的文本查询支持;大语言模型计算与管理模块,用于提供大语言模型库和大语言模型任务适配的少量微调参数库的模型计算和任务适配支持;管理中枢模块,用于根据多个所述子问答模块对所述知识图谱库、本地文本资源库、所述大语言模型库和所述大语言模型任务适配的少量微调参数库的需求进行调度,并根据所述改写问题的类型从多个所述子问答模块中选择一个或多个所述子问答模块对所述改写问题进行推理,以得到一个或多个所述改写问题的候选答案和所述候选答案的可解释性说明信息。
[0009]根据本专利技术提供的一种大语言模型驱动的开放域自然语言推理问答系统,所述聚合推理模块具体用于基于得分融合机制、用户反馈的优化机制和迭代综合推理机制从一个或多个所述改写问题的候选答案和所述候选答案的可解释性说明信息中聚合推理得到所述改写问题的最终答案和所述最终答案的可解释性说明信息。
[0010]根据本专利技术提供的一种大语言模型驱动的开放域自然语言推理问答系统,所述多个子问答模块包括:知识库问答模块,用于根据大规模知识图谱推理得到所述改写问题的候选答案和所述候选答案的可解释性说明信息;阅读理解问答模块,用于根据本地收集文本和/或在线互联网检索文本推理得到所述改写问题的候选答案和所述候选答案的可解释性说明信息;大语言模型问答模块,用于根据大语言模型内部的语言学知识、常识知识和事实知识推理得到所述改写问题的候选答案和所述候选答案的可解释性说明信息。
[0011]根据本专利技术提供的一种大语言模型驱动的开放域自然语言推理问答系统,所述知识库问答模块包括:基于实体链接与实体替换的语义解析模块,用于识别所述改写问题中的实体,并将所述实体替换,将所述改写问题的语义解析映射为支持神经

符号混合推理的逻辑表达式执行模块可执行的逻辑表达式;所述支持神经

符号混合推理的逻辑表达式执行模块用于基于所述逻辑表达式从结构化知识库或非结构化文本库中查询信息以推理得到所述改写问题的候选答案和所述候选答案的可解释性说明信息。
[0012]根据本专利技术提供的一种大语言模型驱动的开放域自然语言推理问答系统,所述阅读理解问答模块包括:证据检索模块,用于检索本地文本数据和互联网数据,得到证据候选;知识推理模型,用于根据所述证据候选推理得到所述改写问题的候选答案和所述候选答案的可解释性说明信息。
[0013]根据本专利技术提供的一种大语言模型驱动的开放域自然语言推理问答系统,所述大语言模型问答模块包括:基于知识探测的答案生成模块,用于以非自回归的生成式预训练语言模型作为大语言模型,通过可插拔少量参数高效学习技术进行答案生成任务适配;基于示范的解释生成模块,用于基于所述答案生成任务适配,以生成式大语言模型作为大语
言模型进行示例构建和大语言模型解释生成,以推理得到所述改写问题的候选答案和所述候选答案的可解释性说明信息;所述大语言模型问答模块还用于根据预设立场反驳机制判断所述改写问题是否为预设立场问题和生成大语言模型反驳解释。
[0014]本专利技术还提供一种大语言模型驱动的开放域自然语言推理问答方法,该方法适用上述的大语言模型驱动的开放域自然语言推理问答系统,包括:所述问题改写模块对用户问题进行改写,得到改写问题;所述中心计算和管理模块根据所述改写问题的类型将所述改写问题和所述问题核心引擎模块所需的所述大语言模型的计算和知识资源输出至所述问答核心引擎模块中的一个或多个所述子问答模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种大语言模型驱动的开放域自然语言推理问答系统,其特征在于,包括问题改写模块、中心计算和管理模块、问答核心引擎模块和聚合推理模块;所述问答核心引擎模块包括多个子问答模块,多个所述子问答模块的问题推理逻辑不同;所述问题改写模块的输出端与所述中心计算和管理模块的输入端连接,用于对用户问题进行改写,得到改写问题;所述中心计算和管理模块的输出端与所述问答核心引擎模块的输入端连接,用于管理所述大语言模型的计算和知识资源,并根据所述改写问题的类型将所述改写问题和所述问题核心引擎模块所需的所述大语言模型的计算和知识资源输出至所述问答核心引擎模块中的一个或多个所述子问答模块;所述问答核心引擎模块的输出端与所述聚合推理模块的输入端连接,用于根据所述改写问题和所述大语言模型的计算和知识资源推理得到一个或多个所述改写问题的候选答案和所述候选答案的可解释性说明信息;所述聚合推理模块用于根据一个或多个所述改写问题的候选答案和所述候选答案的可解释性说明信息聚合推理得到所述改写问题的最终答案和所述最终答案的可解释性说明信息。2.根据权利要求1所述的大语言模型驱动的开放域自然语言推理问答系统,其特征在于,还包括:输入端与所述聚合推理模块的输出端连接的回复生成模块,用于对所述改写问题的最终答案和所述最终答案的可解释性说明信息进行机器回复转换,得到所述用户问题的回复答案和所述回复答案的可解释性说明信息;与所述回复生成模块连接的对话交互模块,用于根据所述用户问题的回复答案和所述回复答案的可解释性说明信息与所述用户问题进行对话交互。3.根据权利要求1所述的大语言模型驱动的开放域自然语言推理问答系统,其特征在于,所述问题改写模块具体用于根据历史问答数据对所述用户问题进行指代消解或省略消解以得到改写问题,并在所述改写问题与所述用户问题相同时不触发改写提示,在所述改写问题与所述用户问题不相同时触发改写提示,供用户选择。4.根据权利要求1所述的大语言模型驱动的开放域自然语言推理问答系统,其特征在于,所述中心计算和管理模块包括:知识图谱库管理模块,用于提供知识图谱库的知识查询和推理执行;文本资源库管理模块,用于提供本地文本资源库的文本查询支持;大语言模型计算与管理模块,用于提供大语言模型库和大语言模型任务适配的少量微调参数库的模型计算和任务适配支持;管理中枢模块,用于根据多个所述子问答模块对所述知识图谱库、本地文本资源库、所述大语言模型库和所述大语言模型任务适配的少量微调参数库的需求进行调度,并根据所述改写问题的类型从多个所述子问答模块中选择一个或多个所述子问答模块对所述改写问题进行推理,以得到一个或多个所述改写问题的候选答案和所述候选答案的可解释性说明信息。5.根据权利要求1所述的大语言模型驱动的开放域自然语言推理问答系统,其特征在于,所述聚合推理模块具体用于基于得分融合机制、用户反馈的优化机制和迭代综合推理
机制从一个或多个所述改写问题的候选答案和所述候选答案的可解释性说明信息中聚合推理得到所述改写问题的最终答...

【专利技术属性】
技术研发人员:汪华东牛艺霖邵智宏洪锐鑫胡声鼎肖朝军许诚强黄民烈刘知远张长水
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1