【技术实现步骤摘要】
本专利技术涉及一种用户查询复杂度自适应的知识图谱检索增强生成方法,涉及自然语言处理、知识图谱和大语言模型技术。
技术介绍
1、目前,以大语言模型(large language models,简称llms)为代表的生成式人工智能技术,凭借自然语言的人机交互手段,在机器翻译、问答系统、逻辑推理等领域取得了显著进展。而在行业定制化过程中,大语言模型受到训练数据范围和领域知识缺失的限制,面临着幻觉和错误问题,这极大降低了大语言模型的可信赖性,并引发了安全风险。例如,通用基础模型gpt-4o的训练数据截止到2023年10月,如果向它提问2025年的事件或者疾病诊断问题,它可能假装了解2025年的事件而回答未发生过的事情,或者由于缺少疾病背景知识而做出错误诊断。
2、为了缓解这类问题,检索-增强-生成技术(retrieval-augmented generation,简称rag)受到广泛关注,将查询回答过程分解为检索和生成两个阶段:在检索阶段,从外部文本、网页等非结构化数据源中检索相关文本知识;在生成阶段,利用检索出的相关文本知识来指导
...【技术保护点】
1.一种用户查询复杂度自适应的知识图谱检索增强生成方法,其特征在于:首先,根据用户查询中包含的复杂度衡量指标量化用户查询复杂度,并对用户查询的隐藏逻辑进行分析与补全;然后,建立用户查询复杂度与知识图谱检索范围、知识图谱检索策略之间的对应关系,结合用户查询复杂度自适应调整知识图谱检索范围;接着,基于强化学习在所确定的知识图谱检索范围内自适应地筛选出最优的一组知识推理路径;最后,利用大语言模型基于所选择的知识推理路径回答用户查询。
2.根据权利要求1所述的用户查询复杂度自适应的知识图谱检索增强生成方法,其特征在于:利用神经网络、大语言模型或启发式规则量化用户查
...【技术特征摘要】
1.一种用户查询复杂度自适应的知识图谱检索增强生成方法,其特征在于:首先,根据用户查询中包含的复杂度衡量指标量化用户查询复杂度,并对用户查询的隐藏逻辑进行分析与补全;然后,建立用户查询复杂度与知识图谱检索范围、知识图谱检索策略之间的对应关系,结合用户查询复杂度自适应调整知识图谱检索范围;接着,基于强化学习在所确定的知识图谱检索范围内自适应地筛选出最优的一组知识推理路径;最后,利用大语言模型基于所选择的知识推理路径回答用户查询。
2.根据权利要求1所述的用户查询复杂度自适应的知识图谱检索增强生成方法,其特征在于:利用神经网络、大语言模型或启发式规则量化用户查询复杂度;或者利用神经网络、大语言模型和启发式规则三种方法分别量化用户查询复杂度,然后融合三种方法的量化结果得到联合量化评分,使用联合量化评分作为后续调整知识图谱范围、确定知识推理路径中所使用的用户查询复杂度;
3.根据权利要求1所述的用户查询复杂度自适应的知识图谱检索增强生成方法,其特征在于:综合利用神经网络、大语言模型和符号规则分析用户查询的隐藏逻辑,对用户查询隐藏逻辑进行分析与补全,包括如下步骤:
4.根据权利要求1所述的用户查询复杂度自适应的知识图谱检索增强生成方法,其特征在于:依据用户查询复杂度s,首先利用启发式规则初步调整知识图谱检索范围,并从中抽取若干候选知识子图,再利用候选知识跳数、实体个数、语义覆盖区域三个指标进一步调整知识图谱检索范围,实现知识图谱检索范围的自适应调整,包括如下步骤:
5.根据权利要求1所述的用户查询复杂度自适应的知识图谱检索增强生成方法,其特征在于:在知识图谱检索范围内的各候选知识子图上,基于强化学习进行知识推理路径的序列决策,自适应地确定知识推理路径跳数,筛选出一组最优知识推理路径;首先,基于强化学习范式,将知识推理路径的序列决策任务转换为以集合esim(q)∪e(qnew)中每个实体为起点的序列决策任务,在每个实体的序列决策过程中引入停止条件,以实现自适应确定知识推理路径跳数,并采用波束搜索策略防止陷入局部最优,筛选出一组知识推理路径;然后,基于本体及预定义的推理路径规则对筛选出的知...
【专利技术属性】
技术研发人员:韩日东,营鹏,许新征,魏孟,李仲年,张铭芮,沈雅文,孙统风,
申请(专利权)人:中国矿业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。