System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于军事知识问答,具体为一种大语言模型驱动知识图谱多跳推理的军事问答方法与系统。
技术介绍
1、军事知识智能问答系统作为一款智能化军队人员专业技术教学装备,旨在提升军队人员普遍的作战能力,为军队人员扩充作战视野、锻炼战略思维,逐渐成为军事领域的研究热门与焦点。
2、目前,相关领域业界人士提出了一系列的基于知识图谱的智能军事问答系统和基于大语言模型对话的智能军事问答系统,也取得了显著的进展,但这些主流方法存在以下难题与挑战:
3、1.基于知识图谱推理的智能军事问答系统:这些方法主要基于传统的模板语义解析、编码解码、语义查询图检索等方式,但这需要专业语言学知识,工作量大;且这些推理方式在语义分析到推理链条的映射过程仍缺乏足够的可解释性,推理安全性无法保证;虽然对短如2跳、3跳问题的准确率令人满意,但对于关系推理长路径,如4跳、5跳下的推理准确率难以保证;此外,此类系统性能很大程度上取决于推理监督数据和知识图谱的构造质量。
4、2.基于大语言模型端到端对话的智能军事问答:首先,大语言模型在对问题的答案直接反馈上,存在肯定性偏见(偏向于肯定相关事实主题而非否定)、事实性幻觉(容易生成事实性错误,生成“胡说八道”的答案),且推理过程无法解释,安全性无保障。因此,大语言模型输出可控性差,这成为了对信息真实性、可靠性有着高标准的军事问答技术的亟待解决的痛点;其次,大语言模型知识更新难,对大语言模型进行微调以更新知识耗时耗力,难保证知识时效性;此外,大语言模型虽然泛化出色,但往往难以捕获实际的军事知
技术实现思路
1、本专利技术的目的在于提供了一种大语言模型驱动知识图谱多跳推理的军事问答方法与系统,面向于军事知识问答
相比于仅基于端到端语言模型的和仅基于知识图谱多跳推理的军事问答方法与系统,本申请专利技术具备如下优势:擅长知识密集检索;支持深度推理,多跳链式推理准确;推理过程可解释,答案可追溯,知识服务的安全性有保障;热插拔式设计,模型组件兼容性好。
2、为达到上述目的,本专利技术提供如下技术方案:
3、一种大语言模型驱动知识图谱多跳推理的军事问答方法与系统,给定一个构建好的大规模军事知识图谱用于答案检索、一个预训练大语言模型用于答案推理,该专利技术包括一个问答方法和一个与之配套的系统装置。
4、一种大语言模型驱动知识图谱多跳推理的军事问答方法,包括以下步骤:
5、(1)给定一个构建好的大规模军事知识图谱用于答案检索、一个预训练大语言模型用于答案推理,该方法的输入为一段自然语言形式的军事领域用户问题;
6、(2)图搜索初始化:进行推理链的起始实体推理,借助大语言模型分析上述的军事领域用户问题,推理出起始实体集合。通过与大语言模型对话,获得该军事领域用户问题的理解与反馈,获得一系列候选起始实体文本,通过基于动态规划的levenshtein距离字符串相似度比较,从图谱中查询得到候选实体点和点所在中心邻域,从而初始化多个候选图谱推理域;
7、(3)展开推理链持续探索循环:基于上述初始化的多个候选起始图谱实体和所在中心邻域,通过大语言模型对推理路径进行持续的检索与扩展循环,每轮循环包括:1.中心临域关系探索;2.中心临域关系裁剪;3.中心临域实体探索;4.中心临域实体裁剪,通过以上步骤确定推理链的尾关系和尾实体,更新并扩展候选图谱推理链;
8、(4)进入推理链合理性评估:继推理链持续探索循环后,借助大语言模型对扩展后的候选图谱推理链的推理路径进行合理性评估,大语言模型分析原军事问题的语义,对新的候选推理路径集合进行语义要求合理性判断。若所有推理路径不满足要求,则返回第三步,进行下一轮推理链探索;若存在满足问题语义的推理链,则跳出第三步,推理链探索循环步骤,给出链尾图谱实体(目标答案)和完整推理链(从起始实体到答案的路径);若达到探索循环最大数限制,则给出推理失败提示;
9、(5)基于大语言模型对答案进行辅助分析:借助大语言模型对上述的推理链尾实体的问题答案展开自然语言形式的可解释性分析。具体来说,基于结束推理后的答案和该答案的链式推理过程,通过与大语言模型的问答,给出针对原军事问题的具体推理逻辑与可信度分析。若超出最大推理链循环数(即推理链探索失败),则借助大语言模型,根据大语言模型内部的已有知识,给出其认知内对答案的解释作为补充,从而控制整体高水平的用户问答体验。
10、优选的,所述方法中的用于答案检索的大规模军事知识图谱以neo4j图数据库驱动,以cypher代码执行图谱检索动作,其特点包括:灵活的cypher查询语言、支持复杂检索、检索效率高、扩展性强,社区生态丰富。所述方法中的用于答案推理的大语言模型为生成式预训练语言模型,例如chatgpt,gpt-4,llama,gemini pro,具备如下特点:基于transformer神经架构、海量网络参数、大规模预训练语料、自监督学习、多层次表示、上下文建模优秀、以及强大的跨领域应用能力。
11、优选的,所述方法执行流程中的步骤二:图搜索初始化中所述的起始实体推理方法,属于先初筛召回后精筛匹配的图谱实体检索方法。其中,粗筛过程包含一个切分子串模糊查询方法,精筛过程包含一个基于动态规划算法的levenshtein距离字符串相似度比较方法。起始实体推理方法的执行流程如下:
12、文字形式候选实体输出:首先,利用大语言模型分析军事问题输入,并给出所有句中主题实体作为候选起始实体的文字表征;
13、进一步地,执行汉字子串切分:设定固定长度n的切分窗口,对实体的文字表述进行切分,整理至该实体的子串集合中,例如,对于“f-14雄猫战斗机”,设置切分窗口3的子串集合为{f-14雄猫,雄猫战,猫战斗,战斗机}。在实际应用部署中,建议选择切分窗口为2至3,以同时保证图谱实体的召回覆盖度和检索效率;
14、进一步地,执行图谱实体子串检索:通过cypher内置的“contains子串包含关系”模糊查询,收集每个候选起始实体下子串集合的所有检索到的图谱实体,并同时记录图谱实体的命名,以上步骤属于粗筛过程;
15、进一步地,对所有检索的图谱实体进行精筛。通过一种基于动态规划算法的levenshtein距离字符串相似度比较方法,和对所有候选起始实体的文字表征进行相似度排序,挑选相似度最高的图谱实体作为该起始实体表征在图谱中对应的实体,从而确定图谱实体点和点所在中心邻域,初始化多个候选图谱推理域。
16、优选的,在上述图搜索初始化的起始实体推理方法中,所述的基于动态规划算法的levenshtein距离字符串相似度比较方法,具体步骤如下:
17、通过所述的图搜索初始化,获得的一系列候选起始实体文本,从中随机挑选两个字符串文本,分别设为s1和s2,长度分别为l1和l2,本文档来自技高网...
【技术保护点】
1.大语言模型驱动知识图谱多跳推理的军事问答方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的大语言模型驱动知识图谱多跳推理的军事问答方法,其特征在于,步骤S1中,用于答案检索的大规模军事知识图谱,是以Neo4j图数据库驱动,并以Cypher代码执行图谱检索动作;用于答案推理的预训练大语言模型为生成式大语言模型。
3.根据权利要求1所述的大语言模型驱动知识图谱多跳推理的军事问答方法,其特征在于,步骤S2中,图搜索初始化,起始实体推理方法,属于先初筛召回后精筛匹配的图谱实体检索方法,具体流程如下:
4.根据权利要求1所述的大语言模型驱动知识图谱多跳推理的军事问答方法,其特征在于,步骤S2中,图搜索初始化,基于动态规划算法的Levenshtein距离字符串相似度比较方法,具体步骤如下:
5.根据权利要求1所述的大语言模型驱动知识图谱多跳推理的军事问答方法,其特征在于,步骤S3中,推理链持续探索循环,采用集束搜索策略的持续循环探索,每轮循环探索过程都只维护Top-K个候选束,即K个候选推理链其中K为束宽,pi为第i条候选推理链,不
6.根据权利要求1所述的大语言模型驱动知识图谱多跳推理的军事问答方法,其特征在于,步骤S3中,推理链探索持续循环,中心临域关系裁剪方法,具体如下:
7.根据权利要求1所述的大语言模型驱动知识图谱多跳推理的军事问答方法,其特征在于,步骤S3中,推理链探索持续循环,中心临域实体裁剪方法,具体如下:
8.根据权利要求1所述的大语言模型驱动知识图谱多跳推理的军事问答方法,其特征在于,步骤S4中,推理链合理性评估,包含以下步骤:
9.根据权利要求1所述的大语言模型驱动知识图谱多跳推理的军事问答方法,其特征在于,步骤S5中,基于大语言模型对答案辅助分析,其过程如下:
10.根据权利要求1所述的大语言模型驱动知识图谱多跳推理的军事问答系统,其特征在于,包括:
...【技术特征摘要】
1.大语言模型驱动知识图谱多跳推理的军事问答方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的大语言模型驱动知识图谱多跳推理的军事问答方法,其特征在于,步骤s1中,用于答案检索的大规模军事知识图谱,是以neo4j图数据库驱动,并以cypher代码执行图谱检索动作;用于答案推理的预训练大语言模型为生成式大语言模型。
3.根据权利要求1所述的大语言模型驱动知识图谱多跳推理的军事问答方法,其特征在于,步骤s2中,图搜索初始化,起始实体推理方法,属于先初筛召回后精筛匹配的图谱实体检索方法,具体流程如下:
4.根据权利要求1所述的大语言模型驱动知识图谱多跳推理的军事问答方法,其特征在于,步骤s2中,图搜索初始化,基于动态规划算法的levenshtein距离字符串相似度比较方法,具体步骤如下:
5.根据权利要求1所述的大语言模型驱动知识图谱多跳推理的军事问答方法,其特征在于,步骤s3中,推理链持续探索循环,采用集束搜索策略的持续...
【专利技术属性】
技术研发人员:金伟强,王晓田,张瑜,闫天,谢峰,李俊辉,石博航,赵彪,张紫薇,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。