一种基于检索和知识图谱的军事法规问答方法技术

技术编号:36691893 阅读:14 留言:0更新日期:2023-02-27 20:00
本发明专利技术的目的是提供一种基于检索和知识图谱的军事法规问答方法,通过运用以上两种技术构建军事法规问答系统,先将问题定位到最相关的法规条款,再通过匹配语义关系得出短答案,以条款完整内容和层次脉络作为补充,融合两种技术的优势,并通过测试验证问答效果。并通过测试验证问答效果。并通过测试验证问答效果。

【技术实现步骤摘要】
一种基于检索和知识图谱的军事法规问答方法


[0001]本专利技术涉及军事法规问答
,特别涉及一种基于检索和知识图谱的军事法规问答方法。

技术介绍

[0002]随着人类社会迈入信息化、智能化时代,战争和军事行动面貌随之发生深刻演变,尤其是舆论战、心理战和法律战等认知领域作战样式的兴起,对指挥信息系统的综合信息服务能力提出了更高要求。军事法规作为指导战场行动的法理依据,重要性不可忽视,特别是在认知作战领域,其作用早已从幕后走向前台。指挥员做出决策需要详细的法规支持,每一步都应做到有据可查。然而,在信息化条件下,人工查阅文本的传统方式显然已经跟不上战争节奏,难以满足战场决策需要。因此,构建准确、高效、灵活、智能的军事法规问答系统,具有广阔的应用前景。
[0003]目前,法规问答可归纳为七类,分别是判断类、多选项类、检索类、大数据类、本体类、神经网络类与其他方法。基于信息检索(information retrieval,IR)的法规问答首先定位包含相关信息的段落,再确定具体答案,但目前尚未见可用于问答的军事法规开源图谱。
[0004]信息检索技术可根据关键词迅速找到相关法规和条款,但难以直接给出问题答案,需要人工阅读条款。知识图谱问答的效果依赖图谱的规模和质量,工作量较大,且答案缺乏来源信息和可解释性,因此,单独采用检索或知识图谱技术构建的问答系统均不能契合军事辅助决策的需求。

技术实现思路

[0005]本专利技术的目的是提供一种基于检索和知识图谱的军事法规问答方法,用来
技术介绍
中提出的问题。
[0006]为了达到上述专利技术目的,本专利技术采用的技术方案为:
[0007]一种基于检索和知识图谱的军事法规问答方法,包括军事法规文本预处理、军事法规问答和实验与分析三个步骤:
[0008]所述军事法规文本预处理包括以下步骤:
[0009]步骤一:法规标题识别:军事法规篇章结构严谨、层次鲜明,各级标题对所属内容的概括凝练而准确,将法规文本以条款为单位进行分割,对于信息检索十分重要,军事法规的标题结构具有很强的规律性,通常一级标题为“第X章”、二级标题为“第X节”、三级标题为“第X条”;
[0010]步骤二:生成条款检索树:在标题识别的基础上,为快速定位与问题最相关的条款,根据军事法规特点对经典的TF

IDF算法进行调整;
[0011]步骤三:语义关系标注:为了向简单问题提供简明扼要的短答案,需利用知识图谱技术对法规条款进行语义关系标注,生成大量知识“三元组”,知识的规模和质量将直接影
响问题理解能力与解答质量,主要有三种标注方式:一是人工标注,较为详细准确,但费时费力;二是自动标注,可批量处理句式固定的条款,但需逐一编写程序;三是从题库提取简洁的题目进行转换,但受限于题库规模。
[0012]进一步的,其特征在于,所述军事法规问答包括以下步骤:
[0013]步骤一:问句处理:回答问题的前提是将自然语言形式的问句处理成可被计算机理解的数据,所述问句处理包含疑问词替换、指定搜索范围和分词三个步骤;
[0014]a、疑问词替换:自然语言中的疑问词对于检索是无用的,应在准确理解提问者意图后将其去除。本系统通过枚举常见的提问方式来理解意图,对部分字词进行近义替换可减少枚举数量,例如,“X包含哪些条目”、“X含有什么条款”、“X包括哪些章节”都会替换成“X有什么内容”,只要识别后者,就能理解类似的一系列提法;
[0015]b、指定搜索范围:对于“X法规对Y有何规定”、“X法规附则有哪几条”的提问,在提问者指定的范围内搜索后,将范围限定词代表的层级作为初始搜索节点,未指定范围,则从包含所有法规的根节点开始搜索;
[0016]c、问句分词:除去开头的范围限定词和末尾的疑问词后,对问句其余部分进行分词,由实词构成问句词组,《军语》词汇、人工标注的军事用语可增强通用分词工具在军事法规领域的分词效果;
[0017]步骤二:答案组织:问句处理明确了搜索范围和问句词组,在此基础上通过检索相关条款、匹配语义关系和输出答案三个步骤,完成一次问答;
[0018]a、检索相关条款:以问句词组和代表搜索范围的初始搜索节点为输入,运行条款检索算法,输出的答案列表即为相关度最高的条款集合,若答案列表为空,则表示找不到相关条款;
[0019]b、匹配语义关系:预处理过程中的语义关系标注为各条款添加了若干知识三元组,问句匹配了答案条款所包含的三元组,则给出短答案;
[0020]c、输出答案:虽然短答案提供了关键信息,但询问者可能还想了解更详细的信息,此外,仍有大量知识难以用三元组表述,很多问题也不能用短答案解答,因此,还需要答案来源和条款全文作为补充,以增强说服力和准确性,此外,知识图谱除了难以解决找不到语义关系的问题,也不适合回答询问章节条款的问题,而本系统建立了完善的目录层级,便于回答此类问题;
[0021]步骤三:辅助答题:利用条款检索和语义匹配能力实现答题模块,能尝试解答判断题、单选题、多选题和填空题,该功能可用于辅助军事法规学习和测试,也可用于从题库添加语义关系,将题干视为问题,检索到最相关的法规条款,对于单选题、多选题和填空题,尝试通过匹配语义关系得出答案,对于判断题或无法匹配语义关系的情况,采用字符串匹配确定答案,对于仍不能确定答案的单选题和多选。
[0022]进一步的,所述实验与分析包括问答测试和对比分析两个步骤。
[0023]进一步的,所述步骤一中的生成条款检索树包括以下步骤进行生成:
[0024]步骤一:构建分词计数器:分词计数器是一种数据结构,用于保存一段文字中各分词的词频(term frequency,TF),问答系统的各级目录层级均具备上级标题计数器C
up
、本级标题计数器C
now
和正文计数器C
text
,将本级标题与上级标题分别计数,是因为本级标题与本级内容相关性最强,权重更高,在正文或上级标题中,分词出现频率越高并不代表它与该条
款的相关性越强,本文的TF值已不单指分词频率,C
up
和C
text
只统计分词出现与否(值为0或1),C
now
中的值表示各分词占总词数的比率,求分词a在某层级的TF值,即按下式计算三个分词计数器相应值的加权和:
[0025]TF[a]=C
up
[a]×
W
up
+C
now
[a]×
W
now
+C
text
[a]×
W
text
ꢀꢀꢀꢀ
(1)
[0026]式(1)中,W
up
、W
now
和W
text
表示各分词计数器的权重;
[0027]步骤二:分词计数器更新:为使各层级的分词计数器准确反映分词与所属内容的最强相关性,每本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于检索和知识图谱的军事法规问答方法,其特征在于,包括军事法规文本预处理、军事法规问答和实验与分析三个步骤:所述军事法规文本预处理包括以下步骤:步骤一:法规标题识别:军事法规篇章结构严谨、层次鲜明,各级标题对所属内容的概括凝练而准确,将法规文本以条款为单位进行分割,对于信息检索十分重要,军事法规的标题结构具有很强的规律性,通常一级标题为“第X章”、二级标题为“第X节”、三级标题为“第X条”;步骤二:生成条款检索树:在标题识别的基础上,为快速定位与问题最相关的条款,根据军事法规特点对经典的TF

IDF算法进行调整;步骤三:语义关系标注:为了向简单问题提供简明扼要的短答案,需利用知识图谱技术对法规条款进行语义关系标注,生成大量知识“三元组”,知识的规模和质量将直接影响问题理解能力与解答质量,主要有三种标注方式:一是人工标注,较为详细准确,但费时费力;二是自动标注,可批量处理句式固定的条款,但需逐一编写程序;三是从题库提取简洁的题目进行转换,但受限于题库规模。2.根据权利要求1所述的一种基于检索和知识图谱的军事法规问答方法,其特征在于,所述军事法规问答包括以下步骤:步骤一:问句处理:回答问题的前提是将自然语言形式的问句处理成可被计算机理解的数据,所述问句处理包含疑问词替换、指定搜索范围和分词三个步骤;a、疑问词替换:自然语言中的疑问词对于检索是无用的,应在准确理解提问者意图后将其去除,本系统通过枚举常见的提问方式来理解意图,对部分字词进行近义替换可减少枚举数量;b、指定搜索范围:对于“X法规对Y有何规定”、“X法规附则有哪几条”的提问,在提问者指定的范围内搜索后,将范围限定词代表的层级作为初始搜索节点,未指定范围,则从包含所有法规的根节点开始搜索;c、问句分词:除去开头的范围限定词和末尾的疑问词后,对问句其余部分进行分词,由实词构成问句词组,《军语》词汇、人工标注的军事用语可增强通用分词工具在军事法规领域的分词效果;步骤二:答案组织:问句处理明确了搜索范围和问句词组,在此基础上通过检索相关条款、匹配语义关系和输出答案三个步骤,完成一次问答;a、检索相关条款:以问句词组和代表搜索范围的初始搜索节点为输入,运行条款检索算法,输出的答案列表即为相关度最高的条款集合,若答案列表为空,则表示找不到相关条款;b、匹配语义关系:预处理过程中的语义关系标注为各条款添加了若干知识三元组,问句匹配了答案条款所包含的三元组,则给出短答案;c、输出答案:虽然短答案提供了关键信息,但询问者可能还想了解更详细的信息,此外,仍有大量知识难以用三元组表述,很多问题也不能用短答案解答,因此,还需要答案来源和条款全文作为补充,以增强说服力和准确性,此外,知识图谱除了难以解决找不到语义关系的问题,也不适合回答询问章节条款的问题,而本系统建立了完善的目录层级,便于回答此类问题;
步骤三:辅助答题:利用条款检索和语义匹配能力实现答题模块,能尝试解答判断题、单选题、多选题和填空题,该功能可用于辅助军事法规学习和测试,也可用于从题库添加语义关系,将题干视为问题,检索到最相关的法规条款,对于单选题、多选题和填空题,尝试通过匹配语义关系得出答案,对于判断题或无法匹配语义关系的情况,采用字符串匹配确定答案,对于仍不能确定答案的单选题和多选。3.根据权利要求1所述的一种基于检索和知识图谱的军事法规问答方法,其特征在于,所述实验与分析包括问答测试和对比分析两个步骤。4.根据权利...

【专利技术属性】
技术研发人员:刘奕明谢振杰徐瑞麟付伟魏国珩秦艳琳张志红周九星
申请(专利权)人:中国人民解放军海军工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1