知识图谱问答系统、方法及装置制造方法及图纸

技术编号:29401053 阅读:26 留言:0更新日期:2021-07-23 22:38
本发明专利技术公开了一种知识图谱问答系统、方法及装置,所述系统包括:数据层,用于保存概念图谱和实例图谱;模型层,用于保存进行用户问句的语义解析时所需要的字典;加工层,用于对用户问句进行分词和句法依存解析,得到依存关系树,对依存关系树进行节点分类及剪枝,得到剪枝且标记类型后的依存关系树,针对剪枝且标记类型后的依存关系树,基于字典和知识图谱,输出词列表与节点对象的对应关系、及节点对象约束路径,基于对应关系获取目标节点,并根据目标节点和节点对象约束路径查询实例图谱,获取目标节点的实例点;应用层,用于接收用户输入的用户问句,并向用户展示返回的实例点。

【技术实现步骤摘要】
知识图谱问答系统、方法及装置
本专利技术涉及计算机
,尤其是涉及一种知识图谱问答系统、方法及装置。
技术介绍
当前智能化浪潮中,互联网+已成为众多领域智能化转型升级的重要战略方向,其中智能问答系统更是优化服务流程和提升服务效率转型中最迫切的需求之一。知识图谱具有表达能力强,可扩展性好,操作灵活等特点,在垂直领域通过构建知识图谱并融其于问答系统中来共同提升问答系统的效果。国内外关于知识图谱的问答系统,一般是任务型,人为提前定义可回答的任务类型、每个任务类型下需填充的槽位及搜索图数据库逻辑用于得到最终答案;或者是在检索式问答系统架构的基础上,融入知识图谱中实体和关系的三元组信息来实现更精准的回复。上述两类方法的局限性包括:(1)可回答的问题类型有限;任务型的问答系统需要人为定义,检索式问答系统受问题库中问题类型的限制。(2)受垂直领域中知识图谱概念图谱设计的限制;任务型的问答系统中,同一问题类型在不同的概念图谱设计里搜索逻辑是不同的,因此需要提前清楚概念图谱的结构。(3)检索式问答系统中,知识图谱的融入只是为了提升用户问句与问答库中问句的相似度计算的精确度,并没有充分利用知识图谱的推理能力。
技术实现思路
本专利技术的目的在于提供一种知识图谱问答系统、方法及装置,旨在解决现有技术中的上述问题。本专利技术提供一种知识图谱问答系统,包括:数据层,用于保存概念图谱和实例图谱,其中,概念图谱用于描述概念节点的类型、每个类型的概念节点的属性信息以及不同类型的概念节点之间的关系,实例图谱用于保存对应于概念图谱的实例信息;模型层,用于保存进行用户问句的语义解析时所需要的字典;加工层,用于对用户问句进行分词和句法依存解析,得到依存关系树,对依存关系树进行节点分类及剪枝,得到剪枝且标记类型后的依存关系树,针对剪枝且标记类型后的依存关系树,基于字典和知识图谱,输出词列表与节点对象的对应关系、及节点对象约束路径,基于对应关系获取目标节点,并根据目标节点和节点对象约束路径查询实例图谱,获取目标节点的实例点;应用层,用于接收用户输入的用户问句,并向用户展示返回的实例点。本专利技术提供一种知识图谱问答方法,包括:预先保存概念图谱和实例图谱,其中,概念图谱用于描述概念节点的类型、每个类型的概念节点的属性信息以及不同类型的概念节点之间的关系,实例图谱用于保存对应于概念图谱的实例信息;预先保存进行用户问句的语义解析时所需要的字典;接收用户输入的用户问句,对用户问句进行分词和句法依存解析,得到依存关系树,对依存关系树进行节点分类及剪枝,得到剪枝且标记类型后的依存关系树,针对剪枝且标记类型后的依存关系树,基于概念图谱,输出词列表与节点对象的对应关系、及节点对象约束路径,基于对应关系获取目标节点,并根据目标节点和节点对象约束路径查询实例图谱,获取目标节点的实例点,并向用户展示返回的实例点。本专利技术实施例还提供一种知识图谱问答装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,计算机程序被处理器执行时实现上述知识图谱问答方法的步骤。本专利技术实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有信息传递的实现程序,程序被处理器执行时实现上述知识图谱问答方法的步骤。采用本专利技术实施例,通过利用自然语言技术对用户问句进行词语级和句子级的语义解析,综合两者分析的结果及知识图谱数据,从用户问句中解析出与知识图谱中节点相对应的对象和查询路径,能够解决传统基于图谱问答系统中可回答的问题类型有限且受限于知识图谱设计的缺点。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例的知识图谱问答系统的示意图;图2是本专利技术实施例的知识图谱问答系统的详细示意图;图3a-3d是本专利技术实施例的问句加工过程示意图;图4是本专利技术实施例的知识图谱问答方法的流程图;图5是本专利技术实施例的知识图谱问答装置的示意图。具体实施方式为了解决现有技术中的上述问题,本专利技术实施例提供了一种基于字典和句法依存分析的知识图谱问答方法和系统:利用自然语言技术对用户问句进行词语级和句子级的语义解析,综合两者分析的结果及知识图谱数据,从用户问句中解析出与知识图谱中节点相对应的对象和查询路径。具体操作是针对用户问句利用字典匹配进行词语级别的语义分析,抽取出概念、实体、属性等关键词语信息,然后利用句法依存分析确定问句中的句法结构,得到句子中关键词语之间的依存逻辑关系;结合知识图谱中的三元组信息将描述图谱中一个节点信息的关键词语封装成一个节点对象,即将用户问句语义解析成一个和多个节点对象,且根据依存分析的结果得到节点对象之间的约束路径和目标节点,最终在实例图谱中查询获得最终的结果进行返回。通过上述操作综合句子中的词语级别和句子级别的语义信息,能够最大限度的解析问句意图;且将关键词语封装成节点对象时可根据知识图谱真实数据灵活配置,不需要提前确定知识图谱手动变更。下面将结合实施例对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在本专利技术的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本专利技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。此外,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。系统实施例...

【技术保护点】
1.一种知识图谱问答系统,其特征在于,包括:/n数据层,用于保存概念图谱和实例图谱,其中,概念图谱用于描述概念节点的类型、每个类型的概念节点的属性信息以及不同类型的概念节点之间的关系,实例图谱用于保存对应于概念图谱的实例信息;/n模型层,用于保存进行用户问句的语义解析时所需要的字典;/n加工层,用于对用户问句进行分词和句法依存解析,得到依存关系树,对所述依存关系树进行节点分类及剪枝,得到剪枝且标记类型后的依存关系树,针对剪枝且标记类型后的依存关系树,基于字典和知识图谱,输出词列表与节点对象的对应关系、及节点对象约束路径,基于所述对应关系获取目标节点,并根据所述目标节点和所述节点对象约束路径查询实例图谱,获取目标节点的实例点;/n应用层,用于接收用户输入的用户问句,并向用户展示返回的实例点。/n

【技术特征摘要】
1.一种知识图谱问答系统,其特征在于,包括:
数据层,用于保存概念图谱和实例图谱,其中,概念图谱用于描述概念节点的类型、每个类型的概念节点的属性信息以及不同类型的概念节点之间的关系,实例图谱用于保存对应于概念图谱的实例信息;
模型层,用于保存进行用户问句的语义解析时所需要的字典;
加工层,用于对用户问句进行分词和句法依存解析,得到依存关系树,对所述依存关系树进行节点分类及剪枝,得到剪枝且标记类型后的依存关系树,针对剪枝且标记类型后的依存关系树,基于字典和知识图谱,输出词列表与节点对象的对应关系、及节点对象约束路径,基于所述对应关系获取目标节点,并根据所述目标节点和所述节点对象约束路径查询实例图谱,获取目标节点的实例点;
应用层,用于接收用户输入的用户问句,并向用户展示返回的实例点。


2.根据权利要求1所述的系统,其特征在于,所述字典具体包括:概念同义词字典、属性同义词字典、实例同义词字典、属性-概念字典、实例-概念字典、以及介词字典,其中,概念同义词字典用于维护概念图谱中每个概念所有可能的描述,属性同义词字典用于维护概念图谱中属性的所有可能的描述,实例同义词字典用于维护实例图谱中每个实例的所有可能的描述,属性-概念字典用于维护每个标准属性对应的概念,实例-概念字典用于维护每个标准实例所属的概念,介词字典用于维护词性为介词的口语化词。


3.根据权利要求1所述的系统,其特征在于,所述加工层具体包括:
第一子模块,用于采用基于字典的分词方法对用户问句进行分词,对分词后的问句进行依存句法分析,输出表示句子中每个词之间的依存逻辑关系的依存关系树;
第二子模块,用于将所述依存关系树中的节点分为实例词、概念词、属性词、介词辅助词、其它辅助词、无用词六类,去掉所述依存关系树中无用词对应的节点,输出剪枝且标注每个节点类型的依存关系树;
第三子模块,用于对剪枝且标注每个节点类型的依存关系树进行修正,并结合知识图谱的三元组信息,将描述知识图谱一个节点的关键词封装成一个节点对象,输出词列表与节点对象的对应关系<词列表,节点对象>及各个节点对象的约束路径;
第四子模块,用于基于修正后的依存关系树,计算节点类型为概念词、属性词或实例词中与节点类型为介词辅助词距离最近的节点,获取该节点对应的词k,判断一个或多个词列表与节点对应的对应关系<词列表,节点对象>中的词列表是否包含词k,如果判断为是,则将词列表对应的节点对象标记为目标节点输出;
第五子模块,用于根据多条节点约束路径及所述目标节点查询实例图谱获取目标节点的实例点,并反馈给应用层。


4.根据权利要求1所述的系统,其特征在于,所述第二子模块具体用于:
首先判断所述依存关系树中的节点中的词是否为概念同义词字典、属性同义词字典、实例同义词字典、以及介词字典中的词条;若为概念同义词字典中的词条,则确定此节点类型为概念词,若为属性同义词字典中的词条,则确定此节点类型为属性词,若为实例同义词字典中的词条,则确定此节点类型为实例词,若为介词字典中的词条,则确定此节点类型为介词辅助词;若均不属于这五类字典的词条,则进一步判断节点是否为叶子节点,若为叶子节点,则确定此节点类型为无用词,若不是则此节点类型为其它辅助词。


5.根据权利要求1所述的系统,其特征在于,所述第三子模块具体用于:
针对剪枝且标注每个节点类型的依存关系树,依次遍历每个节点,若当前节点与父节点n0关系为并列,则获取该父节点的父节点n1及两者关系e1,将当前节点与父节点n0的关系删除,且将当前节点的父节点改为节点n1,两者关系变成e1,输出修正后的依存关系树;
针对修正后的依存关系树,从每个叶子节点出发,将叶子节点命名当前节点,约束路径为当前节点信息:词1/类型1,设该约束路径的方向类型为-1;
针对每一个<约束路径,方向类型>,获取当前约束路径最后一个节点为当前节点及约束路径的方向类型为当前方向类型,寻找当前节点的父节点,若无父节点,则直接输出当前约束路径;若父节点词在问句中下标大于当前节点的词的下标,设方向类型a为0,若父节点词在问句中下标小于当前节点词的下标时,设方向类型a为1,若当前方向类型为-1或与a相同时,将父节点信息即词2及节点类型2拼接到当前约束路径后面,且将对应的方向类型设为a,得到新约束路径;若当前方向类型不为-1且与a不相同时,则输出当前约束路径,且设新的约束路径为:词2/类型2,对应的方向类型设为-1,针对每一个问句输出多条<词约束路径,方向类型>;
遍历多条<词约束路径,方向类型>中每一个,若在其余的<词约束路径,方向类型>中存在一条词约束路径最后一个节点与该条第一个节点相同,且方向类型分别为0、1或1、0,则将方向类型为1的词约束路径倒序拼接到方向类型为0的后面输出,否则直接输出该条词约束路径;
针对输出的每条词约束路径(词1/类型1).(词2/类型2)…(词m/类型m)其中m>=1,从左到右遍历每个词i/类型i,其中i>=1且i<=m,类型i若为“其它辅助词”或“介词辅助词”时,则跳过继续;若为“概念词”,则基于概念同义词字典查找词i对应的概念标准词,且令标准词i为概念标准词,概念i为概念标准词;若为“实例词”,则基于实例同义词字典查找词i对应的实例标准词,基于实例-概念字典查找实例标准词对应的概念标准词,且令标准词i实例标准词,概念i为概念标准词;若为“属性词”,则基于属性同义词字典查找词i对应的属性标准词,基于属性-概念字典查找属性标准词对应的概念标准词,且令标准词i为属性标准词,概念i为概念标准词,输出标准化后的词约束路径(词1/标准词1,类型1,概念1).(词2/标准词2,类型2,概念2)…(词n/标准词n,类型n,概念n),其中n<=m。
针对每条标准化后的词约束路径(词1/标准词1,类型1,概念1).(词2/标准词2,类型2,概念2)…(词n/标准词n,类型n,概念n),从左到右将概念相同的封装成节点对象,输出词列表与节点对象的对应关系<词列表i,词列表i/节点对象i>及节点对象约束路径(词列表1,节点对象1).(词列表2,节点对象2)…(词列表z,节点对象z),其中z<=n;
针对多个<词列表i,词列表i’/节点对象i’>进行两两对比,若存在条件1即词列表i对应的词列表i’包含词列表j对应的词列表j’,则将词列表i’与列表i’的并集命名为词列表k’,词列表i对应的节点对象i’与词列表j对应的节点对象j’中的字段互相补充完善变成节点k’,进而<词列表i,词列表i’/节点对象i’>变成<词列表i,列表k’/节点对象k’>,<词列表j,词列表j’/节点对象j’>变成<词列表j,列表k’/节点对象k’>,继续进行节点对象的完善处理,直到<词列表i,词列表i’/节点对象i’>中两两均不满足条件1时,针对多条节点对象约束路径,将节点对象i均修改为词列表i对应的新的节点i’,相应的输出多条节点对象完善后的节点对象约束路径(节点对象1’).(节点对象2’)…(节点对象z’),其中z’<=n,及词列表与节点对象的对应关系<词列表i’,节点对象i’>。


6.一种知识图谱问答方法,其特征在于,包括:
预先保存概念图谱和实例图谱,其中,概念图谱用于描述概念节点的类型、每个类型的概念节点的属性信息以及不同类型的概念节点之间的关系,实例图谱用...

【专利技术属性】
技术研发人员:张学龙王哓鸣史晓凌么新新
申请(专利权)人:北京智通云联科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1