一种基于知识图谱的问答实现方法及装置制造方法及图纸

技术编号:33994972 阅读:16 留言:0更新日期:2022-07-02 10:38
本发明专利技术公开了一种基于知识图谱的问答实现方法及装置,涉及自然语言处理技术领域,主要目的在于无需问答积累,在知识图谱构建的全阶段中都更加容易可靠地可以基于知识图谱实现问答;主要技术方案包括:对输入的问题语句进行分词,并对分词后得到的每一个单词进行词性标注以及基于每一个所述单词的词性标注结果对所述问题语句进行句法分析;基于每一个所述单词的词性标注结果以及所述知识图谱对应的数据库所记载的词信息,标注每一个所述单词的语义角色;基于每一个所述单词的语义角色以及句法分析后得到的结果,确定所述问题语句中的核心词;基于所述核心词构建针对所述知识图谱的查询语句,其中,所述查询语句用于对所述知识图谱进行查询。知识图谱进行查询。知识图谱进行查询。

【技术实现步骤摘要】
一种基于知识图谱的问答实现方法及装置


[0001]本专利技术涉及自然语言处理
,特别是涉及一种基于知识图谱的问答实现方法及装置。

技术介绍

[0002]知识图谱问答(KBQA)利用图谱丰富的语义关联信息,能够深入理解用户问题并给出答案,近年来吸引了学术界和工业界的广泛关注。知识图谱问答主要任务是将自然语言问题通过不同方法映射到结构化的查询,并在知识图谱中获取答案。
[0003]目前,知识图谱问答方法通常存在如下两种:一种是,利用模板的方式进行知识图谱问答,该方法主要是通过建立模板,将问题对应到模板中,并替换模板中的查询进行获取答案。此种方式需要针对知识图谱的问答进行的大量积累和整理,才能够获取模板,知识图谱问答能回答的程度取决于模板整理的多少,且模板是基于编写整理当时阶段的图谱进行编写的,当图谱发生变动时,模板很难自适应图谱的变化。另一种是,基于深度学习技术进行知识图谱问答。此种方式对面向多领域的知识图谱平台来讲,在知识图谱构建初期,在没有数据积累的情况下,不能训练模型,也很难利用机器学习或者深度学习进行知识图谱问答。
[0004]可见,现有的基于知识图谱的问答实现方法在没有大量问答积累的情况下,很难实现对知识图谱的查询。

技术实现思路

[0005]有鉴于此,本专利技术提出了一种基于知识图谱的问答实现方法及装置,主要目的在于无需问答积累,在知识图谱构建的全阶段中都更加容易可靠地可以基于知识图谱实现问答,主要技术方案如下:
[0006]第一方面,本专利技术提供了一种基于知识图谱的问答实现方法,该方法包括:
[0007]对输入的问题语句进行分词,并对分词后得到的每一个单词进行词性标注以及基于每一个所述单词的词性标注结果对所述问题语句进行句法分析;
[0008]基于每一个所述单词的词性标注结果以及所述知识图谱对应的数据库所记载的词信息,标注每一个所述单词的语义角色;
[0009]基于每一个所述单词的语义角色以及句法分析后得到的结果,确定所述问题语句中的核心词;
[0010]基于所述核心词构建针对所述知识图谱的查询语句,其中,所述查询语句用于对所述知识图谱进行查询。
[0011]第二方面,本专利技术提供了一种基于知识图谱的问答实现装置,该装置包括:
[0012]处理单元,用于对输入的问题语句进行分词,并对分词后得到的每一个单词进行词性标注以及基于每一个所述单词的词性标注结果对所述问题语句进行句法分析;
[0013]标注单元,用于基于每一个所述单词的词性标注结果以及所述知识图谱对应的数
据库所记载的词信息,标注每一个所述单词的语义角色;
[0014]确定单元,用于基于每一个所述单词的语义角色以及句法分析后得到的结果,确定所述问题语句中的核心词;
[0015]构建单元,用于基于所述核心词构建针对所述知识图谱的查询语句,其中,所述查询语句用于对所述知识图谱进行查询。
[0016]第三方面,本专利技术提供了一种计算机可读存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行第一方面所述的基于知识图谱的问答实现方法。
[0017]第四方面,本专利技术提供了一种存储管理设备,所述存储管理设备包括:存储器,用于存储程序;处理器,耦合至所述存储器,用于运行所述程序以执行第一方面所述的基于知识图谱的问答实现方法。
[0018]借由上述技术方案,本专利技术提供的基于知识图谱的问答实现方法及装置,在接收到输入的问题语句时,对问题语句进行分词,并对分词后得到的每一个单词进行词性标注以及基于各单词的词性标注结果对问题语句进行句法分析。然后基于各单词的词性标注结果以及知识图谱对应的数据库所记载的词信息标注各单词的语义角色,以及基于各单词的语义角色以及句法分析后得到的结果确定问题语句中的核心词。最后基于核心词构建针对知识图谱的查询语句,以利用查询语句对知识图谱进行查询。可见,本专利技术提供方案中在对知识图谱进行查询时,无需问答积累,便可基于对问题语句的分词、词性标注以及语法分析结果以及知识图谱对应的数据库所记载的词信息,构建出查询语句对知识图谱进行查询,查询到针对问题语句的问答结果。因此,本专利技术提供的方案无需问答积累,在知识图谱构建的全阶段中都更加容易可靠地可以基于知识图谱实现问答。
[0019]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0020]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1示出了本专利技术一个实施例提供的一种基于知识图谱的问答实现方法的流程图;
[0022]图2示出了本专利技术另一个实施例提供的一种基于知识图谱的问答实现方法的流程图;
[0023]图3示出了本专利技术一个实施例提供的一种基于知识图谱的问答实现装置的结构示意图;
[0024]图4示出了本专利技术另一个实施例提供的一种基于知识图谱的问答实现装置的结构示意图。
具体实施方式
[0025]下面将参照附图更加详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0026]如图1所示,本专利技术实施例提供了一种基于知识图谱的问答实现方法,该方法主要包括:
[0027]101、对输入的问题语句进行分词,并对分词后得到的每一个单词进行词性标注以及基于每一个所述单词的词性标注结果对所述问题语句进行句法分析。
[0028]知识图谱本质上是一种知识库,图谱的知识库在表示知识方面是以一种网络结构形式来表示。知识图谱的知识存储在其对应的数据库中,在该数据库中,知识以词信息的形式存在,该词信息用于限定数据库中特定词在知识图谱中是何种属性以及对应何种属性信息。其中,属性至少包括如下内容中的一种:实体、关系、概念。上述三种属性对应的属性信息分别为实体信息、关系信息以及概念信息。
[0029]问题语句是给定的自然语言的问题,通过对问题语句进行语义理解和解析,进而便可利用知识图谱进行查询,得到该问题语句对应的答案,从而实现知识图谱的问答。问题语句是基于用户对知识图谱的查询需求而确定的。
[0030]当存在输入的问题语句时,直接对问题语句进行分词,分词方法至少包括如下两种:
[0031]第一种,基于词典对问题语句进行分词。
[0032]此种方法是按照一定的策略将问题语句中的待匹配的字符串和一个已建立好的词典中的词进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的问答实现方法,其特征在于,包括:对输入的问题语句进行分词,并对分词后得到的每一个单词进行词性标注以及基于每一个所述单词的词性标注结果对所述问题语句进行句法分析;基于每一个所述单词的词性标注结果以及所述知识图谱对应的数据库所记载的词信息,标注每一个所述单词的语义角色;基于每一个所述单词的语义角色以及句法分析后得到的结果,确定所述问题语句中的核心词;基于所述核心词构建针对所述知识图谱的查询语句,其中,所述查询语句用于对所述知识图谱进行查询。2.根据权利要求1所述的方法,其特征在于,基于每一个所述单词的语义角色以及句法分析后得到的结果,确定所述问题语句中的核心词,包括:根据句法分析后得到的结果,确定所述每一个所述单词对应的语法结构;根据每一个所述单词对应的语法结构以及每一个所述单词的语义角色,确定所述问题语句中的核心词。3.根据权利要求1所述的方法,其特征在于,基于所述核心词构建针对所述知识图谱的查询语句,包括:确定所述核心词的语义角色;基于所述核心词的语义角色将所述核心词嵌入到预设样本语句中,形成所述查询语句,其中,所述预设样本语句的语言结构适应于所述知识图谱对应的数据库。4.根据权利要求1所述的方法,其特征在于,在基于每一个所述单词的词性标注结果以及所述知识图谱对应的数据库所记载的词信息,标注每一个所述单词的语义角色,包括:将各所述单词的词性标注结果分别与所述知识图谱对应的数据库所记载的词信息进行匹配,确定每一个所述单词匹配到的词信息;基于各所述单词匹配到的词信息,确定各所述单词的语义角色。5.根据权利要求1

4中任一所述的方法,其特征在于,在基于每一个所述单词的词性标注结果以及所述知识图谱对应的数据库所记载的词信息,标注每一个所述单词的语义角色之前,所述方法还包括:基于每一个所述单词的词性标注结果,从各所述单词中筛选出有效单词,其...

【专利技术属性】
技术研发人员:翟莹莹
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1