当前位置: 首页 > 专利查询>南京大学专利>正文

一种结构优先的知识库问答实现方法及其系统技术方案

技术编号:32437523 阅读:24 留言:0更新日期:2022-02-26 07:55
一种结构优先的知识库问答实现方法及其系统,包括问句结构分析和SPARQL查询结构图生成两部分,问句结构分析的技术方法对自然语言问句进行句法解析,设计并构建了实体描述图和放松查询图两种图模型;SPARQL查询结构图的生成技术从放松查询图出发,使用构建模板的方式,构建放松查询图和SPARQL查询图的查询结构映射库,然后对于待求问句,从映射库中提取模板并拼接得到待求问句对应SPARQL查询结构图的候选。本发明专利技术能生成高准确性的SPARQL查询结构图,通过使用实体链接和关系链接可以构建完整的基于知识库的问答系统。整的基于知识库的问答系统。整的基于知识库的问答系统。

【技术实现步骤摘要】
一种结构优先的知识库问答实现方法及其系统


[0001]本专利技术属于计算机
,涉及知识图谱技术及自然语言处理技术,为一种结构优先的知识库问答实现方法及其系统。
技术背景
[0002]在计算机领域中,问答是指机器回答自然语言问句,涉及了自然语言处理、信息抽取、知识表示等领域,旨在建立一个自动化的问答系统:输入的是自然语言问句,通过对结构化的知识表示或非结构化的信息采集的利用,得到问句答案并输出。其中,知识库问答是建立在知识库之上的问答系统,旨在回答基于知识库的自然语言问题。现如今,越来越多的结构化数据在网络上可供使用,包括DBpedia,Freebase,YAGO等知识库,终端用户如何方便快捷地访问知识库成为了一个重要的话题。
[0003]资源描述框架(RDF)作为知识库的标准表示,由三元组构成<s,p,o>,其中s=subject,p=predicate,o=object,通常被表达为图结构。SPARQL语言(SPARQL Protocol and RDF Query Language)是为RDF开发的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种结构优先的知识库问答实现方法,其特征是包括问句结构分析和SPARQL查询结构图生成两部分,问句结构分析由自然语言问句解析得到句法树,然后构建实体描述图和放松查询图;所述实体描述图是对问句中实体和对应描述的图结构表示,通过实体+描述构成的实体块对问句进行子问题嵌套划分,表达了问句的结构层次;放松查询图是自然语言在查询上图结构的体现;SPARQL查询结构图生成包括查询结构映射库的构造和SPARQL查询结构图候选的构造,SPARQL查询结构图从放松查询结构图出发,学习问句的放松查询结构图和SPARQL查询结构图之间的映射关系,使用构建模板的方式,构建放松查询结构图和SPARQL查询结构图的查询结构映射库,然后对于待求问句,从映射库中提取可覆盖待求问句放松查询结构图的模板,通过规则拼接得到待求问句对应SPARQL查询结构图候选,基于知识图谱的实体和关系链接,对SPARQL查询结构图候选进行知识库实体和关系的填槽,得到SPARQL查询,并从知识库中查询返回答案。2.根据权利要求1所述的一种结构优先的知识库问答实现方法,其特征是由句法树构建实体描述图和放松查询图的步骤如下:步骤1:将问句中的引用和长实体的部分进行替换,所述长实体指token数大于3的部分,引用部分替换为标记<QUOTE>,长实体部分替换为标记<ENTITY>;步骤2:由句法树出发,对句法树中的所有非终止标签做处理,递归生成实体描述图的顶点和边,对不同的标签,根据当前标签和其子节点的标签名称,以及上层生成的实体描述图顶点,确定顶点和边的生成方式;步骤3:构建生成实体描述图后,回代引用和长实体标记<QUOTE>,<ENTITY>,得到完整实体描述图;步骤4:从实体描述图出发,对每个实体块中的动词短语描述和非动词短语描述分别采用不同的方法识别处理:从非动词短语描述中,使用命名实体识别方法,识别出实体的名称和类name/class,放入放松查询图中实体内部,name/class作为实体顶点的内部属性;从动词短语描述中,根据短语句法树结构提取出动词/关系,新增实体顶点的出边,将动词/关系作为放松查询图边的属性,同时边指向生成的新的实体顶点;步骤5:对从实体描述图的每个实体块出发得到的图结构进行实体顶点的合并,得到最终的放松查询图。3.根据权利要求1所述的一种结构优先的知识库问答实现方法,其特征是查询结构映射库由多问句类型的模板组成,问句类型分为:一般疑问句、询问数量的问句和询问实体本身的问句,每个模板由一个放松查询结构图、n个SPARQL查询结构图、一个放松查询结构图与n个SPARQL查询结构图的n个映射关系函数map,以及n个SPARQL查询结构图对应打分构成;映射库的构建方法为:步骤1:对问句进行分类,分为一般疑问句、询问数量...

【专利技术属性】
技术研发人员:潘笑吟瞿裕忠
申请(专利权)人:南京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1