自动问答知识库的建设方法及建设系统技术方案

技术编号:21913903 阅读:26 留言:0更新日期:2019-08-21 12:24
本发明专利技术实施例公开了一种自动问答知识库的建设方法及建设系统,所述建设方法包括:获取动态数据库表;从表头中确定所述表体对应的两个以上属性信息;根据所述属性信息生成一个或多个自动问答知识点,每个自动问答知识点包括问题表达式和答案表达式,所述答案表达式包括所述题目;将所述动态数据库表对应数据库的链接信息、所述自动问答知识点及所述属性信息存储到知识库中。本发明专利技术实施例实现了根据动态数据库表自动生成知识点,并建立对应的知识库,减少了操作人员工作量并减少了人为犯错的可能,提高了生成的知识点的准确性和生成效率。

Construction Method and System of Question and Answer Knowledge Base

【技术实现步骤摘要】
自动问答知识库的建设方法及建设系统
本专利技术实施例涉及自动问答技术,尤其涉及一种自动问答知识库的建设方法、自动问答知识库、自动问答方法、自动问答系统、自动问答知识库的建设系统、终端设备以及计算机存储介质。
技术介绍
在自动问答系统中,有一些知识点不是从简单的自动问答对而来,而是来自于一些动态数据库表结构实现的结构化数据,结构化数据的数据量很庞大,如表1所示的理财表对应着约8*5条知识点(如增利系列九十天的年利率是多少),知识点包括问题和答案,知识量很大,而且每条知识点都需要操作人员手动整理。表1理财表如果表中内容一旦大批量修改,操作人员就需要找到对应的知识点的答案一一做变更,不但工作量大,而且容易出差错。
技术实现思路
有鉴于此,本专利技术实施例提供一种自动问答知识库的建设方法、自动问答知识库、自动问答方法、自动问答系统、自动问答知识库的建设系统、终端设备以及计算机存储介质,以实现自动生成知识点,减少操作人员工作量并提高知识点的准确性。本专利技术实施例提供了一种自动问答知识库的建设方法,包括:获取动态数据库表,所述动态数据库表包括题目、表头和表体,所述表头为第一行,所述表体为第一行之外的其它行;从表头中确定所述表体对应的两个以上属性信息,当多列数据的表头内容对应的属性相同时,将所述多列数据的表头内容归纳为一个所述属性信息,当仅一列数据的表头内容对应一个属性时,直接将该列数据的表头内容作为一个所述属性信息;根据所述属性信息生成一个或多个自动问答知识点,每个自动问答知识点包括问题表达式和答案表达式,所述答案表达式包括所述题目;将所述动态数据库表对应数据库的链接信息、所述自动问答知识点及所述属性信息存储到知识库中。可选地,所述方法还包括:建立所述属性信息与对应的表体中内容或表头内容的包含关系;将所述包含关系存储到知识库中。可选地,所述方法还包括:为所述表头或/和所述表体中的词语建立词类,所述词语作为对应词类的词类名,所述词类包括所述词语以及所述词语的同义词;建立所述属性信息与对应的表体中内容的包含关系包括:建立所述属性信息与对应的表体或表头中词类名的包含关系;将所述包含关系存储到知识库中还包括:将所述词类存储到知识库中。可选地,根据所述属性信息生成一个或多个自动问答知识点包括:根据至少两个所述属性信息自动生成一个初始知识点;对每个所述初始知识点进行调整,得到所述自动问答知识点。本专利技术实施例还提供了一种采用上述的自动问答知识库的建设方法建设的自动问答知识库。本专利技术实施例还提供了一种基于上述自动问答知识库的自动问答方法,包括:在接收到用户的请求信息时,根据所述请求信息匹配知识库中的自动问答知识点;根据匹配到的自动问答知识点对应的所述题目,查找对应的动态数据库表对应数据库的链接信息,并获取查找到的动态数据库表;根据所述请求信息在所述动态数据库表中查找对应的答案,根据查找到的答案以及确定的答案表达式生成最终答案,将所述最终答案返回给所述用户。本专利技术实施例还提供了一种基于上述自动问答知识库的自动问答系统,包括:请求匹配模块,用于在接收到用户的请求信息时,根据所述请求信息匹配知识库中的问答知识点;数据获取模块,用于根据匹配到的问答知识点对应的所述题目,查找对应的动态数据库表对应数据库的链接信息,并根据所述链接信息获取对应的动态数据库表;答案生成模块,根据所述请求信息在所述动态数据库表中查找对应的答案,根据查找到的答案以及确定的答案表达式生成最终答案;答案返回模块,用于将所述最终答案返回给所述用户。本专利技术还提供了一种自动问答知识库的建设系统,包括:数据获取模块,用于获取动态数据库表,所述动态数据库表包括题目、表头和表体,所述表头为第一行,所述表体为第一行之外的其它行;属性确定模块,从表头中确定所述表体对应的两个以上属性信息,当多列数据的表头内容对应的属性相同时,将所述多列数据的表头内容归纳为一个所述属性信息,当仅一列数据的表头内容对应一个属性时,直接将该列数据的表头内容作为一个所述属性信息;知识点生成模块,根据所述属性信息生成一个或多个自动问答知识点,每个自动问答知识点包括问题表达式和答案表达式,所述答案表达式包括所述题目;存储模块,用于将所述动态数据库表对应数据库的链接信息、所述自动问答知识点及所述属性信息存储到知识库中。本专利技术实施例还提供了一种终端设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述自动问答知识库的建设方法或上述自动问答方法。本专利技术实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述自动问答知识库的建设方法或上述自动问答方法。本专利技术实施例的技术方案,通过获取动态数据库表,从动态数据库表的表头中确定表体对应的两个以上属性信息,根据所述属性信息生成一个或多个自动问答知识点,每个自动问答知识点包括问题表达式和答案表达式,所述答案表达式包括所述题目,将动态数据库表、自动问答知识点及属性信息存储到知识库中,实现了根据动态数据库表自动生成知识点,并建立对应的知识库,不再需要操作人员根据动态数据库表手动整理知识点,减少了操作人员的工作量,并减少了人为犯错的可能,提高了生成的知识点的准确性和生成效率。而且在对动态数据库表进行修改时,可以不必像现有技术那样对手动整理生成的每条知识点进行修改,只需修改变化的属性信息对应的自动问答知识点,大大减少了操作人员的工作量。附图说明图1是本专利技术实施例一提供的一种自动问答知识库的建设方法的流程图;图2为本专利技术实施例一提供的自动问答知识库的建设方法中的对表1的主键列建立词类的示意图;图3为本专利技术实施例一提供的自动问答知识库的建设方法中的对表1的其他列的列题目建立词类的示意图;图4是本专利技术实施例三提供的一种自动问答方法的流程图;图5是本专利技术实施例四提供的一种自动问答系统的结构示意图;图6是本专利技术实施例五提供的一种自动问答知识库的建设系统的结构示意图;图7为本专利技术实施例六提供的一种终端设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。为了便于理解本专利技术实施例的内容,先介绍一下自动问答中常用到的名词:1知识点知识库中的基本知识点最原始和最简单的形式就是平时常用的FAQ,一般的形式是“问-答”对。例如,“彩铃的资费”就是表达清晰的标准问描述。这里的“问”不应被狭义地理解为“询问”,而应广义地来理解一“输入”,该“输入”具有对应的“输出”。例如,对于用于控制系统的语义识别而言,用户的一个指令,例如“打开收音机”也应可以被理解为是一个“问”,此时对应的“答”可以是用于执行相应控制的控制程序的调用。用户在向机器输入时,最理想的情况是使用标准问,则机器的智能语义识别系统马上能够理解用户的意思。然而,用户往往并非使用的是标准问,而是标准问的一些变形的形式。例如,若对于收音机的电台切换的标准问形式是“换一个电台”,那么用户可能使用的命令是“切换一个电台”,机器也需要能够识别用户表达的是同一个意思。对于智本文档来自技高网...

【技术保护点】
1.一种自动问答知识库的建设方法,其特征在于,包括:获取动态数据库表,所述动态数据库表包括题目、表头和表体,所述表头为第一行,所述表体为第一行之外的其它行;从表头中确定所述表体对应的两个以上属性信息,当多列数据的表头内容对应的属性相同时,将所述多列数据的表头内容归纳为一个所述属性信息,当仅一列数据的表头内容对应一个属性时,直接将该列数据的表头内容作为一个所述属性信息;根据所述属性信息生成一个或多个自动问答知识点,每个自动问答知识点包括问题表达式和答案表达式,所述答案表达式包括所述题目;将所述动态数据库表对应数据库的链接信息、所述自动问答知识点及所述属性信息存储到知识库中。

【技术特征摘要】
1.一种自动问答知识库的建设方法,其特征在于,包括:获取动态数据库表,所述动态数据库表包括题目、表头和表体,所述表头为第一行,所述表体为第一行之外的其它行;从表头中确定所述表体对应的两个以上属性信息,当多列数据的表头内容对应的属性相同时,将所述多列数据的表头内容归纳为一个所述属性信息,当仅一列数据的表头内容对应一个属性时,直接将该列数据的表头内容作为一个所述属性信息;根据所述属性信息生成一个或多个自动问答知识点,每个自动问答知识点包括问题表达式和答案表达式,所述答案表达式包括所述题目;将所述动态数据库表对应数据库的链接信息、所述自动问答知识点及所述属性信息存储到知识库中。2.如权利要求1所述的方法,其特征在于,还包括:建立所述属性信息与对应的表体中内容或表头内容的包含关系;将所述包含关系存储到知识库中。3.根据权利要求2所述的方法,其特征在于,还包括:为所述表头或/和所述表体中的词语建立词类,所述词语作为对应词类的词类名,所述词类包括所述词语以及所述词语的同义词;建立所述属性信息与对应的表体中内容的包含关系包括:建立所述属性信息与对应的表体或表头中词类名的包含关系;将所述包含关系存储到知识库中还包括:将所述词类存储到知识库中。4.根据权利要求1所述的方法,其特征在于,根据所述属性信息生成一个或多个自动问答知识点包括:根据至少两个所述属性信息自动生成一个初始知识点;对每个所述初始知识点进行调整,得到所述自动问答知识点。5.一种通过如权利要求1-4任一所述的自动问答知识库的建设方法建设的自动问答知识库。6.一种基于权利要求5所述的自动问答知识库的自动问答方法,其特征在于,包括:在接收到用户的请求信息时,根据所述请求信息匹配知识库中的自动问答知识点;根据匹配到的自动问答知识点对应的所述题目,查找对应的动态数据库表对应数据库的链接信息,并获取查找到的动态...

【专利技术属性】
技术研发人员:李波程洁姜中秋姚贡之曾永梅朱频频
申请(专利权)人:上海智臻智能网络科技股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1