【技术实现步骤摘要】
知识库及其建立、修改、智能问答方法、装置及设备
本专利技术实施例涉及智能问答技术,尤其涉及一种建立智能问答知识库的方法、装置、知识库、智能问答方法、装置、知识库的修改方法、装置、终端设备以及存储介质。
技术介绍
在智能问答系统中,有一些知识点不是从简单的问答对而来,而是来自于一些二维表结构实现的结构化数据,结构化数据的数据量很庞大,如表1所示的理财表对应着约8*5条知识点(如增利系列九十天的年利率是多少),知识点包括问题和答案,知识量很大,而且每条知识点都需要操作人员手动整理。表1理财表如果表中内容一旦大批量修改,操作人员就需要找到对应的知识点的答案一一做变更,不但工作量大,而且容易出差错。
技术实现思路
有鉴于此,本专利技术实施例提供一种知识库及其建立、修改、智能问答方法、装置、设备及存储介质,以实现自动生成知识点,减少操作人员工作量并提高知识点的准确性。第一方面,本专利技术实施例提供了一种建立智能问答知识库的方法,所述方法包括:获取结构化数据,所述结构化数据包括标题、表头和表体;从表头中确定所述表体对应的两个以上属性信息,每个所述属性信息与一列或多列的表头内容对应;根据所述属性信息生成一个或多个问答知识点,每个问答知识点包括问题表达式和答案表达式,所述答案表达式包括所述标题;将所述结构化数据、所述问答知识点及所述属性信息存储到知识库中。第二方面,本专利技术实施例还提供了一种智能问答知识库,所述智能问答知识库通过本专利技术任一实施例所述的建立智能问答知识库的方法建立。第三方面,本专利技术实施例还提供了一种基于本专利技术任一实施例所述的知识库的智能问答方法,所 ...
【技术保护点】
一种建立智能问答知识库的方法,其特征在于,所述方法包括:获取结构化数据,所述结构化数据包括标题、表头和表体;从表头中确定所述表体对应的两个以上属性信息,每个所述属性信息与一列或多列的表头内容对应;根据所述属性信息生成一个或多个问答知识点,每个问答知识点包括问题表达式和答案表达式,所述答案表达式包括所述标题;将所述结构化数据、所述问答知识点及所述属性信息存储到知识库中。
【技术特征摘要】
1.一种建立智能问答知识库的方法,其特征在于,所述方法包括:获取结构化数据,所述结构化数据包括标题、表头和表体;从表头中确定所述表体对应的两个以上属性信息,每个所述属性信息与一列或多列的表头内容对应;根据所述属性信息生成一个或多个问答知识点,每个问答知识点包括问题表达式和答案表达式,所述答案表达式包括所述标题;将所述结构化数据、所述问答知识点及所述属性信息存储到知识库中。2.根据权利要求1所述的方法,其特征在于,所述结构化数据包括静态二维表或动态数据库表。3.根据权利要求2所述的方法,其特征在于,将所述结构化数据存储到知识库中,包括:当所述结构化数据为静态二维表时,存储所述静态二维表;当所述结构化数据为动态数据库表时,将所述动态数据库表对应数据库的链接信息存储到知识库中。4.根据权利要求1所述的方法,其特征在于,从表头中确定所述表体对应的两个以上属性信息包括:当多列数据的表头内容对应的属性相同时,将所述多列数据的表头内容归纳为一个所述属性信息;当仅一列数据的表头内容对应一个属性时,直接将该列数据的表头内容作为一个所述属性信息。5.根据权利要求4所述的方法,其特征在于,还包括:建立所述属性信息与对应的表体中内容或表头内容的包含关系;将所述包含关系存储到知识库中。6.根据权利要求5所述的方法,其特征在于,还包括:为所述表头或/和所述表体中的词语建立词类,所述词语作为对应词类的词类名,所述词类包括所述词语以及所述词语的同义词;建立所述属性信息与对应的表体中内容的包含关系包括:建立所述属性信息与对应的表体或表头中词类名的包含关系;将所述包含关系存储到知识库中还包括:将所述词类存储到知识库中。7.根据权利要求1所述的方法,其特征在于,根据所述属性信息生成一个或多个问答知识点包括:根据至少两个所述属性信息自动生成一个初始知识点;对每个所述初始知识点进行调整,得到所述问答知识点。8.一种通过如权利要求1-7任一所述的建立智能问答知识库的方法建立的智能问答知识库。9.一种基于权利要求8所述的知识库的智能问答方法,其特征在于,所述方法包括:在接收到用户的请求信息时,根据所述请求信息匹配知识库中的问答知识点;根据匹配到的问答知识点对应的所述标题,获取对应的结构化数据;根据所述请求信息在所述结构化数据中查找对应的答案,根据查找到的答案以及确定的答案表达式生成最终答案,将所述最终答案返回给所述用户。10.根据权利要求9所述的方法,其特征在于,根据匹配到的问答知识点对应的所述标题,获取对应的结构化数据,包括:根据所述标题,查找对应的静态二维表或动态数据库表对应数据库的链接信息;获取查找到的静态二维表,或根据所述链接信息获取对应的动态数据库表。11.一种修改权利要求8所述的知识库的方法,其特征在于,所述方法包括:获取结构化数据;接收对所述结构化数据的修改指令以修改知识库中存储的结构化数据;根据所述修改对知识库中的问答知识点及对应的属性信息进行修改。12.根据权利要求11所述的方法,其特征在于,所述修改指令包括:修改所述标题、修改表头内容、修改表体内容、增加整列数据、增加表体的整行数据、删除表体的整行数据以及删除整列数据中的至少一种。13.根据权利要求12所述的方法,其特征在于,根据所述修改对知识库中的问答知识点及对应的属性信息进行修改,包括:当所述修改为修改所述标题时,修改对应的问答知识点中的答案表达式中的标题;当所述修改包括修改、增加及删除表头内容时,修改对应的属性信息及对应的问答知识点。14.一种建立智能问答知识库的装置,其特征在于,所述装置包括:数据获取模块,用于获取结构化数据,所述结构化数据包括标题、表头和表体;属性确定模块,用于从表头中确定所述表体对应的两个以上属性信息,每个所述属性信息与一列或多列的表头内容对应;知识点生成模块,用于根据所述属性信息生成一个或多个问答知识点,每个问答知识点包括问题表达式和答案表达式,所述答案表达式包括所述标题;存储模块,用于将所述结构化数据、所述问答知识点及所述属性信息存储到知识库中。15.根据权利要求14所述的装置,其特征在于,所述结构化数据包括静态二维表或动态数据库表。...
【专利技术属性】
技术研发人员:李波,程洁,姜中秋,姚贡之,曾永梅,朱频频,
申请(专利权)人:上海智臻智能网络科技股份有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。