一种知识库优化方法、装置、设备及存储介质制造方法及图纸

技术编号:30766249 阅读:18 留言:0更新日期:2021-11-10 12:26
本申请提供了一种知识库优化方法、装置、设备及存储介质,方法包括:获取人机历史对话中的样本数据;以样本数据中的每一个问题为一个节点,其中相同的问题为同一个节点,以问题出现的次数为节点权重,以至少一个问题中的各个问题提出的先后关系为有向边,建立知识图谱;根据知识图谱,确定第一问题集合;第一问题集合用于指示用户关注度高的问题;根据知识图谱,预测用户的意图;基于第一问题集合和用户的意图,更新知识库中的问题列表和问题列表中的每一个问题的答案。实施本申请实施例,能够丰富人机对话系统的知识库,人机对话设备基于知识库回答用户问题时,提高回答问题的正确率,提高人机对话效率。提高人机对话效率。提高人机对话效率。

【技术实现步骤摘要】
一种知识库优化方法、装置、设备及存储介质


[0001]本申请涉及知识图谱领域,尤其涉及一种知识库优化方法、装置、设备及存储介质。

技术介绍

[0002]传统的人机对话系统,当用户提出问题后,人机对话设备会识别用户的问题,但是由于人机对话设备后端知识库中存储的答案有限,呈现出的答案往往不是用户所需的,甚至有时候呈现不出答案;或者,当用户大概地描述了一个问题后,人机对话设备根据用户大概描述的问题会推送出多个问题,以使用户从中选择出刚刚所描述的问题是否是推送出的多个问题中的一个,但是由于人机对话设备后端知识库中存储的问题有限,导致推出的问题不是用户所问的;等等,因此造成人机对话效率低,甚至人机对话并未解决用户的问题。

技术实现思路

[0003]本申请提供了一种知识库优化方法、装置、设备及存储介质,所述方法能够丰富人机对话设备中的知识库中的问题和答案,从而提高人机对话效率。
[0004]第一方面,本申请提供了一种知识库优化方法,包括:获取人机历史对话中的样本数据;所述样本数据包括人机历史对话中的多个用户中的每个用户提出的一个或多个问题,以及所述问题提出的先后关系;以所述样本数据中的每一个问题为一个节点,其中相同的问题为同一个节点,以问题出现的次数为节点权重,以所述至少一个问题中的各个问题提出的先后关系为有向边,建立知识图谱;根据所述知识图谱,确定第一问题集合;所述第一问题集合中包括节点权重大于第一阈值的节点所在的问题;所述第一问题集合用于指示用户关注度高的问题;根据所述知识图谱,预测用户的意图;基于所述第一问题集合和所述用户的意图,更新知识库中的问题列表和所述问题列表中的每一个问题的答案。
[0005]本申请,先根据人与设备实际对话中的问题建立知识图谱,然后,根据知识图谱确定出第一问题集合,即用户提问的次数多的问题(关注度高的问题),并预测出用户的意图。其中被提问次数多的问题固定是用户关心的重要问题,再分别根据用户关心的重要问题和用户的意图,对知识库进行优化、修正,以完善、丰富人机对话系统中的知识库中的问题和答案。当用户再次提出问题,人机对话设备能够基于丰富的知识库,解答用户的问题,从而提高人机对话的效率。
[0006]基于第一方面,在可能的实现方式中,所述样本数据中的每个问题中携带了提出所述问题的第一用户标识及第一标签信息;其中所述第一用户标识与所述第一标签信息一一对应,所述第一标签信息用于指示是否引发转人工服务;相应地,所述知识图谱中的每个节点具有至少一个节点属性;所述节点属性包括提出所述节点所在的问题的第二用户标识和第二标签信息;其中,所述节点属性、第二用户标识、所述第二标签信息之间具有一一对应的关系。
[0007]每个节点的问题被至少一个用户提出过,因此每个节点具有至少一个节点属性。
通过设置提出该节点的问题的用户的标识,可以确定每个节点的问题被哪些用户提出过,同时也可以确定提出该节点的问题的用户还提出了其他的哪些问题;根据每个节点属性,可以知道提出该节点的问题的用户是否转接了人工服务,以及该节点的问题是否是用户在转人工服务之前提出的最后一个问题;节点属性的设置使得所有问题与多个用户之间的关系更加明确,便于后续统计工作。
[0008]基于第一方面,在可能的实现方式中,在所述基于所述第一问题集合和所述用户的意图,丰富知识库中的问题列表和所述问题列表中的每一个问题的答案之前,所述方法还包括:根据所述知识图谱中的每个节点的所述至少一个节点属性,确定第二问题集合;所述第二问题集合用于指示转了人工服务的用户中的每个用户提出的一个或多个问题及所述问题中的各个问题提出的先后关系;根据所述第二问题集合,确定第三问题集合;所述第三问题集合用于指示导致所述转了人工服务的用户中的每个用户转人工服务的根本问题。
[0009]对于转接了人工服务的用户,表明在转接人工服务之前该用户问的问题中有的问题没有得到解答,因此需要确定哪些或哪个问题没有得到解答,也就是导致用户转人工服务的根本问题。在确定出导致用户转人工服务的根本问题后,基于导致用户转人工服务的根本问题对人机对话系统进行修正、优化,使得人机对话系统中的知识库更加完善。
[0010]基于第一方面,在可能的实现方式中,所述基于所述第一问题集合和所述用户的意图,更新知识库中的问题列表和所述问题列表中的每一个问题的答案,包括:将所述第一问题集合、第三问题集合、所述用户的意图与所述知识库中的问题列表进行比较,确定待补充列表;所述待补充列表用于指示所述知识库的问题列表中不包括的问题但所述第一问题集合或所述第三问题集合或所述用户的意图中包括的问题;将所述待补充列表填充在所述知识库中的问题列表后,并将所述待补充列表中的每一个问题的答案填充在对应的答案列表中。基于第一方面,在可能的实现方式中,根据所述知识图谱中的每个节点的所述至少一个节点属性,确定第二问题集合,包括:根据所述知识图谱中的每个节点的所述至少一个节点属性,确定用户标识集合;所述用户标识集合用于指示所述转了人工服务的至少一个用户;基于所述用户标识集合中的每一个用户标识,确定出包括所述用户标识的节点;根据所述包括所述用户标识的节点,确定所述第二问题集合。
[0011]基于第一方面,在可能的实现方式中,所述第一问题集合还包括节点的出度数量与入度数量之和大于第二阈值的节点所在的问题,其中,所述出度数量指的是以所述节点为尾的边的数量,所述入度数量指的是以所述节点为头的边的数量;相应地,所述根据所述知识图谱,确定第一问题集合,还包括:根据所述知识图谱,分别确定各个节点中的每个节点的出度数量与入度数量;将所述各个节点中的每个节点的出度数量与入度数量之和与所述第二阈值进行比较,确定节点的出度数量与入度数量之和大于所述第二阈值的节点,从而确定出第一问题集合。
[0012]基于第一方面,在可能的实现方式中,所述方法还包括:接收用户的指令;所述指令用于指示用户提出的问题;响应于用户的指令,基于所述知识库中的问题列表和所述问题列表中的每一个问题的答案输出并显示回答。
[0013]本申请的方法适用于人机对话设备,在采用本申请的方法丰富知识库后,人机对话设备还用于接收用户的指令,指令用于指示用户提出的问题,人机对话设备接收到用户的指令后,响应于用户的指令,根据知识库中的问题列表和答案输出关于用户问题的回答,
并显示出来。
[0014]第二方面,本申请提供了一种优化人机对话系统的装置,包括:
[0015]获取单元,用于获取人机历史对话中的样本数据;所述样本数据包括人机历史对话中的多个用户中的每个用户提出的一个或多个问题,以及所述问题提出的先后关系;
[0016]知识图谱单元,用于以所述样本数据中的每一个问题为一个节点,其中相同的问题为同一个节点,以问题出现的次数为节点权重,以所述至少一个问题中的各个问题提出的先后关系为有向边,建立知识图谱;
[0017]确定单元,用于根据所述知识图谱,确定第一问题集合;所述第一问题集合包括节点权重大于第一阈值的节点所在的问题;所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识库优化方法,其特征在于,包括:获取人机历史对话中的样本数据;所述样本数据包括人机历史对话中的多个用户中的每个用户提出的一个或多个问题,以及所述问题提出的先后关系;以所述样本数据中的每一个问题为一个节点,其中相同的问题为同一个节点,以问题出现的次数为节点权重,以所述至少一个问题中的各个问题提出的先后关系为有向边,建立知识图谱;根据所述知识图谱,确定第一问题集合;所述第一问题集合包括节点权重大于第一阈值的节点所在的问题;所述第一问题集合用于指示用户关注度高的问题;根据所述知识图谱,预测用户的意图;基于所述第一问题集合和所述用户的意图,更新知识库中的问题列表和所述问题列表中的每一个问题的答案。2.根据权利要求1所述的方法,其特征在于,所述样本数据中的每个问题携带了提出所述问题的第一用户标识及第一标签信息;其中所述第一用户标识与所述第一标签信息一一对应,所述第一标签信息用于指示是否引发转人工服务;相应地,所述知识图谱中的每个节点具有至少一个节点属性;所述节点属性包括提出所述节点所在的问题的第二用户标识和第二标签信息;其中,所述节点属性、第二用户标识、所述第二标签信息之间一一对应。3.根据权利要求2所述的方法,其特征在于,在所述基于所述第一问题集合和所述用户的意图,更新知识库中的问题列表和所述问题列表中的每一个问题的答案之前,所述方法还包括:根据所述知识图谱中的每个节点的所述至少一个节点属性,确定第二问题集合;所述第二问题集合用于指示转了人工服务的用户中的每个用户提出的一个或多个问题及所述问题中的各个问题提出的先后关系;根据所述第二问题集合,确定第三问题集合;所述第三问题集合用于指示导致所述转了人工服务的用户中的每个用户转人工服务的根本问题。4.根据权利要求3所述的方法,其特征在于,所述基于所述第一问题集合和所述用户的意图,更新知识库中的问题列表和所述问题列表中的每一个问题的答案,包括:将所述第一问题集合、所述第三问题集合、所述用户的意图与所述知识库中的问题列表进行比较,确定待补充列表;所述待补充列表用于指示所述知识库的问题列表中不包括的问题但所述第一问题集合或所述第三问题集合或所述用户的意图中包括的问题;将所述待补充列表填充在所述知识库中的问题列表后,并将所述待补充列表中的每一个问题的答案填充在对应的答案列表中。5.根据权利要求3或4所述的方法,其特征在于,根据所述知识图谱中的每个节点的所述至...

【专利技术属性】
技术研发人员:龚燕覃德童怡
申请(专利权)人:未鲲上海科技服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1