一种问答知识库的优化方法及其装置制造方法及图纸

技术编号:24799566 阅读:18 留言:0更新日期:2020-07-07 21:03
本发明专利技术提供了一种问答知识库的优化方法,用于基于交互日志优化问答知识库,所述问答知识库包括多个知识点,每个知识点对应于一标准问,所述标准问关联有多个扩展问以及一个答案,所述优化方法包括:获取关于问答知识库的所有交互日志中的所有未回答问题;将所有未回答问题进行分类和/或聚类以获得至少一个分类问题集合和/或至少一个聚类问题集合;以及基于所述至少一个分类问题集合和/或所述至少一个聚类问题集合生成优化数据以优化所述问答知识库。

【技术实现步骤摘要】
一种问答知识库的优化方法及其装置
本专利技术涉及智能问答领域,尤其涉及一种问答知识库的优化方法及其装置。
技术介绍
人机交互是研究系统与用户之间的交互关系的科学。系统可以是各种各样的机器,也可以是计算机化的系统和软件。例如,通过人机交互可以实现各种人工智能系统,例如,智能客服系统、语音控制系统等等。智能问答系统是人机交互的一种典型应用,其中当用户提出问题后,智能问答系统给出该问题的答案。为此,智能问答系统中有一套知识库,里面有大量的问题和与每个问题相对应的答案。智能问答系统首先需要识别用户所提出的问题,即从知识库中找到与该用户问题所对应的问题,然后找出与该问题相匹配的答案。在某些情况下,由于用户的表达习惯与知识库中的问题的表述方式差异很大,智能问答系统无法将用户的问题与知识库中的问题进行匹配,从而无法找出对应的答案。还有一些情况下,由于知识库的限制,用户可能会产生一些知识库中不存在的问题,智能问答系统亦无法找出该些问题对应的答案。上述情况下,用户会产生不良的使用体验,因此需要基于该些未回答的问题持续改进智能问答系统,以防止其它用户产生相同的不良体验。现有技术中,需要运营人员对该智能问答系统的交互日志进行统计和分析,再根据分析结果优化智能问答系统,费时费力。因此,本专利技术旨在提供一种能够半自动辅助运营人员快速优化智能问答系统的方法。
技术实现思路
为了克服上述缺陷,本专利技术旨在提供一种问答知识库的优化方法。根据本专利技术的一方面,提供了一种优化方法,用于基于交互日志优化问答知识库,所述问答知识库包括多个知识点,每个知识点对应于一标准问,所述标准问关联有多个扩展问以及一个答案,所述优化方法包括:获取关于问答知识库的所有交互日志中的所有未回答问题;将所有未回答问题进行分类和/或聚类以获得至少一个分类问题集合和/或至少一个聚类问题集合;以及基于所述至少一个分类问题集合和/或所述至少一个聚类问题集合生成优化数据以优化所述问答知识库。更进一步地,所述获得至少一个分类问题集合和/或至少一个聚类问题集合包括:利用深度学习模型将所有未回答问题与所述问答知识库中的所有标准问及其扩展问进行匹配;以及响应于任一未回答问题与任一标准问或任一扩展问匹配成功,将所述未回答问题分类至与所述标准问或所述扩展问关联的标准问对应的分类问题集合;和/或响应于任一未回答问题与所述问答知识库中的所有标准问及其扩展问匹配失败,将所述未回答问题聚类至与其语义相似的聚类问题集合。更进一步地,所述优化方法还包括:基于所述优化数据训练所述深度学习模型以优化所述深度学习模型。更进一步地,所述生成优化数据包括:基于人工确认结果判断每一分类问题集合及其对应的标准问是否匹配正确;以及响应于一分类问题集合及其对应的标准问匹配正确,将所述分类问题集合中的所有问题设定为优化数据;和/或基于人工确认结果判断是否基于每一聚类问题集合生成新的知识点;响应于确认基于一聚类问题集合生成新的知识点,将所述聚类问题集合中的一个未回答问题设为所述新的知识点的标准问,将所述聚类问题集合中的其余未回答问题设为所述新的知识点的扩展问,并将人工标注的答案作为所述新的知识点的标准问关联的答案;以及将所述新的知识点设定为优化数据。更进一步地,所述优化问答知识库包括:将基于分类问题集合生成的优化数据中的所有未回答问题设为其对应的标准问的扩展问;和/或将基于聚类问题集合生成的优化数据中的每一新的知识点设为所述问答知识库中的一个知识点,所述新的知识点对应的标准问及其关联的扩展问和答案为所述知识点对应的标准问及其关联的扩展问和答案。更进一步地,所述优化方法还包括:获取关于问答知识库的所有交互日志中的所有已回答问题及其对应的标准问A;将每一已回答问题输入所述深度学习模型以获得与所述已回答问题匹配的标准问B;基于所述每一已回答问题对应的标准问A和标准问B对所述已回答问题进行质检。更进一步地,所述质检包括:响应于所述标准问A和标准问B相同,判断所述已回答问题质检通过;响应于所述标准问A和标准问B不同,分别计算每一已回答问题与标准问A和标准问B的相似度;响应于所述已回答问题与标准问A和标准问B的相似度差值小于预设阈值,将所述已回答问题设为待质检问题;以及响应于所述已回答问题与标准问A和标准问B的相似度差值大于预设阈值,判断所述已回答问题质检通过。更进一步地,所述质检还包括:输出所述待质检问题以供人工确认。更进一步地,所述质检基于热点知识或预设知识进行。根据本专利技术的另一个方面,提供了一种问答知识库的优化装置,用于基于交互日志优化问答知识库,所述问答知识库包括多个知识点,每个知识点对应于一标准问,所述标准问关联有多个扩展问以及一个答案,所述优化装置包括:获取模块,用于获取关于问答知识库的所有交互日志中的所有未回答问题;问题集合生成模块,与所述获取模块耦接并接收所述获取模块获取的所有未回答问题,所述问题集合生成模块还用于将所有未回答问题进行分类和/或聚类以获得至少一个分类问题集合和/或至少一个聚类问题集合;以及优化模块,与所述问题集合生成模块耦接并基于所述至少一个分类问题集合和/或所述至少一个聚类问题集合生成优化数据以优化所述问答知识库。根据本专利技术的另一个方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器上的计算机程序,其特征在于,所述处理器被用于执行存储在所述存储器上的计算机程序时实现如上述任一项所述的优化方法的步骤。根据本专利技术的另一个方面,提供了一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被执行时实现如上述任一项所述优化方法的步骤。附图说明在结合以下附图阅读本公开的实施例的详细描述之后,更能够更好地理解本专利技术的上述特征和优点。图1A是根据本专利技术的一个方面绘示的一实施例的优化方法流程图;图1B是根据本专利技术的一个方面绘示的一实施例的质检过程流程图;图2A是根据本专利技术的另一个方面绘示的一实施例的硬件框图;图2B是根据本专利技术的另一个方面绘示的另一实施例的硬件框图。具体实施方式以下结合附图和具体实施例对本专利技术作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本专利技术的保护范围进行任何限制。问答知识库中的基本知识点最原始和最简单的形式就是平时常用的FAQ,一般的形式是“问-答”对。在本专利技术中,“标准问”是用来表示某个知识点的文字,主要目标是表达清晰,便于维护。例如,“彩铃的资费”就是表达清晰的标准问描述。这里的“问”不应被狭义地理解为“询问”,而应广义地来理解一“输入”,该“输入”具有对应的“输出”。例如,对于用于控制系统的语义识别而言,用户的一个指令,例如“打开收音机”也应可以被理解为是一个“问”,此时对应的“答”可以是用于执行相应控制的控制程序的调用。用户在向机器输入时,最理想的情况是使用标准问,则机器的智能语义识别系统马上能够理解用户的意思。然而,用户往往并非使用的是标准问本文档来自技高网...

【技术保护点】
1.一种问答知识库的优化方法,用于基于交互日志优化问答知识库,所述问答知识库包括多个知识点,每个知识点对应于一标准问,所述标准问关联有多个扩展问以及一个答案,所述优化方法包括:/n获取关于问答知识库的所有交互日志中的所有未回答问题;/n将所有未回答问题进行分类和/或聚类以获得至少一个分类问题集合和/或至少一个聚类问题集合;以及/n基于所述至少一个分类问题集合和/或所述至少一个聚类问题集合生成优化数据以优化所述问答知识库。/n

【技术特征摘要】
1.一种问答知识库的优化方法,用于基于交互日志优化问答知识库,所述问答知识库包括多个知识点,每个知识点对应于一标准问,所述标准问关联有多个扩展问以及一个答案,所述优化方法包括:
获取关于问答知识库的所有交互日志中的所有未回答问题;
将所有未回答问题进行分类和/或聚类以获得至少一个分类问题集合和/或至少一个聚类问题集合;以及
基于所述至少一个分类问题集合和/或所述至少一个聚类问题集合生成优化数据以优化所述问答知识库。


2.如权利要求1所述的优化方法,其特征在于,所述获得至少一个分类问题集合和/或至少一个聚类问题集合包括:
利用深度学习模型将所有未回答问题与所述问答知识库中的所有标准问及其扩展问进行匹配;以及
响应于任一未回答问题与任一标准问或任一扩展问匹配成功,将所述未回答问题分类至与所述标准问或所述扩展问关联的标准问对应的分类问题集合;和/或
响应于任一未回答问题与所述问答知识库中的所有标准问及其扩展问匹配失败,将所述未回答问题聚类至与其语义相似的聚类问题集合。


3.如权利要求2所述的优化方法,其特征在于,还包括:
基于所述优化数据训练所述深度学习模型以优化所述深度学习模型。


4.如权利要求1所述的优化方法,其特征在于,所述生成优化数据包括:
基于人工确认结果判断每一分类问题集合及其对应的标准问是否匹配正确;以及
响应于一分类问题集合及其对应的标准问匹配正确,将所述分类问题集合中的所有问题设定为优化数据;和/或
基于人工确认结果判断是否基于每一聚类问题集合生成新的知识点;
响应于确认基于一聚类问题集合生成新的知识点,将所述聚类问题集合中的一个未回答问题设为所述新的知识点的标准问,将所述聚类问题集合中的其余未回答问题设为所述新的知识点的扩展问,并将人工标注的答案作为所述新的知识点的标准问关联的答案;以及
将所述新的知识点设定为优化数据。


5.如权利要求4所述的优化方法,其特征在于,所述优化问答知识库包括:
将基于分类问题集合生成的优化数据中的所有未回答问题设为其对应的标准问的扩展问;和/或
将基于聚类问题集合生成的优化数据中的每一新的知识点设为所述问答知识库中的一个知识点,所述新的知识点对应的标准问及其关联的扩展问和答案为...

【专利技术属性】
技术研发人员:李波姚贡之姜中秋朱频频
申请(专利权)人:上海智臻智能网络科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1