一种确定知识库中知识点类目的方法及系统技术方案

技术编号:24853444 阅读:18 留言:0更新日期:2020-07-10 19:07
本说明书实施例公开了确定知识库中知识点类目的方法及系统,所述方法包括:获取至少一个待预测知识点,并确定与至少一个待预测知识点分别对应的知识库;判断对应的知识库的类目确定方式;其中,类目确定方式包括分类模型确定、距离匹配确定以及规则匹配确定方式中的至少两个;当类目确定方式为分类模型确定时,将待预测知识点输入基于对应的知识库训练的分类模型,确定待预测知识点的类目;当类目确定方式为距离匹配确定时,基于待预测知识点与对应的知识库中每个类目的知识点之间的距离关系,确定待预测知识点的类目;当类目确定方式为规则匹配确定时,基于预设规则确定待预测知识点的类目。

【技术实现步骤摘要】
一种确定知识库中知识点类目的方法及系统
本说明书实施例涉及数据处理领域,特别涉及一种确定知识库中知识点类目的方法及系统。
技术介绍
知识库是针对某些领域问题求解的需要,采用若干知识表示方式在计算机存储器中存储、组织、管理和使用的知识点集合。例如,由问答数据构成的知识点的集合。知识库可以包括一个或多个类目,每个类目可以包含一个或多个具备关联性的知识点。在人工客服或智能客服领域,知识库的类目可以帮助客服快速找到跟用户问题相关的知识点。可以理解,知识库的类目确定的准确性会影响客服回答的准确性,影响用户体验。因此,为提高知识点类目分类的准确性,有必要提出一种确定知识库中知识点类目的方法及系统。
技术实现思路
本说明书实施例的一个方面提供一种确定知识库中知识点类目的方法,所述方法包括:获取至少一个待预测知识点,并确定与所述至少一个待预测知识点分别对应的知识库;判断所述对应的知识库的类目确定方式;其中,所述类目确定方式包括分类模型确定、距离匹配确定以及规则匹配确定方式中的至少两个;当所述类目确定方式为所述分类模型确定时,将所述待预测知识点输入基于所述对应的知识库训练的分类模型,确定所述待预测知识点的类目;当所述类目确定方式为所述距离匹配确定时,基于所述待预测知识点与所述对应的知识库中每个类目的知识点之间的距离关系,确定所述待预测知识点的类目;当所述类目确定方式为所述规则匹配确定时,基于预设规则确定所述待预测知识点的类目。本说明书实施例的另一个方面提供一种确定知识库中知识点类目的系统,所述系统包括获取模块,用于获取至少一个待预测知识点,并确定与所述至少一个待预测知识点分别对应的知识库;判断模块,用于判断所述对应的知识库的类目确定方式;其中,所述类目确定方式包括分类模型确定、距离匹配确定以及规则匹配确定方式中的至少两个;分类模型确定模块,用于当所述类目确定方式为所述分类模型确定时,将所述待预测知识点输入基于所述对应的知识库训练的分类模型,确定所述待预测知识点的类目;距离匹配确定模块,用于当所述类目确定方式为所述距离匹配确定时,基于所述待预测知识点与所述对应的知识库中每个类目的知识点之间的距离关系,确定所述待预测知识点的类目;规则匹配确定模块,用于当所述类目确定方式为所述规则匹配确定时,基于预设规则确定所述待预测知识点的类目。本说明书实施例的另一个方面提供一种确定知识库中知识点类目的装置,包括处理器,所述处理器用于执行如上任一项所述的方法。本说明书实施例的另一个方面提供一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机执行如上任一项所述的方法。附图说明本说明书将以示例性实施例的方式进一步描述,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:图1是根据本说明书的一些实施例所示的确定知识库中知识点类目系统的应用场景示意图;图2是根据本说明书的一些实施例所示的确定知识库中知识点类目方法的流程图;图3为根据本说明书的一些实施例所示的确定知识库中知识点类目方法的另一流程图;图4是根据本说明书的一些实施例所示的知识库划分模型的训练过程示意图;图5是根据本说明书的一些实施例所示的知识库划分模型的训练数据特征提取的示意图;图6是根据本说明书的一些实施例所示的确定第一预设阈值的过程示意图;图7是根据本说明书的一些实施例所示的确定第二预设阈值的过程示意图。具体实施方式为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。应当理解,本说明书中所使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。图1是根据本说明书的一些实施例所示的确定知识库中知识点类目系统的应用场景示意图。确定知识库中知识点类目系统100可以基于不同知识库中知识点的类目分布情况,确定知识库中新知识点的类目确定方式。确定知识库中知识点类目系统100可以应用于智能客服领域的智能客服系统。通常,智能客服系统中的客服(例如智能客服机器人或人工客服)需要根据用户输入的问题为其回答至少一个可能的答案。一般地,客服可以根据用户输入的问题从预先整理好的、包含了大量知识点的知识库中去获取匹配的知识点,其中,知识点是由问题及问题的答案构成。为了保证客服对用户的问题的响应速率,需要对知识库中的知识点进行分类,确定每个知识点的类目。而且,为了保证知识库覆盖的范围,知识库中需要不断地添加新知识点。例如,从客服服务日志中提取最新的用户问题及其答案,并将该最新的用户问题及其答案作为新知识点。通过系统100将新知识点分类至对应的知识库的类目中,保证新知识点的分类准确率。如图1所示,确定知识库中知识点类目系统100可以包括服务器110、网络120、用户端130以及数据库140。服务器110可以包含处理设备112。在一些实施例中,服务器110可以用于处理与数据处理相关的信息和/或数据。在一些实施例中,服务器110可以通过网络120访问储存于用户端130和数据库140中的信息和/或资料。例如,服务器110可以通过网络120获取数据库140中的知识库,和/或客服服务日志。又例如,服务器110可以通过网络120从数据库140中的客服服务日志中获取最新的问题及其答案。又例如,服务器110可以通过网络120接收用户在用户端130输入的问题。在一些实施例中,服务器110可以直接与用户端130和/或数据库140连接以访问存储于其中的信息和/或资料。在一些实施例中,服务器110可包含处理设备112。该处理设备112可处理数据和/或信息以执行一个或多个本申请中描述的功能。例如,处理设备112可以根据用户输入的问题从知识库中确定答案。又例如,处理设备112可以确定新知识点的类目确定方式。又例如,处理设备112可以完成知识库划分模型和分类模型本文档来自技高网...

【技术保护点】
1.一种确定知识库中知识点类目的方法,包括:/n获取至少一个待预测知识点,并确定与所述至少一个待预测知识点分别对应的知识库;/n判断所述对应的知识库的类目确定方式;其中,所述类目确定方式包括分类模型确定、距离匹配确定以及规则匹配确定方式中的至少两个;/n当所述类目确定方式为所述分类模型确定时,将所述待预测知识点输入基于所述对应的知识库训练的分类模型,确定所述待预测知识点的类目;/n当所述类目确定方式为所述距离匹配确定时,基于所述待预测知识点与所述对应的知识库中每个类目的知识点之间的距离关系,确定所述待预测知识点的类目;/n当所述类目确定方式为所述规则匹配确定时,基于预设规则确定所述待预测知识点的类目。/n

【技术特征摘要】
1.一种确定知识库中知识点类目的方法,包括:
获取至少一个待预测知识点,并确定与所述至少一个待预测知识点分别对应的知识库;
判断所述对应的知识库的类目确定方式;其中,所述类目确定方式包括分类模型确定、距离匹配确定以及规则匹配确定方式中的至少两个;
当所述类目确定方式为所述分类模型确定时,将所述待预测知识点输入基于所述对应的知识库训练的分类模型,确定所述待预测知识点的类目;
当所述类目确定方式为所述距离匹配确定时,基于所述待预测知识点与所述对应的知识库中每个类目的知识点之间的距离关系,确定所述待预测知识点的类目;
当所述类目确定方式为所述规则匹配确定时,基于预设规则确定所述待预测知识点的类目。


2.如权利要求1所述的方法,所述判断所述对应的知识库的类目确定方式包括:
将所述对应的知识库输入知识库划分模型,基于输出的结果确定所述类目确定方式。


3.如权利要求2所述的方法,训练所述知识库划分模型包括:
获取多个训练知识库;
确定所述多个训练知识库中每一个的标签,所述标签表征所述训练知识库的类目确定方式;
对所述多个训练知识库中每一个提取特征,所述特征包括:类目总数、知识点总数、类目内聚集程度以及类目间聚集程度;其中,所述类目内聚集程度表示同一个类目包含的不同知识点之间的聚集程度,所述类目间聚集程度表示不同类目包含的知识点之间的聚集程度;
基于所述多个训练知识库中每一个的所述特征和所述标签,训练得到所述知识库划分模型。


4.如权利要求3所述的方法,确定所述类目内聚集程度包括:
从所述训练知识库中获取类目,以及所述类目包含的n个知识点;n为大于等于2的整数;
计算所述n个知识点中任意两个之间的距离,得到n*(n-1)/2个距离;
将所述n*(n-1)/2个距离的平均值作为所述类目内聚集程度。


5.如权利要求3所述的方法,确定所述类目间聚集程度包括:
从所述训练知识库中获取m个类目,以及所述m个类目中每一个包含的n个知识点;m为大于等于2的整数,n为大于等于1的整数;
将所述n个知识点的中心点作为所述类目的代表知识点;
计算所述m个类目的所述代表知识点中任意两个之间的距离,得到m*(m-1)/2个距离;
将所述m*(m-1)/2个距离的平均值作为所述类目间聚集程度。


6.如权利要求3所述的方法,所述确定所述多个训练知识库中每一个的标签包括:
从所述训练知识库中获取多个知识点;
分别基于所述分类模型确定、所述距离匹配确定以及所述规则匹配确定,得到所述多个知识点对应的预测类目,基于所述预测类目和所述多个知识点的真实类目确定准确率;
将所述准确率最高的所述类目确定方式作为所述训练知识库的标签。


7.如权利要求1所述的方法,所述基于所述待预测知识点与所述对应的知识库中每个类目的知识点之间的距离关系,确定所述待预测知识点的类目包括:
获取所述对应的知识库中每个类目包含的至少一个知识点;
将至少一个知识点的中心点作为所述类目的代表知识点;
计算所述待预测知识点与所述每个类目的代表知识点之间的距离;
将所述距离小于第一预设阈值的类目作为所述待预测知识点的类目。


8.如权利要求7所述的方法,确定所述第一预设阈值包括:
从所述对应的知识库中获取多个知识点;
基于所述距离匹配确定,得到所述多个知识点与所述对应知识库中每个类目的知识点之间的距离,并将所述距离小于所述第一预设阈值的类目作为所述多个知识点的预测类目;
基于所述预测类目与所述多个知识点的真实类目,确定准确率、覆盖率以及至少一个预测错误的知识点;
基于所述预测错误的知识点在对应的所述预测类目上的第一预测值,迭代更新所述第一预设阈值,直到所述准确率和所述覆盖率满足预设条件。


9.如权利要求1所述的方法,所述将所述待预测知识点输入基于所述对应的知识库训练的分类模型,确定所述待预测知识点的类目包括:
将所述待预测知识点输入基于所述对应的知识库训练的分类模型,输出所述待预测知识点属于所述对应知识库中每个类目的概率;
将所述概率大于第二预设阈值的类目作为所述待预测知识点的类目。


10.如权利要求9所述的方法,确定所述第二预设阈值包括:
从所述对应的知识库中获取多个知识点;
基于所述分类模型确定,得到所述多个知识点属于所述对应知识库中每个类目的概率,并将所述概率大于所述第二预设阈值的类目作为所述多个知识点的预测类目;
基于所述预测类目与所述多个知识点的真实类目,确定准确率、覆盖率以及至少一个预测错误的知识点;
基于所述预测错误的知识点在对应的所述预测类目上的第一预测值,迭代更新所述第二预设阈值,直到所述准确率和所述覆盖率满足预设条件。


11.如权利要求7所述的方法,确定所述至少一个知识点的中心点包括:
对所述至少一个知识点进行向量表示,得到所述至少一个知识点中每一个的向量;
基于所述至少一个知识点中每一个的所述向量,计算所述至少一个知识点的平均向量;
将所述平均向量代表的知识点作为所述至少一个知识点的中心点。


12.如权利要求1所述的方法,所述分类模型包括编码模型、卷积神经网络和用于分类的模型;
所述编码模型对所述待预测知识点中每个词进行向量表示;
所述卷积神经网络依次对所述待预测知识点的句子矩阵进行卷积和池化,所述句子矩阵由所述待预测知识点中每个词的向量构成;
所述用于分类的模型基于池化的结果计算所述待预测知识点属于所述对应知识库中每个类目的概率。


13.如权利要求12所述的方法,所述分类模型对所述待预测知识点中词进行向量表示之前,将所述待预测知识点的句子长度补齐至预设长度。


14.如权利要求1所述的方法,所述知识库为实体对象的数据。


15.如权利要求1所述的方法,所述实体对象的数据为智能客服数据。


16.一种确定知识库中知识点类目的系统,包括:
获取模块,用于获取至少一个待预测知识点,并确定与所述至少一个待预测知识点分别对应的知识库;...

【专利技术属性】
技术研发人员:金春祥刘佳崔恒斌
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1