智能客服知识库模型训练方法、装置及电子设备制造方法及图纸

技术编号:30548004 阅读:18 留言:0更新日期:2021-10-30 13:27
本申请提供了一种智能客服知识库模型训练方法、装置及电子设备,其中,方法包括:获取目标业务领域的高频问答数据,以使工作人员根据高频问答数据绘制问答流程图;基于问答流程图,生成会话片段,以使工作人员对会话片段进行测试;根据工作人员添加的闲聊信息和问答信息,生成闲聊库和问答库;基于测试好的会话片段、闲聊库和问答库,进行整体测试,得到初始知识库模型;应用预先获取的知识测试集和知识训练集,分别对初始知识库模型进行验证和训练,得到最终的智能客服知识库模型。本申请能够客观分析实际业务的高频问题,形成多轮会话场景,将提取的知识形成动态知识库体系,能快速更新优化。更新优化。更新优化。

【技术实现步骤摘要】
智能客服知识库模型训练方法、装置及电子设备


[0001]本申请涉及智能客服
,尤其是涉及一种智能客服知识库模型训练方法、装置及电子设备。

技术介绍

[0002]目前,智能客服使用的知识库,其生成方式依赖于业务坐席的经验,具体生成过程为:根据业务坐席在实际工作中与客户的问答经验,提取出相关的高频问题和答复,形成供智能客服使用的知识库。这种方式存在以下缺点:高频问题和答复依赖业务坐席的经验,主观性较强;提取的知识基本都是单一问答问题,无法形成多轮会话场景;而且问答知识形成后,为静态的知识库,无法进行快速更新优化。

技术实现思路

[0003]本申请的目的在于提供一种智能客服知识库模型训练方法、装置及电子设备,能够客观分析实际业务的高频问题,将提取的知识形成知识库体系,能形成多轮会话场景,使问答知识形成有效闭环成为动态知识库,便于进行快速更新优化。
[0004]第一方面,本申请实施例提供一种智能客服知识库模型训练方法,该方法包括:获取目标业务领域的高频问答数据,以使工作人员根据高频问答数据绘制问答流程图;基于问答流程图,生成会话片段,以使工作人员对会话片段进行测试;根据工作人员添加的闲聊信息和问答信息,生成闲聊库和问答库;基于测试好的会话片段、闲聊库和问答库,进行整体测试,得到初始知识库模型;应用预先获取的知识测试集和知识训练集,分别对初始知识库模型进行验证和训练,得到最终的智能客服知识库模型;上述知识测试集和知识训练集中的样本均是从高频问答数据中划分出来的。
[0005]在可选的实施方式中,上述获取目标业务领域的高频问答数据的步骤,包括:判断是否存在目标业务领域对应的历史业务数据;如果是,根据历史业务数据进行数据分类,得到目标业务领域的高频问答数据;如果否,通过爬虫技术从互联网上获取目标业务领域的高频问答数据。
[0006]在可选的实施方式中,上述问答流程图包括多个节点;基于问答流程图,生成会话片段的步骤,包括:提供流程节点的配置操作页面;响应针对配置操作页面中,节点条件和节点模块的配置操作,根据配置的节点条件和节点模块,生成会话片段。
[0007]在可选的实施方式中,根据上述工作人员添加的闲聊信息和问答信息,生成闲聊库和问答库的步骤,包括:提供信息添加页面;响应针对信息添加页面中,闲聊信息和问答信息的添加操作,生成闲聊库和问答库。
[0008]在可选的实施方式中,基于测试好的会话片段、闲聊库和问答库,进行整体测试,得到初始知识库模型的步骤,包括:提供BOT测试页面;响应针对BOT测试页面中的测试选项的第一操作,对会话片段、闲聊库和问答库进行整体测试,得到初始知识库模型。应用预先获取的知识训练集和知识测试集,分别对初始知识库模型进行训练和验证,得到最终的智
能客服知识库模型的步骤,包括:
[0009]在可选的实施方式中,基于上述知识测试集对初始知识库模型进行验证,计算初始知识库模型对应的评价指标;评价指标包括测试准确率和/或单个意图召回率;如果评价指标达到预设阈值,将初始知识库模型作为最终的智能客服知识库模型;如果评价指标未达到预设阈值,利用知识训练集中的样本对初始知识库模型进行训练,得到最终的智能客服知识库模型。
[0010]在可选的实施方式中,在基于上述知识测试集对初始知识库模型进行验证的步骤之后,上述方法还包括:如果知识测试集对应的测试结果中出现意图纠缠问题;针对出现问题的测试样本中的问题进行语义分析,以根据分析结果确定出现问题的原因。
[0011]第二方面,本申请实施例提供了一种智能客服知识库模型训练装置,该装置包括:数据获取模块,用于获取目标业务领域的高频问答数据,以使工作人员根据高频问答数据绘制问答流程图;会话片段生成模块,用于基于问答流程图,生成会话片段,以使工作人员对会话片段进行测试;知识库生成模块,用于根据工作人员添加的闲聊信息和问答信息,生成闲聊库和问答库;初始模型生成模块,用于基于测试好的会话片段、闲聊库和问答库,进行整体测试,得到初始知识库模型;模型训练验证模块,用于应用预先获取的知识训练集和知识测试集,分别对初始知识库模型进行训练和验证,得到最终的智能客服知识库模型。
[0012]第三方面,本申请实施例还提供一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现上述第一方面所述的方法。
[0013]第四方面,本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现上述第一方面所述的方法。
[0014]本申请实施例带来了以下有益效果:
[0015]本申请提供了一种智能客服知识库模型训练方法、装置和电子设备,该方法对高频业务问题进行智能客服知识库设计,在获取目标业务领域的高频问答数据后,通过绘制问答流程图生成会话片段,并与生成的闲聊库和问答库一起进行整体测试得到初始知识库模型,应用预先获取的知识测试集和知识训练集,分别对初始知识库模型进行验证和训练,最终得到智能客服知识库模型,该方法以数据说话,能客观分析实际业务的高频问题,将提取的知识形成知识库体系,能形成多轮会话场景,使问答知识形成有效闭环成为动态知识库,便于进行快速更新优化。
[0016]本申请的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
[0017]为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0018]为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的
附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为本申请实施例提供的一种智能客服知识库模型训练方法的流程图;
[0020]图2为本申请实施例提供的建立智能客服的知识库模型的实施流程;
[0021]图3为本申请实施例提供的政务领域业务流程图;
[0022]图4为本申请实施例提供的流程片段节点条件配置示意图;
[0023]图5为本申请实施例提供的一种智能客服知识库模型训练装置的结构框图;
[0024]图6为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0025]下面将结合实施例对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0026]目前智能客服使用的知识库,其生成方式依本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能客服知识库模型训练方法,其特征在于,所述方法包括:获取目标业务领域的高频问答数据,以使工作人员根据高频问答数据绘制问答流程图;基于所述问答流程图,生成会话片段,以使所述工作人员对所述会话片段进行测试;根据所述工作人员添加的闲聊信息和问答信息,生成闲聊库和问答库;基于测试好的所述会话片段、所述闲聊库和所述问答库,进行整体测试,得到初始知识库模型;应用预先获取的知识测试集和知识训练集,分别对所述初始知识库模型进行验证和训练,得到最终的智能客服知识库模型;所述知识测试集和知识训练集中的样本均是从所述高频问答数据中划分出来的。2.根据权利要求1所述的方法,其特征在于,获取目标业务领域的高频问答数据的步骤,包括:判断是否存在所述目标业务领域对应的历史业务数据;如果是,根据所述历史业务数据进行数据分类,得到所述目标业务领域的高频问答数据;如果否,通过爬虫技术从互联网上获取所述目标业务领域的高频问答数据。3.根据权利要求1所述的方法,其特征在于,所述问答流程图包括多个节点;基于所述问答流程图,生成会话片段的步骤,包括:提供流程节点的配置操作页面;响应针对所述配置操作页面中,节点条件和节点模块的配置操作,根据配置的节点条件和节点模块,生成所述会话片段。4.根据权利要求1所述的方法,其特征在于,根据所述工作人员添加的闲聊信息和问答信息,生成闲聊库和问答库的步骤,包括:提供信息添加页面;响应针对所述信息添加页面中,闲聊信息和问答信息的添加操作,生成闲聊库和问答库。5.根据权利要求1所述的方法,其特征在于,基于测试好的所述会话片段、所述闲聊库和所述问答库,进行整体测试,得到初始知识库模型的步骤,包括:提供BOT测试页面;响应针对所述BOT测试页面中的测试选项的第一操作,对所述会话片段、所述闲聊库和所述问答库进行整体测试,得到初始知识库模型。6.根据权利要求1所述的方法,其特征在于,应用预先获取的知识训练集和知识测试集...

【专利技术属性】
技术研发人员:胡冰侯玥王亚利刘志强申建淳王继超
申请(专利权)人:北京政信一八九零智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1