【技术实现步骤摘要】
知识库问题挖掘方法、装置、电子设备及存储介质
本专利技术涉及智能决策领域,尤其涉及一种知识库问题挖掘方法、装置、电子设备及计算机可读存储介质。
技术介绍
企业的智能客服运营一般都是基于知识库的问答系统。知识库的问答系统中的问题和对应答案都需要人工提前编辑好,但是由于用户输入的问题在语句表述方面具有很大的差异性,且提前编辑好的问题不可能考虑到所有问题,导致智能客服对问题的解答率下降,影响智能客服的服务质量,因此知识库的问题挖掘变得尤为重要。目前企业针对知识库问题挖掘主要依赖于人工操作,通过人工读取知识库的线上日志,根据人工经验编写好标准问题和扩展问题,将编写好的标准问题和扩展问题保存至知识库中。由于人工编写问题的过程繁琐且任务量巨大,因此一般都间隔很长一段时间才去补充和更新知识库中的问题,这样导致对用户提出的问题解答率不高,影响智能客服运营的质量。
技术实现思路
本专利技术提供一种知识库问题挖掘方法、装置、电子设备及计算机可读存储介质,其主要目的在于实现智能挖掘扩展问题。为实现上述目的,本专利技术提供的一种知识库问题挖掘方法,包括:接收原始问题集,对所述原始问题集进行清洗和去重,得到训练问题集;利用预先训练完成的问题特征抽取模型对所述训练问题集进行特征提取,得到问题特征集;将所述问题特征集进行聚类,得到聚类问题集,并从所述聚类问题集中提取标准问题集;利用所述标准问题集对预构建的问题挖掘模型进行迭代训练,得到标准问题挖掘模型;利用测试问题集对所述标准问题 ...
【技术保护点】
1.一种知识库问题挖掘方法,其特征在于,所述方法包括:/n接收原始问题集,对所述原始问题集进行清洗和去重,得到训练问题集;/n利用预先训练完成的问题特征抽取模型对所述训练问题集进行特征提取,得到问题特征集;/n将所述问题特征集进行聚类,得到聚类问题集,并从所述聚类问题集中提取标准问题集;/n利用所述标准问题集对预构建的问题挖掘模型进行迭代训练,得到标准问题挖掘模型;/n利用测试问题集对所述标准问题挖掘模型进行性能评估,得到所述标准问题挖掘模型的评估分数;/n根据所述评估分数,评估所述标准问题挖掘模型是否达到上线标准;/n若所述标准问题挖掘模型未达到所述上线标准,则重新返回利用预先训练完成的问题特征抽取模型对所述训练问题集进行特征提取的步骤;/n若所述标准问题挖掘模型达到所述上线标准,则利用所述标准问题挖掘模型对待挖掘的问题集进行问题挖掘,得到扩展问题。/n
【技术特征摘要】
1.一种知识库问题挖掘方法,其特征在于,所述方法包括:
接收原始问题集,对所述原始问题集进行清洗和去重,得到训练问题集;
利用预先训练完成的问题特征抽取模型对所述训练问题集进行特征提取,得到问题特征集;
将所述问题特征集进行聚类,得到聚类问题集,并从所述聚类问题集中提取标准问题集;
利用所述标准问题集对预构建的问题挖掘模型进行迭代训练,得到标准问题挖掘模型;
利用测试问题集对所述标准问题挖掘模型进行性能评估,得到所述标准问题挖掘模型的评估分数;
根据所述评估分数,评估所述标准问题挖掘模型是否达到上线标准;
若所述标准问题挖掘模型未达到所述上线标准,则重新返回利用预先训练完成的问题特征抽取模型对所述训练问题集进行特征提取的步骤;
若所述标准问题挖掘模型达到所述上线标准,则利用所述标准问题挖掘模型对待挖掘的问题集进行问题挖掘,得到扩展问题。
2.如权利要求1所述的知识库问题挖掘方法,其特征在于,所述利用预先训练完成的问题特征抽取模型对所述训练问题集进行特征提取,得到问题特征集,包括:
利用所述问题特征抽取模型中的卷积层,对所述训练问题集进行卷积操作,得到特征向量集;
利用所述问题特征抽取模型中的目标函数对所述特征向量集进行特征计算,得到问题特征集。
3.如权利要求1所述的知识库问题挖掘方法,其特征在于,所述将所述问题特征集进行聚类,得到聚类问题集,包括:
步骤A、利用预设聚类类别个数选择算法从所述问题特征集中选择K个问题特征作为初始聚类中心;
步骤B、计算所述问题特征集中每个问题特征与所述初始聚类中心的距离值,并根据所述距离值将所述问题特征集进行初始聚类,得到初始聚类问题集;
步骤C、计算所述初始聚类问题集中每个问题特征的中心,将所述中心作为新聚类中心;
步骤D、计算所述问题特征集中每个问题特征与所述新聚类中心的距离值,并根据所述距离值将所述问题特征集再次聚类,并重复执行上述的步骤A至步骤D,直到完成预设循环次数,得到聚类问题集。
4.如权利要求1所述的知识库问题挖掘方法,其特征在于,所述从所述聚类问题集中提取标准问题集,包括:
利用下述匹配度计算方法,计算所述聚类问题集与预构建的标准问题库中标准问题的语句匹配度T(x,y):
其中,xi表示聚类问题集的第i个聚类问题,yi表示标准问题库中的第i个标准问题;
根据所述语句匹配度,将匹配成功的聚类问题集作为标准问题集。
5.如权利要求1所述的知识库问题挖掘方法,其特征在于,所述利用所述标准问题集对预构建的问题挖掘模型进行迭代训练,得到标准问题挖掘模型之前,所述...
【专利技术属性】
技术研发人员:史文鑫,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。