客服问题聚类方法、装置和存储介质制造方法及图纸

技术编号:32858975 阅读:29 留言:0更新日期:2022-03-30 19:35
本申请公开了一种客服问题聚类方法、装置和存储介质,涉及信息处理技术领域,所述方法包括:获取待聚类的客服问题;对于每条客服问题,根据主题词表识别所述客服问题中包含的主题词;根据同义词库将识别得到的所述主题词转换为排名在首位的同义词;将同义词相同的各个客服问题进行聚类。解决了现有技术中通过人工聚类客服问题时聚类效率较低的问题,达到了可以自动对客服问题进行聚类,提高聚类效率的效果。果。果。

【技术实现步骤摘要】
客服问题聚类方法、装置和存储介质


[0001]本专利技术涉及一种客服问题聚类方法、装置和存储介质,属于信息处理


技术介绍

[0002]随着计算机基数的发展,网上购物已经成为人们重要的消费方式。人们网上购物时经常需要与客服进行沟通,因此客服机器人应运而生。
[0003]在传统的智能客服机器人应用中,用户会提出大量相关问题,智能客服机器人对问题做语义分析,找到问题所对应的答案反馈给用户。然而若用户的提问方式与问答知识库中的问题不同,或者所提问题并不存在于智能客服的知识库中,则需要对智能客服的知识库进行扩充维护。
[0004]现有方案中,智能客服产品提供方会安排专人查看产品问答记录,找到智能客服没有正确回答的问题,并将该问题与答案经过编写,多人审核后,加入智能客服知识库中。显而易见的通过人力维护知识库的方法虽然准确率较高,但是效率极低。

技术实现思路

[0005]本专利技术的目的在于提供一种客服问题聚类方法、装置和存储介质,用于解决现有技术中存在的问题。
[0006]为达到上述目的,本专利技术提供如下本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种客服问题聚类方法,其特征在于,所述方法包括:获取待聚类的客服问题;对于每条客服问题,根据主题词表识别所述客服问题中包含的主题词;根据同义词库将识别得到的所述主题词转换为排名在首位的同义词;将同义词相同的各个客服问题进行聚类。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取语料数据,所述语料数据包括来自互联网的文本语料数据以及来自客服场景域的相关语料数据;根据预设分词库提取所述语料数据中的关键词;根据提取到的各个关键词训练神经网络;通过所述神经网络生成每个关键词的权重;根据每个关键词的权重以及K平均算法,生成所述同义词库,所述同义词库中的各个关键词按照权重由高到低排序。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取各个关键词的重要参数;将所述重要参数满足预设条件的关键词添加至所述主题词表。4.根据权利要求3所述的方法,其特征在于,所述获取各个关键词的重要参数,包括:对于每个关键词,计算所述关键词的信息熵,将所述信息熵作为所述重要参数。5.根据权利要求4所述的方法,其特征...

【专利技术属性】
技术研发人员:孙园
申请(专利权)人:国泰新点软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1