一种基于深度学习的客服工单类型推荐方法技术

技术编号:36389009 阅读:63 留言:0更新日期:2023-01-18 09:52
本发明专利技术公开了一种基于深度学习的客服工单类型推荐方法,包括如下步骤:S1、采集历史通话录音文件,将历史通话录音文件转化成训练文本文件和测试文本文件;S2、对训练文本文件进行分词处理,得分词结果,向分词结果中添加训练文本文件对应的工单类型,得到训练集;S3、将训练集输入基于自注意力机制和多神经网络相融合的文本分类模型中行若干次训练,得训练后的文本分类模型;S4、对测试文本文件进行分词处理,得分词结果,将测试文本文件的分词结果输入训练后的文本分类模型中进行分析并获取推荐工单类型。本发明专利技术通过基于自注意力机制和多神经网络相融合的文本分类模型对客服工单类型进行分析分类有效提高文本分类模型对工单类型预测的准确率。单类型预测的准确率。单类型预测的准确率。

【技术实现步骤摘要】
一种基于深度学习的客服工单类型推荐方法


[0001]本专利技术属于工单分配
,具体涉及一种基于深度学习的客服工单类型推荐方法。

技术介绍

[0002]随着城市化水平的持续提高,智能设备和移动互联网的普及,用于为人们提供各种咨询服务的客服平台得到快速的发展,人们也越来越倾向于通过客服平台反映自己所遇见的问题。这使得客服每天的接单数量急剧增加,而目前对于常规的创建工单的方式仍然是由客服手动选择工单类别进行分类创建,效率较慢。当出现大规模报修的时候,客服往往应接不暇。同时,客服在通话过程中建单还会在无形中增加客户的等待时间。
[0003]针对上述的技术问题,现有技术中采用的技术方案是通过通过计算机的深度学习技术对一定文本数据进行训练从而获得文本分类模型,再由文本分类模型分析通过文本后再向客服推荐工单类型。使得客服不用在诸多工单分类中筛选目标工单类型即可完成建单,极大的减少了客服的操作步骤,提高客服的工作效率。例如,在申请号为:CN202110919603.1,名称为:基于文本大数据的呼叫中心客服工单自动分类分派的方法的专利中公开了一种基于文本大数据的呼叫中心客服工单自动分类分派的方法,包括以下步骤:步骤1、对接工单系统,输入工单文本后通过RESTful方式对接工单,获取工单文本;步骤2、工单文本的预处理准备工作;步骤3、基于快速文本分类算法构建呼叫中心客服工单分类模型;步骤4、Jieba分词对文本进行分词,去除一些平常的停用词,处理后将结果提交至客服工单分类模型;步骤5、经客服工单分类模型分析,得到工单分类推荐以及流转派发部门推荐结果。该方案方法解决了客服工单分类因涉及门类较多,耗时过长,分派准确率不高,影响服务效果、用户的体验的问题,极大的提高了客服人员的工作效率,减轻客服人员的劳动强度,同时降低了人力成本的投入。但是,该方案的方法仅适用于分类类别非常大而且数据集足够多的情况,如果分类类别比较小或者数据集比较少时,模型很容易出现过拟合现象,从而导致预测结果出现误差。

技术实现思路

[0004]本专利技术为了解决现有技术中基于计算机深度学习的客服工单分类模型在遇到分类类别比较小或者数据集比较少时,模型很容易出现过拟合现象,从而导致预测结果出现误差的技术问题;提出了一种基于深度学习的客服工单类型推荐方法,以实现有效提高文本分类模型对工单类型预测准确率的技术效果。
[0005]本专利技术为达到上述目的,采用如下技术方案:
[0006]一种基于深度学习的客服工单类型推荐方法,包括如下步骤:
[0007]S1、采集历史通话录音文件,将历史通话录音文件转化成训练文本文件和测试文本文件;
[0008]S2、对训练文本文件进行分词处理,得分词结果,向分词结果中添加训练文本文件
对应的工单类型,得到训练集;
[0009]S3、将训练集输入基于自注意力机制和多神经网络相融合的文本分类模型中行若干次训练,得训练后的文本分类模型;
[0010]S4、对测试文本文件进行分词处理,得分词结果,将测试文本文件的分词结果输入训练后的文本分类模型中进行分析并获取推荐工单类型。
[0011]进一步的,所述步骤S1中,采用历史通话录音的通话流水号作为对应的训练文本文件的唯一标识。
[0012]进一步的,所述步骤S1中,将历史通话录音的通话流水号与其工单类型一一对应。
[0013]进一步的,所述步骤S2中的分词处理过程如下:
[0014]构建常用词库dic_normal和停用词库dic_abnormal,其中常用词库dic_normal中词语长度的最大值为maxL;
[0015]正向分词
[0016]从左至右获取训练文本文件中长度为L=maxL的词语,将获取的词语与常用词库dic_normal中的词语进行对比;如果常用词库dic_normal中不存在一致的词语则将L设置为maxL

1,并按照上述步骤重复操作继续对比,直至能够在所述常用词库dic_normal中找到一致的词语或L=1,将所述一致的词语或L=1时获得的字作为分词结果中的一项,并将所述一致的词语或L=1时获得的字从训练文本文件中剔除;在训练文本文件所剩余的文本中继续重复上述步骤,直至分词结束,则可得正向分词结果为:
[0017]A={X1,X2,X3,

,X
m
}
[0018]逆向分词
[0019]从右至左获取训练文本文件中长度为R=maxL的词语,将获取的词语与常用词库dic_normal中的词语进行对比;如果常用词库dic_normal中不存在一致的词语则将R设置为maxL

1,并按照上述步骤重复操作继续对比,直至能够在所述常用词库dic_normal中找到一致的词语或R=1,将所述一致的词语或R=1时获得的字作为分词结果中的一项,并将所述一致的词语或R=1时获得的字从训练文本文件中剔除;在训练文本文件所剩余的文本中继续重复上述步骤,直至分词结束,则可得逆向分词结果为:
[0020]B={Y1,Y2,Y3,

,Y
n
}
[0021]比较m与n的大小关系,若:
[0022]m<n,取A作为训练文本文件的分词结果;
[0023]m>n,取B作为训练文本文件的分词结果;
[0024]m=n,取A、B中长度为1的词语较少的作为训练文本文件的初次分词结果;
[0025]删除训练文本文件的初次分词结果中的停用词abKey,得到最终的分词结果,其中abKey∈{dic_abnormal}。
[0026]进一步的,所述步骤S3中的所述文本分类模型的结构包括依次设置的输入层、嵌入层、CNN层和融合输出层;
[0027]所述输入层的工作过程为:
[0028]使用独热向量表示训练集中的每一个词,然后通过Word embedding词嵌入操作将独热向量数据转化为分布式词向量;
[0029]所述嵌入层的工作过程为:
[0030]通过tanh激活函数处理输入层中获得的分布式词向量得到处理后的分布式词向量H,通过自注意机制来获取初始化词向量e
t
,并为H中的每个词语分配不同的权重a
t
,通过加权求和获取全局特征向量表示M,其中加权求和公式如下:
[0031]u
t
=tanh(w
w
h
t
+b
w
)
[0032][0033][0034]其中w
w
表示文本分类模型训练的参数,h
t
表示H的第t个词对应的词向量,b
w
表示偏置项,表示u
t
的转置,u
w
是一个模型的随机初始化的上下文向量,a
t
表示经过归一化后输入序列的第t个词语所占的权重;
[0035]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的客服工单类型推荐方法,其特征在于,包括如下步骤:S1、采集历史通话录音文件,将历史通话录音文件转化成训练文本文件和测试文本文件;S2、对训练文本文件进行分词处理,得分词结果,向分词结果中添加训练文本文件对应的工单类型,得到训练集;S3、将训练集输入基于自注意力机制和多神经网络相融合的文本分类模型中行若干次训练,得训练后的文本分类模型;S4、对测试文本文件进行分词处理,得分词结果,将测试文本文件的分词结果输入训练后的文本分类模型中进行分析并获取推荐工单类型。2.根据权利要求1所述的一种基于深度学习的客服工单类型推荐方法,其特征在于:所述步骤S1中,采用历史通话录音的通话流水号作为对应的训练文本文件的唯一标识。3.根据权利要求2所述的一种基于深度学习的客服工单类型推荐方法,其特征在于:所述步骤S1中,将历史通话录音的通话流水号与其工单类型一一对应。4.根据权利要求1所述的一种基于深度学习的客服工单类型推荐方法,其特征在于:所述步骤S2中的分词处理过程如下:构建常用词库dic_normal和停用词库dic_abnormal,其中常用词库dic_normal中词语长度的最大值为maxL;正向分词从左至右获取训练文本文件中长度为L=maxL的词语,将获取的词语与常用词库dic_normal中的词语进行对比;如果常用词库dic_normal中不存在一致的词语则将L设置为maxL

1,并按照上述步骤重复操作继续对比,直至能够在所述常用词库dic_normal中找到一致的词语或L=1,将所述一致的词语或L=1时获得的字作为分词结果中的一项,并将所述一致的词语或L=1时获得的字从训练文本文件中剔除;在训练文本文件所剩余的文本中继续重复上述步骤,直至分词结束,则可得正向分词结果为:A={X1,X2,X3,

,X
m
}逆向分词从右至左获取训练文本文件中长度为R=maxL的词语,将获取的词语与常用词库dic_normal中的词语进行对比;如果常用词库dic_normal中不存在一致的词语则将R设置为maxL

1,并按照上述步骤重复操作继续对比,直至能够在所述常用词库dic_normal中找到一致的词语或R=1,将所述一致的词语或R=1时获得的字作为分词结果中的一项,并将所述一致的词语或R=1时获得的字从训练文本文件中剔除;在训练文本文件所剩余的文本中继续重复上述步骤,直至分词结束,则可得逆向分词结果为:B={Y1,Y2,Y3,

,Y
n
}比较m与n的大小关系,若:m<n,取A作为训练文本文件的分词结果;m>n,取B作为训练文本文件的分词结果;m=n,取A、B中长度为1的词语较少的作为训练文本文件的初次分词结果;删除训练文本文件的初次...

【专利技术属性】
技术研发人员:李伟汪浩王小林张澜琚国庆
申请(专利权)人:安徽工业大学科技园有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1