客户服务中心投诉工单智能分类方法技术

技术编号:18810685 阅读:58 留言:0更新日期:2018-09-01 09:35
本发明专利技术涉及数据处理方法,具体涉及客户服务中心投诉工单智能分类方法。客户服务中心投诉工单智能分类方法,包括如下过程:建立同义词数据库、停用词数据库:针对不同区域的客户在语音话务中针对同一问题的描述用词不一致等问题,依据工单“受理内容”信息进行同义词定义;文本分词:基于上述构建的同义词数据库、停用词数据库,进行文本分词,并对分词词汇进行词性标注;词频统计:形成客户投诉感知信息词云图,通过词频统计,能够直观反应客户投诉感知;文档工单主题提取。本发明专利技术解决了针对用电用户投诉工单和回访不满意工单无法准确、有效获知用户感知的问题。

Customer service center complaint sheet intelligence classification method

The invention relates to a data processing method, in particular to a customer service center intelligent complaint classification method. Customer Service Center complaint work order intelligent classification method, including the following processes: the establishment of synonym database, stop word database: for different regions of customers in voice traffic for the same problem description words are inconsistent, according to the work order \content of acceptance\ information synonym definition; In the above-mentioned synonym database, stop words database, text segmentation, and word part labeling; word frequency statistics: the formation of customer complaint perception information cloud, through word frequency statistics, can directly reflect customer complaint perception; document work order subject extraction. The invention solves the problem that the complaint work order and the return visit unsatisfactory work order can not accurately and effectively know the user's perception.

【技术实现步骤摘要】
客户服务中心投诉工单智能分类方法
:本专利技术涉及数据处理方法,具体涉及客户服务中心投诉工单智能分类方法。
技术介绍
:目前在95598客户服务过程中,主要通过专家经验法感知用户,在大数据环境下,专家经验法将无法满足实际应用需求;现有用户对用电台区、客户投诉热点的感知,主要通过统计分析方法感知;目前的用户感知,智能辨识大类特征,无法有效感知用户的具体原因,例如一线工作人员的工作态度、工作规范性等;无法通过客户服务投诉工单及不满意工单感知客户需求,对投诉或客户回访处理不满意工单的具体原因、敏感台区以及特征台区客户的诉求热点,不能及时掌握,影响客户服务质量的提升。基于LDA主题生成模型,首先通过对95598客户服务过程中产生的投诉类工单,辨识工单主题,并以辨识的工单主题为基础,基于文本分析技术,通过计算工单主题的相似性,实现客户投诉工单智能分类;其次,根据客户投诉工单分类结果,利用文本情感分析和文本余弦相似度计算,实现客户投诉根因定位。最后,基于客户投诉根因分析结果,结合波士顿矩阵,实现客户投诉区域分布分析、投诉热点分布分析,改善客户服务感知。LDA是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含次、主题和文档三层结构,是一种非监督机器学习技术,可以用来识别大规模文档及语料库中潜藏的主题信息,采用词袋方法,将每一篇文档视为一个词频向量,从而将文本信息转化为易于建模的数字信息,基于每一篇文档代表了一些主题所构成的一个概率分布,而每一个主题又代表了很多单词所组成的概率分布的理论,实现生成文档主题。在LDA模型中,一篇文档生成的方式如下:从狄利克雷分布α中取样生成文档i的主题分布θi;从主题的多项式分布θi中取样生成文档i第j个词的主题Zi,j;从狄利克雷分布β中取样生成主题zi,j对应的词语分布φci,j;从词语的多项式分布φci,j中采样最终生成词语wi,j;其中,类似Beta分布是二项式分布的共轭先验概率分布,而狄利克雷分布(Dirichlet分布)是多项式分布的共轭先验概率分布。LDA技术的出现为客户服务中心投诉工单智能分类提供了理论基础。
技术实现思路
:针对以上情况,本专利技术的主要目的在于通过文本分析技术,基于情感分析算法、分词技术、文本相似度计算等技术,实现客户投诉工单的智能分类,客户投诉原因的根因分析,便于客户服务单位能够直观的感知用户需求。具体技术方案如下:客户服务中心投诉工单智能分类方法,包括如下过程:(一)建立同义词数据库、停用词数据库:针对不同区域的客户在语音话务中针对同一问题的描述用词不一致等问题,依据工单“受理内容”信息进行同义词定义;(二)文本分词:基于上述构建的同义词数据库、停用词数据库,进行文本分词,并对分词词汇进行词性标注;(三)词频统计:形成客户投诉感知信息词云图,通过词频统计,能够直观反应客户投诉感知;(四)文档工单主题提取:将文档设为D,由一个单词序列<w1,w2,...wn>组成,其中wi表示第i个单词,1≤i≤n;假设上述文档可能有T个主题(特征词),则上述文本中的第i个词汇wi可以表示如下:P(wi)=∑Tj=1P(wi|wi=j)P(zi=j)式中:zi是潜在变量,表明第i个词汇记号;wi取自该主题;P(wi|zi=j)是词汇wi记号属于主题j的概率;P(zi=j)给出主题j属于当前文本的概率,假定T个主题形成d个文本,且以W个唯一性词汇表示,为记号方便,令ψ(wz=j)=P(z=j)表示对于主题jW个词汇上的多项分布,其中w是W个唯一性词汇表中的词汇;令表示对于文本d,T个主题上的多项分布,于是文本d中词汇w的概率为:通过上述公式,生成客户意见规范化表达式,提取文档主题词,计算主题词隶属度,形成最终的工单主题词。作为优选方案,还包括如下后续过程:(五)工单投诉根因定位:以对投诉工单进行文档主题提取的工单主题内容为基础,结合工单文本内容分析过程中定义的同义词,对文档工单主题进行反向匹配,同时,根据同义词数据库,并向下钻取,找出客户投诉的根因。本专利技术解决了针对用电用户投诉工单和回访不满意工单无法准确、有效获知用户感知的问题,不能基于95598客服投诉、建议等工单文本内容辨识客户需求,支撑公司运营管理。本专利技术构建了基于LDA模型的主题生成模型辨识工单,在工单智能分类方面,围绕客户投诉工单/回访不满意工单,通过工单分类以及相应的的工单量,聚焦客户投诉热点业务类型、客户诉求热点,识别服务短板;在工单根因定位方面,对客户诉求中涉及到的公司人员服务态度、业务规范等问题,进行客户投诉根因定位,从投诉台区分布、区域投诉热点等维度深入定性分析,挖掘公司运营管理过程中应着重提高的管理内容。附图说明:附图1是LDA的模型原理结构示意图。具体实施方式:实施例:客户服务中心投诉工单智能分类方法,包括如下过程:(一)建立同义词数据库、停用词数据库:针对不同区域的客户在语音话务中针对同一问题的描述用词不一致等问题,依据工单“受理内容”信息进行同义词定义;形成例如“装表”、“复电”、“补抄”、“催费”等合计7200余例自定义同义词数据库,例如:将“不满”、“不满意”等词汇统一定义为“不满意”,将“断掉”、“减掉”、“断电”等词汇统一定义为“断电”;同时,对于客户感知没有相关的词汇,在文本分词的过程中摒弃该部分词汇,例如:“的”、“与”、“西善桥供电所”等词汇,共构建4300余个停用词,构成客户服务主题生成模型的停用词数据库。(二)文本分词:基于上述构建的同义词数据库、停用词数据库,进行文本分词,利用R分析工具加载jieba分词包,并对分词词汇进行名词/动词/副词词性标注;文本分词是一个反复的过程,需要对自定义词库、同义词词库、停用词词库进行不断的完善,以提升文本分词的效果;在完成文本分词后,对进行词频统计,形成客户投诉感知信息词云图,通过词频统计,能够直观反应客户投诉感知。例如:“客户来电反映之前报修,7点19分报修一直到10点多仍无工作人员与其联系处理,经中心解释无效,且已多次催办,坚持认为工作人员服务不到位,未在承诺时间内到达现场,工作态度不端正,要求核实”,通过文本分词,并进行词性标注,形成分析结果,“客户/n来电/v反映/v之前/f报修/v,/w7点/m19分/m报修/v一直/d到/v10点/m多/m仍/d无/v工作/vn人员/n与/p其/r联系/v处理/v,/w经/p中心/n解释/v无效/v,/w且/c已/d多次/m催办/v,/w坚持/v认为/v工作/vn人员/n服务/vn不/d到位/v,/w未/d在/p承诺/v时间/n内/f到达/v现场/s,/w工作/vn态度/n不/d端正/v,/w要求/v核实/v”。(三)词频统计:形成客户投诉感知信息词云图,通过词频统计,能够直观反应客户投诉感知;(四)文档工单主题提取:将文档设为D,由一个单词序列<w1,w2,...wn>组成,其中wi表示第i个单词,1≤i≤n。假设上述文档可能有T个主题(特征词),则上述文本中的第i个词汇wi可以表示如下:P(wi)=∑Tj=1P(wi|wi=j)P(zi=j)式中:zi是潜在变量,表明第i个词汇记号;wi取自该主题;P(wi|zi=j)本文档来自技高网
...

【技术保护点】
1.客户服务中心投诉工单智能分类方法,其特征在于,包括如下过程:(一)建立同义词数据库、停用词数据库:针对不同区域的客户在语音话务中针对同一问题的描述用词不一致等问题,依据工单“受理内容”信息进行同义词定义;(二)文本分词:基于上述构建的同义词数据库、停用词数据库,进行文本分词,并对分词词汇进行词性标注;(三)词频统计:形成客户投诉感知信息词云图,通过词频统计,能够直观反应客户投诉感知;(四)文档工单主题提取:将文档设为D,由一个单词序列

【技术特征摘要】
1.客户服务中心投诉工单智能分类方法,其特征在于,包括如下过程:(一)建立同义词数据库、停用词数据库:针对不同区域的客户在语音话务中针对同一问题的描述用词不一致等问题,依据工单“受理内容”信息进行同义词定义;(二)文本分词:基于上述构建的同义词数据库、停用词数据库,进行文本分词,并对分词词汇进行词性标注;(三)词频统计:形成客户投诉感知信息词云图,通过词频统计,能够直观反应客户投诉感知;(四)文档工单主题提取:将文档设为D,由一个单词序列<w1,w2,...wn>组成,其中wi表示第i个单词,1≤i≤n,假设上述文档可能有T个主题(特征词),则上述文本中的第i个词汇wi可以表示如下:P(wi)=∑Tj=1P(wi|wi=j)P(zi=j)式中:zi是潜在变量,表明第i个词汇记号;wi...

【专利技术属性】
技术研发人员:谢永胜李子乾马永波张弦焦冬张云志陈泽
申请(专利权)人:国家电网公司客户服务中心
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1