一种工单数据的投诉倾向分析预警方法及装置制造方法及图纸

技术编号:21034457 阅读:42 留言:0更新日期:2019-05-04 05:29
本申请提供一种工单数据的投诉倾向分析预警方法及装置,其中,所述方法包括:对各个工单数据进行分词以及删除停用词,得到第二分词组合;利用word2vec模型生成词向量;求解所述工单数据对应的句向量;利用k‑means算法将各个句向量划分为三个簇;利用Softmax逻辑回归生成投诉倾向分类模型;利用投诉倾向分类模型判断新的工单数据的投诉倾向类别;若所述新的工单数据的投诉倾向类别为高危投诉倾向或有投诉倾向,则作出预警。本申请提供的方法中,利用大量工单数据生成投诉倾向分类模型,在投诉倾向分类模型的基础上,对新的工单数据进行投诉倾向类别的预测,根据预测结果,实现及时主动预警的目的,从而解决了现有人工分析方法效率低下的问题。

An Early Warning Method and Device for Complaint Tendency Analysis of Work Order Data

【技术实现步骤摘要】
一种工单数据的投诉倾向分析预警方法及装置
本申请涉及大数据应用
,具体涉及一种工单数据的投诉倾向分析预警方法及装置。
技术介绍
随着电力行业信息化建设的快速发展和普遍应用,电力企业各级单位、各业务部门基本实现了信息化全覆盖。其中,95598客户服务系统是电力企业与客户交流的重要窗口,该系统中积累了大量的非结构化的工单数据,电力企业根据工单数据的内容,了解客户的意图和态度,提升服务质量。由于工单数据的数量众多,且各个工单数据的紧急程度存在差异,对于紧急程度较高的工单数据,若电力企业没有及时处理,则有可能被客户投诉。为了降低被客户投诉的风险,电力企业需要对工单数据进行分析,将工单数据进行投诉倾向等级划分,并对投诉倾向等级较高的的工单数据作出预警,电力企业根据预警情况,能够快速、有预见性和针对性地采取措施。现有工单数据的投诉倾向分析仍然处于人工分析的阶段,而人工分析无法对工单数据进行及时有效地处理,从而导致现有分析方法效率低下的问题,因此,目前亟需一种能够及时有效地对工单数据进行分析,并及时作出投诉倾向预警的方法。
技术实现思路
本申请提供一种工单数据的投诉倾向分析预警方法及装置,以解决现有人工分析方法效率低下的问题。本申请的第一方面,提供一种工单数据的投诉倾向分析预警方法,包括:获取工单数据,以工单单号相同的工单数据为单位,对各个隶属于同一个单位的工单数据进行分词,得到第一分词组合;删除所述第一分词组合中的停用词,得到所述工单数据的第二分词组合;利用word2vec模型生成所述第二分词组合词中各个分词的词向量;求解所述工单数据对应的词向量的平均向量,将所述平均向量作为所述工单数据的句向量;利用k-means算法将各个所述工单数据的句向量划分为三个簇,所述三个簇对应所述工单数据的三个投诉倾向类别,其中,所述三个投诉倾向类别分别为:高危投诉倾向、有投诉倾向以及无投诉倾向;为各个投诉倾向类别的工单数据分别设置相应的第一输出向量,并将所述工单数据的句向量作为第一输入向量,利用Softmax逻辑回归生成投诉倾向分类模型;利用所述投诉倾向分类模型判断新的工单数据的投诉倾向类别;若所述新的工单数据的投诉倾向类别为高危投诉倾向或有投诉倾向,则作出预警。可选的,所述利用word2vec模型生成所述第二分词组合词中各个第二分词的词向量,包括:根据以下公式计算所述第二分词出现的频率,并判断所述第二分词出现的频率是否大于第一预设阈值:其中,P(wi)为第二分词出现的频率,f(wi)为第二分词的出现频次,wi为第二分词,i=1,2,3...x,x为第二分词的数量,n为第二预设阈值;若所述第二分词出现的频率大于第一预设阈值,则确定频率大于第一预设阈值的第二分词为高频分词,并将所述高频分词从所述第二分词组合中剔除,将剔除高频分词后的第二分词组合作为第三分词组合;采用word2vec模型中的skip-gram模型构建所述第三分词组合的训练模型;利用所述训练模型,生成所述第三分词组合中各个分词的词向量。可选的,所述利用k-means算法将各个所述工单数据的句向量划分为三个簇,所述三个簇对应所述工单数据的三个投诉倾向类别,包括:步骤301,利用k-means算法,随机选取三个句向量分别作为三个簇的中心,将所述三个簇的中心分别记为C1、C2和C3;步骤302,分别计算各个所述句向量与所述三个簇的中心之间的欧式距离,确定与各个所述句向量的欧式距离最近的Ci,并将所述句向量归类到Ci对应的簇,其中,i=1,2,3;步骤303,计算各个簇中所有句向量的各个维度的均值,将所述均值组成的向量作为所述簇的新的中心;步骤304,判断所述簇的新的中心与随机选取的所述簇的中心是否一致,若不一致,则返回执行步骤302的操作,直至各个簇的新的中心与前一次计算的中心一致,并将所述簇的新的中心作为目标中心。可选的,利用所述投诉倾向分类模型判断新的工单数据的投诉倾向类别,包括:生成与所述新的工单数据对应的句向量;将所述新的工单数据对应的句向量作为所述投诉倾向分类模型的第二输入向量,获取与所述第二输入向量对应的第二输出向量;将所述第二输出向量与所述第一输出向量比较,获取与所述第二输出向量对应的第一输出向量,将所述第二输出向量对应的第一输出向量作出目标输出向量;确定与所述目标输出向量对应的投诉倾向类别,并将所述目标输出向量对应的投诉倾向类别作为所述新的工单数据的投诉倾向类别。本申请的第二方面,提供一种工单数据的投诉倾向分析预警装置,包括:获取模块,用于获取工单数据,以工单单号相同的工单数据为单位,对各个隶属于同一个单位的工单数据进行分词,得到第一分词组合;删除模块,用于删除所述第一分词组合中的停用词,得到所述工单数据的第二分词组合;词向量生成模块,用于利用word2vec模型生成所述第二分词组合词中各个分词的词向量;句向量生成模块,用于求解所述工单数据对应的词向量的平均向量,将所述平均向量作为所述工单数据的句向量;划分模块,用于利用k-means算法将各个所述工单数据的句向量划分为三个簇,所述三个簇对应所述工单数据的三个投诉倾向类别,其中,所述三个投诉倾向类别分别为:高危投诉倾向、有投诉倾向以及无投诉倾向;分类模型生成模块,用于为各个投诉倾向类别的工单数据分别设置相应的第一输出向量,并将所述工单数据的句向量作为第一输入向量,利用Softmax逻辑回归生成投诉倾向分类模型;判断模块,用于利用所述投诉倾向分类模型判断新的工单数据的投诉倾向类别;预警模块,用于在所述判断模块确定所述新的工单数据的投诉倾向类别为高危投诉倾向或有投诉倾向的情况下,作出预警。可选的,所述词向量生成模块包括:第一判断单元,用于根据以下公式计算所述第二分词出现的频率,并判断所述第二分词出现的频率是否大于第一预设阈值:其中,P(wi)为第二分词出现的频率,f(wi)为第二分词的出现频次,wi为第二分词,i=1,2,3...x,x为第二分词的数量,n为第二预设阈值;剔除单元,用于在所述第一判断单元确定所述第二分词出现的频率大于第一预设阈值的情况下,确定频率大于第一预设阈值的第二分词为高频分词,并将所述高频分词从所述第二分词组合中剔除,将剔除高频分词后的第二分词组合作为第三分词组合;训练模型构建单元,用于采用word2vec模型中的skip-gram模型构建所述第三分词组合的训练模型;第一生成单元,用于利用所述训练模型,生成所述第三分词组合中各个分词的词向量。可选的,所述划分模块包括:选取单元,用于利用k-means算法,随机选取三个句向量分别作为三个簇的中心,将所述三个簇的中心分别记为C1、C2和C3;第一计算单元,用于分别计算各个所述句向量与所述三个簇的中心之间的欧式距离,确定与各个所述句向量的欧式距离最近的Ci,并将所述句向量归类到Ci对应的簇,其中,i=1,2,3;第二计算单元,用于计算各个簇中所有句向量的各个维度的均值,将所述均值组成的向量作为所述簇的新的中心;第二判断单元,用于判断所述簇的新的中心与随机选取的所述簇的中心是否一致,若不一致,则返回执行所述第一计算单元的操作,直至各个簇的新的中心与前一次计算的中心一致,并将所述簇的新的中心作为目标中心。可选的,所述判断模块包括:第二生成单本文档来自技高网...

【技术保护点】
1.一种工单数据的投诉倾向分析预警方法,其特征在于,包括:获取工单数据,以工单单号相同的工单数据为单位,对各个隶属于同一个单位的工单数据进行分词,得到第一分词组合;删除所述第一分词组合中的停用词,得到所述工单数据的第二分词组合;利用word2vec模型生成所述第二分词组合词中各个分词的词向量;求解所述工单数据对应的词向量的平均向量,将所述平均向量作为所述工单数据的句向量;利用k‑means算法将各个所述工单数据的句向量划分为三个簇,所述三个簇对应所述工单数据的三个投诉倾向类别,其中,所述三个投诉倾向类别分别为:高危投诉倾向、有投诉倾向以及无投诉倾向;为各个投诉倾向类别的工单数据分别设置相应的第一输出向量,并将所述工单数据的句向量作为第一输入向量,利用Softmax逻辑回归生成投诉倾向分类模型;利用所述投诉倾向分类模型判断新的工单数据的投诉倾向类别;若所述新的工单数据的投诉倾向类别为高危投诉倾向或有投诉倾向,则作出预警。

【技术特征摘要】
1.一种工单数据的投诉倾向分析预警方法,其特征在于,包括:获取工单数据,以工单单号相同的工单数据为单位,对各个隶属于同一个单位的工单数据进行分词,得到第一分词组合;删除所述第一分词组合中的停用词,得到所述工单数据的第二分词组合;利用word2vec模型生成所述第二分词组合词中各个分词的词向量;求解所述工单数据对应的词向量的平均向量,将所述平均向量作为所述工单数据的句向量;利用k-means算法将各个所述工单数据的句向量划分为三个簇,所述三个簇对应所述工单数据的三个投诉倾向类别,其中,所述三个投诉倾向类别分别为:高危投诉倾向、有投诉倾向以及无投诉倾向;为各个投诉倾向类别的工单数据分别设置相应的第一输出向量,并将所述工单数据的句向量作为第一输入向量,利用Softmax逻辑回归生成投诉倾向分类模型;利用所述投诉倾向分类模型判断新的工单数据的投诉倾向类别;若所述新的工单数据的投诉倾向类别为高危投诉倾向或有投诉倾向,则作出预警。2.根据权利要求1所述的方法,其特征在于,所述利用word2vec模型生成所述第二分词组合词中各个第二分词的词向量,包括:根据以下公式计算所述第二分词出现的频率,并判断所述第二分词出现的频率是否大于第一预设阈值:其中,P(wi)为第二分词出现的频率,f(wi)为第二分词的出现频次,wi为第二分词,i=1,2,3...x,x为第二分词的数量,n为第二预设阈值;若所述第二分词出现的频率大于第一预设阈值,则确定频率大于第一预设阈值的第二分词为高频分词,并将所述高频分词从所述第二分词组合中剔除,将剔除高频分词后的第二分词组合作为第三分词组合;采用word2vec模型中的skip-gram模型构建所述第三分词组合的训练模型;利用所述训练模型,生成所述第三分词组合中各个分词的词向量。3.根据权利要求1所述的方法,其特征在于,所述利用k-means算法将各个所述工单数据的句向量划分为三个簇,所述三个簇对应所述工单数据的三个投诉倾向类别,包括:步骤301,利用k-means算法,随机选取三个句向量分别作为三个簇的中心,将所述三个簇的中心分别记为C1、C2和C3;步骤302,分别计算各个所述句向量与所述三个簇的中心之间的欧式距离,确定与各个所述句向量的欧式距离最近的Ci,并将所述句向量归类到Ci对应的簇,其中,i=1,2,3;步骤303,计算各个簇中所有句向量的各个维度的均值,将所述均值组成的向量作为所述簇的新的中心;步骤304,判断所述簇的新的中心与随机选取的所述簇的中心是否一致,若不一致,则返回执行步骤302的操作,直至各个簇的新的中心与前一次计算的中心一致,并将所述簇的新的中心作为目标中心。4.根据权利要求1所述的方法,其特征在于,利用所述投诉倾向分类模型判断新的工单数据的投诉倾向类别,包括:生成与所述新的工单数据对应的句向量;将所述新的工单数据对应的句向量作为所述投诉倾向分类模型的第二输入向量,获取与所述第二输入向量对应的第二输出向量;将所述第二输出向量与所述第一输出向量比较,获取与所述第二输出向量对应的第一输出向量,将所述第二输出向量对应的第一输出向量作出目标输出向量;确定与所述目标输出向量对应的投诉倾向类别,并将所述目标输出向量对应的投诉倾向类别作为所述新的工单数据的投诉倾向类别。5.一种工单数据的投诉倾向分析预警装置,其特征在于,包括:获取模块,用于...

【专利技术属性】
技术研发人员:杨政刘柱揆尹春林潘侃朱华
申请(专利权)人:云南电网有限责任公司电力科学研究院
类型:发明
国别省市:云南,53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1