基于机器学习算法的工单质检方法和装置制造方法及图纸

技术编号:20866709 阅读:20 留言:0更新日期:2019-04-17 09:23
本说明书实施例提供基于机器学习的工单质检方法和装置。在一个例子中,工单质检方法包括:从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;将预测的业务类别与实际的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。本发明专利技术实施例有助于提高工单质检准确率。

【技术实现步骤摘要】
基于机器学习算法的工单质检方法和装置
本专利技术涉及移动通信的网管
,具体地说涉及EOMS系统中的工单内容进行质检的方法和装置。
技术介绍
现有EOMS系统(ElectricOperationMaintenanceSystem,电子运维系统)中包含了一整套工单流转与处理的流程。客服平台生成的投诉工单流转至EOMS系统,监控室投诉处理班组对部分字段根据规则和经验进行判断是否符合。在整个环节中,主要在受理、预处理、报结这3个环节需要人工进行检查。人工检查费时费力,且由于工单量大、人力成本高,通常只能做到抽检,无法对全量工单进行检查。为了解决人工检查费时费力的问题,现有通常的做法是通过设定固定的质检规则的方式来对工单文本进行判断。这种方式通常需要经验丰富的质检人员设定检测规则、构建检测字典等方式。但是,由于工单内容通常为非结构化文本,通常缺少固定的格式,导致构建能够覆盖全面的规则的难度较大,且构建规则时的判断费时费力,准确率也不高。
技术实现思路
根据本专利技术第一方面,提供一种基于机器学习算法的工单质检方法,包括:从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;将预测的业务类别与从工单抽取的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。根据本专利技术第二方面,提供一种基于机器学习算法的工单质检方法,包括:从待质检工单中抽取出附加报结信息、解决情况这两个信息;利用分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;分别对分词后的附加报结信息进行向量化;基于向量,利用训练模型进行预测,获取预测的解决情况;其中,训练模型是利用解决情况正确的历史工单训练得到;将预测的解决情况与从工单抽取的解决情况进行对比,如果一致则认定附加报结信息和解决情况一致。根据本专利技术第三方面,提供一种基于机器学习算法的工单质检方法,包括:从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息,以及基站小区状态表的数据;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为第一向量;对工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息,将弱覆盖信息与场景信息转化为第二向量并与第一向量结果合并为第三向量;基于上述合并后的第三向量,利用训练模型进行预测,获取预测的报结意见;其中,训练模型是利用报结意见正确的历史工单训练得到;将预测的报结意见与从工单抽取的报结意见进行对比,如果一致则返回投诉内容、附加报结信息和报结意见一致。根据本专利技术第四方面,提供一种工单质检装置,包括:抽取单元,从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;分词单元,利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;向量化单元,分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;预测单元,基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;对比单元,将预测的业务类别与从工单抽取的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。根据本专利技术第五方面,提供一种工单质检装置,包括:抽取单元,从待质检工单中抽取出附加报结信息、解决情况这两个信息;分词单元,利用分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;向量化单元,分别对分词后的附加报结信息进行向量化;预测单元,基于向量,利用训练模型进行预测,获取预测的解决情况;其中,训练模型是利用解决情况正确的历史工单训练得到;对比单元,将预测的解决情况与从工单抽取的解决情况进行对比,如果一致则认定附加报结信息和解决情况一致。根据本专利技术第六方面,提供一种工单质检装置,包括:抽取单元,从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息,以及基站小区状态表的数据;分词单元,利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;向量化单元,分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为第一向量;弱覆盖信息与场景信息向量化单元和合并单元,对工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息,将弱覆盖信息与场景信息转化为第二向量并与第一向量合并;预测单元,基于上述合并后的第三向量,利用训练模型进行预测,获取预测的报结意见;其中,训练模型是利用报结意见正确的历史工单训练得到;对比单元,将预测的报结意见与从工单抽取的报结意见进行对比,如果一致则返回投诉内容、附加报结信息和报结意见一致。采用本专利技术实施例的技术优点:能够通过增加特征、SVM的模型调优等方式来获得效果最优的模型,从而提高结果判断准确率。不需要人工提炼规则,只需要利用历史数据就能对模型进行迭代更新。在未来新增工单内容、新增投诉类别等信息之后也能快速迭代。由于大部分合格工单已经被筛选过滤,所以能够大量减少人工审核工单的数量。附图说明图1是根据本专利技术实施例的基于业务类别分类模型的工单质检方法示意图;图2是根据本专利技术实施例的基于解决情况分类模型的工单质检方法示意图;图3是根据本专利技术实施例的基于报结意见分类模型的工单质检方法示意图;图4示意了根据本说明书实施例的可用于实现上述各种技术的设备的详细结构图;图5是基于业务类别分类模型的工单质检装置的示意图;图6是基于解决情况分类模型的工单质检装置的示意图;图7是基于报结意见分类模型的工单质检装置的示意图。具体实施方式本专利技术实施例基于机器学习的文本分类算法自动对工单内容进行分类。利用历史工单数据对模型进行训练和迭代优化。然后通过训练后的模型获得准确的工单类别,并与实际填写的内容进行比对。将比对失败的工单标记为质检不合格并输出。当前情况下,每月大致有例如15万以上的工单,每个待质检工单中均包含:投诉内容、附加报结信息、投诉业务类别、解决情况、报结意见。在质检时,主要判断投诉业务类别、解决情况、报结意见是否填写正确,是否和投诉内容、附加报结信息相匹配。如果利用人工质检,则费时费力,如果利用规则质检,则准确率不高且规则设定是否困难。本专利技术实施例基于机器学习中的TFIDF(termfrequency–inversedocumentfrequency词频-逆文本频率指数)和SVM(SupportVectorMachine,支持向量机)算法,基于投诉内容、附加报结信息、投诉业务类别、解决情况、报结意见等字段中的一个或多个分别构建文本分类模型,利用训练后的模型对工单进行质检。TFIDF是一种统计方法,通过计算文本中的词频数和逆向文件频率的乘积来给词赋值,从而对文本进行向量化。一个词在一段文本中出现的次数越多,在所有文本中出现的次数越少,则越能代表该段文本,其TFIDF的值越大。SVM算法是机器学习算法中的一种分类模型。它的分类本文档来自技高网...

【技术保护点】
1.一种基于机器学习算法的工单质检方法,包括:从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;将预测的业务类别与从工单抽取的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。

【技术特征摘要】
1.一种基于机器学习算法的工单质检方法,包括:从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量;基于向量,利用训练模型进行预测,获取预测的业务类别;其中,训练模型是利用业务类别正确的历史工单训练得到;将预测的业务类别与从工单抽取的业务类别进行对比,如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。2.一种基于机器学习算法的工单质检方法,包括:从待质检工单中抽取出附加报结信息、解决情况这两个信息;利用分词词典、停用词词典对附加报结信息进行分词,去除停用词操作;分别对分词后的附加报结信息进行向量化;基于向量,利用训练模型进行预测,获取预测的解决情况;其中,训练模型是利用解决情况正确的历史工单训练得到;将预测的解决情况与从工单抽取的解决情况进行对比,如果一致则认定附加报结信息和解决情况一致。3.一种基于机器学习算法的工单质检方法,包括:从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息,以及基站小区状态表的数据;利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为第一向量;对工单中的故障地址与基站小区状态表中的地址做模糊匹配,获取故障地址是否已知弱覆盖信息以及场景信息,将弱覆盖信息与场景信息转化为第二向量并与第一向量结果合并为第三向量;基于上述合并后的向量,利用训练模型进行预测,获取预测的报结意见;其中,训练模型是利用报结意见正确的历史工单训练得到;将预测的报结意见与从工单抽取的报结意见进行对比,如果一致则返回投诉内容、附加报结信息和报结意见一致。4.一种工单质检装置,包括:抽取单元,从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息;分词单元,利用分词词典、停用词词典对投诉内容、附加报结信息进行分词,去除停用词操作;向量化单元,分别对分词...

【专利技术属性】
技术研发人员:李道勋吴志清李欢欢颜奕陈亚萍
申请(专利权)人:杭州东方通信软件技术有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1