基于机器学习算法的工单质检方法和装置制造方法及图纸

技术编号：20866709 阅读：20 留言：0更新日期：2019-04-17 09:23

本说明书实施例提供基于机器学习的工单质检方法和装置。在一个例子中，工单质检方法包括：从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息；利用分词词典、停用词词典对投诉内容、附加报结信息进行分词，去除停用词操作；分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量；基于向量，利用训练模型进行预测，获取预测的业务类别；其中，训练模型是利用业务类别正确的历史工单训练得到；将预测的业务类别与实际的业务类别进行对比，如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。本发明专利技术实施例有助于提高工单质检准确率。

全部详细技术资料下载

【技术实现步骤摘要】
基于机器学习算法的工单质检方法和装置
本专利技术涉及移动通信的网管
，具体地说涉及EOMS系统中的工单内容进行质检的方法和装置。
技术介绍
现有EOMS系统(ElectricOperationMaintenanceSystem,电子运维系统)中包含了一整套工单流转与处理的流程。客服平台生成的投诉工单流转至EOMS系统，监控室投诉处理班组对部分字段根据规则和经验进行判断是否符合。在整个环节中，主要在受理、预处理、报结这3个环节需要人工进行检查。人工检查费时费力，且由于工单量大、人力成本高，通常只能做到抽检，无法对全量工单进行检查。为了解决人工检查费时费力的问题，现有通常的做法是通过设定固定的质检规则的方式来对工单文本进行判断。这种方式通常需要经验丰富的质检人员设定检测规则、构建检测字典等方式。但是，由于工单内容通常为非结构化文本，通常缺少固定的格式，导致构建能够覆盖全面的规则的难度较大，且构建规则时的判断费时费力，准确率也不高。
技术实现思路
根据本专利技术第一方面，提供一种基于机器学习算法的工单质检方法，包括：从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息；利用分词词典、停用词词典对投诉内容、附加报结信息进行分词，去除停用词操作；分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量；基于向量，利用训练模型进行预测，获取预测的业务类别；其中，训练模型是利用业务类别正确的历史工单训练得到；将预测的业务类别与从工单抽取的业务类别进行对比，如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。根据本专利技术第二方面，提供一种基于...

【技术保护点】
1.一种基于机器学习算法的工单质检方法，包括：从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息；利用分词词典、停用词词典对投诉内容、附加报结信息进行分词，去除停用词操作；分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量；基于向量，利用训练模型进行预测，获取预测的业务类别；其中，训练模型是利用业务类别正确的历史工单训练得到；将预测的业务类别与从工单抽取的业务类别进行对比，如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。

【技术特征摘要】
1.一种基于机器学习算法的工单质检方法，包括：从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息；利用分词词典、停用词词典对投诉内容、附加报结信息进行分词，去除停用词操作；分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为一个向量；基于向量，利用训练模型进行预测，获取预测的业务类别；其中，训练模型是利用业务类别正确的历史工单训练得到；将预测的业务类别与从工单抽取的业务类别进行对比，如果一致则认定该工单的投诉内容、附加报结信息与业务类别一致。2.一种基于机器学习算法的工单质检方法，包括：从待质检工单中抽取出附加报结信息、解决情况这两个信息；利用分词词典、停用词词典对附加报结信息进行分词，去除停用词操作；分别对分词后的附加报结信息进行向量化；基于向量，利用训练模型进行预测，获取预测的解决情况；其中，训练模型是利用解决情况正确的历史工单训练得到；将预测的解决情况与从工单抽取的解决情况进行对比，如果一致则认定附加报结信息和解决情况一致。3.一种基于机器学习算法的工单质检方法，包括：从待质检工单中抽取出投诉内容、附加报结信息、报结意见三个信息，以及基站小区状态表的数据；利用分词词典、停用词词典对投诉内容、附加报结信息进行分词，去除停用词操作；分别对分词后的投诉内容、附加报结信息进行向量化并将其合并为第一向量；对工单中的故障地址与基站小区状态表中的地址做模糊匹配，获取故障地址是否已知弱覆盖信息以及场景信息，将弱覆盖信息与场景信息转化为第二向量并与第一向量结果合并为第三向量；基于上述合并后的向量，利用训练模型进行预测，获取预测的报结意见；其中，训练模型是利用报结意见正确的历史工单训练得到；将预测的报结意见与从工单抽取的报结意见进行对比，如果一致则返回投诉内容、附加报结信息和报结意见一致。4.一种工单质检装置，包括：抽取单元，从待质检工单中抽取出投诉内容、附加报结信息、业务类别三个信息；分词单元，利用分词词典、停用词词典对投诉内容、附加报结信息进行分词，去除停用词操作；向量化单元，分别对分词...

【专利技术属性】
技术研发人员：李道勋，吴志清，李欢欢，颜奕，陈亚萍，
申请(专利权)人：杭州东方通信软件技术有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人