基于大数据的工单类型的识别方法、系统和计算设备技术方案

技术编号:19593246 阅读:47 留言:0更新日期:2018-11-28 04:50
本发明专利技术涉及一种基于大数据的工单类型的识别方法、系统和计算设备,该方法包括:获取待分类工单,对待分类工单中的结构化字段进行相关性分析获取第一相关系数;若第一相关系数超过预设阈值,去除待分类工单中相应的结构化字段,获取待分类目标工单;提取待分类目标工单的第一特征单词,根据第一特征单词利用预先构建的朴素贝叶斯模型分别计算在第一特征单词出现的条件下,待分类工单类型为不同的工单类型时对应的概率;根据不同的工单类型对应的概率判断待分类工单的类型。采用本方法能够避免工单的大量堆积造成服务器存储空间的占用以及业务系统运行效率的降低。

【技术实现步骤摘要】
基于大数据的工单类型的识别方法、系统和计算设备
本专利技术涉及数据处理
,特别是涉及一种基于大数据的工单类型的识别方法、系统和计算设备。
技术介绍
随着电信网络数字化程度的不断提高,电信业务形成规模化的工单,业务工单设计的类型越来越多,对工单类型的识别难度越来越大,且现阶段人工识别工单类型的速度跟不上业务快速增长的速度,工单的积累大量占用服务器的存储空间,直接导致业务系统的运行效率降低。因此,依赖传统人工识别工单类型的方法不能满足新时期电信业务增长需求,需要寻找新的手段以提高工单类型的识别的工作效率和规划准确度。
技术实现思路
基于此,有必要针对工单的积累大量占用服务器的存储空间,直接导致业务系统的运行效率降低的问题,提供一种基于大数据的工单类型的识别方法、系统和计算设备。一种基于大数据的工单类型的识别方法,包括以下步骤:获取待分类工单,对所述待分类工单中的结构化字段进行相关性分析获取第一相关系数;若所述第一相关系数超过预设阈值,去除所述待分类工单中相应的结构化字段,获取待分类目标工单;提取所述待分类目标工单的第一特征单词,根据所述第一特征单词利用预先构建的朴素贝叶斯模型分别计算在本文档来自技高网...

【技术保护点】
1.一种基于大数据的工单类型的识别方法,其特征在于,包括以下步骤:获取待分类工单,对所述待分类工单中的结构化字段进行相关性分析获取第一相关系数;若所述第一相关系数超过预设阈值,去除所述待分类工单中相应的结构化字段,获取待分类目标工单;提取所述待分类目标工单的第一特征单词,根据所述第一特征单词利用预先构建的朴素贝叶斯模型分别计算在所述第一特征单词出现的条件下,待分类工单类型为不同的工单类型时对应的概率;根据各所述概率判断所述待分类工单的类型。

【技术特征摘要】
1.一种基于大数据的工单类型的识别方法,其特征在于,包括以下步骤:获取待分类工单,对所述待分类工单中的结构化字段进行相关性分析获取第一相关系数;若所述第一相关系数超过预设阈值,去除所述待分类工单中相应的结构化字段,获取待分类目标工单;提取所述待分类目标工单的第一特征单词,根据所述第一特征单词利用预先构建的朴素贝叶斯模型分别计算在所述第一特征单词出现的条件下,待分类工单类型为不同的工单类型时对应的概率;根据各所述概率判断所述待分类工单的类型。2.根据权利要求1所述的基于大数据的工单类型的识别方法,其特征在于,所述获取待分类工单的步骤之前,还包括以下步骤:获取工单样本集,从所述工单样本集中随机选取若干个工单样本形成工单训练集;计算所述工单训练集中工单训练样本的类型为不同的工单类型时对应的先验概率;从所述工单训练集中的工单训练样本中提取第二特征单词,并根据所述第二特征单词构建词袋模型的训练单词矩阵;根据所述训练单词矩阵获取在不同的工单类型条件时各所述第二特征单词的条件概率;根据所述先验概率以及所述条件概率构建朴素贝叶斯模型。3.根据权利要求2所述的基于大数据的工单类型的识别方法,其特征在于,所述获取工单样本集的步骤,包括以下步骤:获取不同类型的多个工单,对各所述工单中的结构化字段分别进行相关性分析,获取第二相关系数;若所述第二相关系数超过预设阈值,去除各所述工单中所述第二相关系数相应的结构化字段,获取工单样本集。4.根据权利要求3所述的基于大数据的工单类型的识别方法,其特征在于,所述根据所述先验概率以及所述条件概率构建朴素贝叶斯模型的步骤之后,还包括以下步骤:从所述工单样本集中随机选取若干个工单样本形成工单测试集;从所述工单测试集中的工单测试样本中提取第三特征单词;根据所述第三特征单词并利用所述朴素贝叶斯模型分别计算在所述第三特征单词出现的条件下,所述工单测试样本为不同的工单类型时对应的概率,并根据所述不同的工单类型对应的概率获取识别结果;根据所述识别结果与所述工单测试样本的类型获取所述朴素贝叶斯模型的分类准确率;若所述分类准确率低于预设阈值,则对所述朴素贝叶斯模型进行调整。5.根据权利要求4所述的基于大数据的工单类型的识别方法,其特征在于,所述对所述朴素贝叶斯模型进行调整的步骤,包括以下步骤:获取识别结果错误的...

【专利技术属性】
技术研发人员:李炯城吴佩娥李玥关晓明管学锋陈运动
申请(专利权)人:广东省电信规划设计院有限公司中国通信服务股份有限公司广东省通信产业服务有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1