一种基于机器学习的工单分派方法和系统技术方案

技术编号:27222303 阅读:15 留言:0更新日期:2021-02-04 11:42
本发明专利技术涉及一种基于机器学习的工单分派方法和系统,该方法包括以下步骤:建立数据库存储采集的故障信息,并从所述数据库获取故障数据;根据改进的TF

【技术实现步骤摘要】
一种基于机器学习的工单分派方法和系统


[0001]本专利技术涉及工单分派的
,尤其涉及一种基于机器学习的工单分派方法和系统。

技术介绍

[0002]随着互联网数据规模的急剧膨胀,以及IT服务类型的复杂多样,如何在巨大的信息量中更加有效地发现和使用信息,以及如何利用海量信息提供更高质量和智能化的信息服务,越来越被关注。基于“人为制定规则”的传统IT运维自动化系统在对故障数据的关键信息进行提取的过程中,经常会出现提取的关键信息不能有效地反映词语的重要程度和特征词的分布情况。尤其在同类语料库中,问题尤为突出,往往会出现一些同类文本的关键词的权值很小,接近于0,而且精确度也相对低的问题。另外,传统IT运维自动化系统在对故障数据的关键信息进行分类的过程中,由于不同的属性对分类的影响力度相同时,通常会被认定具有相同的权重。从而会导致虽然是不同属性,但是对分类不能产生各自的影响。

技术实现思路

[0003]为了解决现有技术中存在的部分缺点和不足,本专利技术提出了一种基于机器学习的工单分派方法和系统,通过对现有故障数据的关键词提取过程的改进,可以解决最后权值过小的问题。另外,通过采用层次分析法改进传统的故障预测分类过程,可以给故障数据不同的属性均赋予相对应的权重。因此,可以实现不同属性具有不同的权重,并分别对分类产生不同影响。,提高故障解决效率。
[0004]在一个方面中,本公开提供了一种基于机器学习的工单分派方法,其特征在于,该方法包括以下步骤:建立数据库存储采集的故障信息,并从所述数据库获取故障数据;根据改进的TF-IDF算法对所述故障数据进行预处理,其中所述故障数据包括训练故障数据和测试故障数据;建立基于属性赋值改进的KNN算法的机器学习模型,利用所述训练故障数据的分类信息通过层次分析法对所述模型进行训练;以及利用训练好的模型将所述测试故障数据的关键词与所述训练故障数据的分类信息进行匹配,以便根据匹配结果对所述测试故障数据执行相应的操作。
[0005]在一个实施例中,所述改进的TF-IDF算法是基于TF-IDF算法与加权相结合的方式,对所述故障数据的关键词进行抽取。
[0006]在另一个实施例中,所述改进的TF-IDF算法的IDF*为:IDF* = log(语料库中所有词语频数之和/词语在语料库中出现的总频数);其中IDF* 为逆文档频率。
[0007]在又一个实施例中,所述改进的KNN算法通过层次分析法对所述故障数据的不同属性进行不同的权重赋值。
[0008]在一个实施例中,建立基于属性赋值改进的KNN算法的机器学习模型,利用所述训练故障数据的分类信息通过层次分析法对模型进行训练,包括:将所述预处理后的故障数据导入所述模型,并进行归一化处理;构建层次结构模型,并根据所述层次结构确认各层次之间的判断矩阵,其中所述层次结构包括目标层、准则层和方案层;初始化目标层与准则层之间的判断矩阵,进行层次单排序;对所述目标层与准则层之间的判断矩阵进行一致性检验,若所述目标层与准则层之间的判断矩阵不一致,调整所述目标层与准则层之间的判断矩阵直至通过一致性检验;初始化准则层与方案层之间的判断矩阵,进行层次单排序;对所述准则层与方案层之间的判断矩阵进行一致性检验;若所述准则层与方案层之间的判断矩阵不一致,调整所述准则层与方案层之间的判断矩阵直至通过一致性检验;对各个层次进行总排序,以获得所述方案层的不同属性的权重;对所述测试故障数据的任意一个测试样本进行测试,确定K值,以获得所述测试样本的分类信息,包括:利用加权欧氏距离公式确定所述测试样本与所述训练故障数据的任意一个训练数据间的加权距离值,以获得多个加权距离值;将获得的多个所述加权距离值进行排序,以便确定距离最近的K个所述训练数据,并根据K个所述训练数据的分类确定所述测试样本的分类信息,其中K是小于或等于20的正整数;以及对所述测试故障数据的各个测试样本进行遍历测试,以获得所述各个测试样本的分类信息。
[0009]在另一个实施例中,两层之间的判断矩阵进行一致性检验,包括:通过所述两层之间的判断矩阵获得一致性指标;利用一致性指标获得一致性比例;以及根据一致性比例的数值确定是否通过一致性检验。
[0010]在又一个实施例中,所述两层之间的判断矩阵获得最大特征值及其对应的特征向量,所述一致性指标CI利用下式获得:CI=(λ
max
ꢀ-
n)/(n-1);其中λ
max
是两层之间判断矩阵的最大特征向量,n是两层之间判断矩阵的最大特征值。
[0011]在一个实施例中,确定任意两个样本数据间的加权欧氏距离公式为:其中d(x
i,
x
j
)为任意两个样本x
i
和x
j
的加权距离,x为待测样本,是个n维向量,样本i表示x
i
=(x
1i
, x
2i
,

,x
ni ),样本j表示x
i
=(x
1j
, x
2j
,

,x
nj
),p=1

n,表示不同的属性,是对应的属性的权重。
[0012]在另一个实施例中,利用训练好的模型将所述测试故障数据的关键词与所述训练
故障数据的分类信息进行匹配,以便根据匹配结果进行相应的操作,包括:当所述测试故障数据的关键词与所述训练故障数据的分类信息匹配成功时,获得所述测试故障数据对应的处理部门,并将所述测试故障数据推送至所述处理部门;以及当所述测试故障数据的关键词与所述训练故障数据的分类信息匹配失败时,显示为未知问题,并将所述测试故障数据推送至后台客户端。
[0013]在另一方面中,本公开提供一种基于机器学习的工单分派系统,包括:数据库,其用于存储采集的故障数据;预处理单元,其用于从数据库获取所述故障数据,并根据改进的TF-IDF算法对所述故障数据进行预处理,其中所述故障数据包括训练故障数据和测试故障数据;模型训练单元,其用于基于属性赋值改进的KNN算法的机器学习模型,利用所述故障数据的分类信息通过层次分析法对模型进行训练;以及处理单元,其用于利用训练好的模型将所述测试故障数据的关键词与所述训练故障数据的分类信息进行匹配,以便根据匹配结果对所述测试故障数据执行相应的操作,包括:当所述测试故障数据的关键词与所述训练故障数据的分类信息匹配成功时,获得所述测试故障数据对应的处理部门,并将所述测试故障数据推送至所述处理部门;以及当所述测试故障数据的关键词与所述训练故障数据的分类信息匹配失败时,显示为未知问题,并将所述测试故障数据推送至后台客户端。
[0014]本专利技术通过改进的TF-IDF算法(“Term Frequency
ꢀ-ꢀ
Inverse Document Frequency”,一种数值统计方法用于反映一个词对于语料库中某篇文档的重要性)和改进的KNN(“K-Nearest Neighbor本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的工单分派方法,其特征在于,该方法包括以下步骤:建立数据库存储采集的故障信息,并从所述数据库获取故障数据;根据改进的TF-IDF算法对所述故障数据进行预处理,其中所述故障数据包括训练故障数据和测试故障数据;建立基于属性赋值改进的KNN算法的机器学习模型,利用所述训练故障数据的分类信息通过层次分析法对所述模型进行训练;以及利用训练好的模型将所述测试故障数据的关键词与所述训练故障数据的分类信息进行匹配,以便根据匹配结果对所述测试故障数据执行相应的操作。2.根据权利要求1所述的工单分派方法,其特征在于,其中所述改进的TF-IDF算法是基于TF-IDF算法与加权相结合的方式,对所述故障数据的关键词进行抽取。3.根据权利要求2所述的工单分派方法,其特征在于,其中所述改进的TF-IDF算法的IDF*为:IDF* = log(语料库中所有词语频数之和/词语在语料库中出现的总频数);其中IDF* 为逆文档频率。4.根据权利要求1所述的工单分派方法,其特征在于,其中所述改进的KNN算法通过层次分析法对所述故障数据的不同属性进行不同的权重赋值。5.根据权利要求4所述的工单分派方法,其特征在于,其中建立基于属性赋值改进的KNN算法的机器学习模型,利用所述训练故障数据的分类信息通过层次分析法对模型进行训练,包括:将所述预处理后的故障数据导入所述模型,并进行归一化处理;构建层次结构模型,并根据所述层次结构确认各层次之间的判断矩阵,其中所述层次结构包括目标层、准则层和方案层;初始化目标层与准则层之间的判断矩阵,进行层次单排序;对所述目标层与准则层之间的判断矩阵进行一致性检验,若所述目标层与准则层之间的判断矩阵不一致,调整所述目标层与准则层之间的判断矩阵直至通过一致性检验;初始化准则层与方案层之间的判断矩阵,进行层次单排序;对所述准则层与方案层之间的判断矩阵进行一致性检验;若所述准则层与方案层之间的判断矩阵不一致,调整所述准则层与方案层之间的判断矩阵直至通过一致性检验;对各个层次进行总排序,以获得所述方案层的不同属性的权重;对所述测试故障数据的任意一个测试样本进行测试,确定K值,以获得所述测试样本的分类信息,包括:利用加权欧氏距离公式确定所述测试样本与所述训练故障数据的任意一个训练数据间的加权距离值,以获得多个加权距离值;将获得的多个所述加权距离值进行排序,以便确定距离最近的K个所述训练数据,并根据K个所述训练数据的分类确定所述测试样本的分类信息,其中K是小于或等于20的正整数;以及对所述测试故障数据的各个测试样本进行遍历测试,以获得所述各个测试样本的分类信息。6.根据权利要求5所述的工单分派方法,其特征在于,其中两层之间的判断矩阵进行一
致性检验,包括:通过所述两层之间的判断矩阵获得一致性指标;利用一致性指标获得...

【专利技术属性】
技术研发人员:张蔓琪
申请(专利权)人:北京蒙帕信创科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1