【技术实现步骤摘要】
一种挖掘KPI根因的方法及装置
本专利技术实施例涉及通信
,尤其涉及一种挖掘KPI根因的方法及装置。
技术介绍
随着网络的发展、用户数量的增加以及用户分布的改变,网络性能不断发生变化;网络性能的优化是系统实际运营过程中的一个重要环节,是运行维护工作的一个重要组成部分。通过不断地进行有效的网络优化,在保证网络设备正常运行的前提下,根据系统的实际表现、实际性能,对系统进行分析,并对系统的参数进行调整,可以使网络性能得以逐步改善。而随着通信技术的发展,移动通信网络规模的扩大,如何准确、实时地掌握网络的运行情况,如何从用户的角度感知网络性能,如何评价网络的质量是移动运营商的重要工作之一。一般地,可以采用网络性能监测分析的方法,依靠预定义的一组关键绩效指标(KeyPerformanceIndicators,KPI)挖掘到网络性能问题的根因。具体的,KPI根因挖掘主要从关键KPI性能指标恶化的现象出发,找出网络异常现象背后产生网络性能问题的最直接、相关的根因,并输出各种根因统计结果。根据挖掘的根因,可以针对性的选择最佳KPI优化方案,从而最大概率降低关键KPI性能指标恶 ...
【技术保护点】
1.一种挖掘关键绩效指标KPI根因的方法,其特征在于,包括:获取参数,所述参数包括KPI报表的存储路径以及待挖掘的异常KPI项;根据所述KPI报表的存储路径读取KPI报表,所述KPI报表包括N行,M列,所述N和所述M均为大于或者等于1的正整数;其中,一列用于存储一个特征,一个特征为一个KPI项,一个所述KPI项包括该KPI标识和对应的特征值,所述待挖掘的异常KPI项为所述KPI报表中的一个特征;一行用于存储一条记录;执行以下步骤101‑102至少一次,获取至少一个决策树;101、采集所述KPI报表中至少一条第一记录和至少一条第二记录,得到训练数据集;其中,所述训练数据集包括 ...
【技术特征摘要】
1.一种挖掘关键绩效指标KPI根因的方法,其特征在于,包括:获取参数,所述参数包括KPI报表的存储路径以及待挖掘的异常KPI项;根据所述KPI报表的存储路径读取KPI报表,所述KPI报表包括N行,M列,所述N和所述M均为大于或者等于1的正整数;其中,一列用于存储一个特征,一个特征为一个KPI项,一个所述KPI项包括该KPI标识和对应的特征值,所述待挖掘的异常KPI项为所述KPI报表中的一个特征;一行用于存储一条记录;执行以下步骤101-102至少一次,获取至少一个决策树;101、采集所述KPI报表中至少一条第一记录和至少一条第二记录,得到训练数据集;其中,所述训练数据集包括M个特征,P条记录,所述P为大于或者等于1的正整数;所述第一记录为所述待挖掘的异常KPI项中的特征值为正常数据的记录,所述第二记录为所述待挖掘的异常KPI项中的特征值为异常数据的记录;所述P小于或者等于所述N;102、根据所述训练数据集的M个特征,分别对所述训练数据集进行训练,得到决策树;其中,所述决策树包括至少两层节点,一个非叶节点为所述训练数据集的一个特征的特征值确定的训练条件,该非叶节点的第一子节点包含所述训练数据集中满足所述非叶节点的训练条件的记录,该非叶节点的第二子节点包含所述训练数据集中不满足所述非叶节点的训练条件的记录;一个非叶节点的训练条件与该非叶节点的子节点的训练条件不同;根据所述至少一个决策树确定目标KPI根因,所述目标KPI根因为所述KPI报表中使得所述待挖掘的异常KPI项异常的特征。2.根据权利要求1所述的方法,其特征在于,所述采集所述KPI报表中至少一条第一记录和至少一条第二记录,生成训练数据集,包括:根据每个KPI项的特征值对所述KPI项所处列的缺省值赋值;对所述待挖掘的异常KPI项中的特征值标注属性信息,所述属性信息用于指示所述待挖掘的异常KPI项中的特征值为正常数据或者异常数据;根据所述KPI报表中的属性信息,采集所述KPI报表中至少一条第一记录和至少一条第二记录,得到训练数据集。3.根据权利要求2所述的方法,其特征在于,所述对所述待挖掘的异常KPI项中的特征值标注属性信息,包括:判断所述待挖掘的异常KPI项中的特征值是否大于或者等于第一阈值;当所述待挖掘的异常KPI项中的特征值大于或者等于所述第一阈值时,则标注该特征值为第一属性信息,所述第一属性信息用于指示所述待挖掘的异常KPI项中的特征值为正常数据;当所述待挖掘的异常KPI项中的特征值小于所述第一阈值时,则标注该特征值为第二属性信息,所述第二属性信息用于指示所述待挖掘的异常KPI项中的特征值为异常数据。4.根据权利要求2或3所述的方法,其特征在于,所述参数还包括数据采样比率Ra;相应的,所述根据所述KPI报表中的属性信息,采集所述KPI报表中至少一条第一记录和至少一条第二记录,得到训练数据集,包括:计算所述KPI报表中的每一条记录pi的置信度c(pi),i=0,1,2,...,P-1,P为所述KPI报表中包含的记录的条数;从所述KPI报表中随机采集条所述第一记录,以及从所述KPI报表中随机采集条c(pi)>random(0,1)的所述第二记录,得到所述训练数据集;其中,random(0,1)为一个随机函数,random(0,1)用于生成一个取值范围为0~1的随机数。5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述训练数据集的M个特征,分别对所述训练数据集进行训练,得到决策树,包括:201、确定所述决策树的第一特征以及所述第一特征的参考值,所述第一特征为所述决策树的一个非叶节点中的特征;202、根据所述第一特征以及所述第一特征的参考值,确定所述决策树的非叶节点;203、根据所述非叶节点以及所述第一特征的特征值,将所述训练数据集分裂为两个训练数据集;204、将所述第一特征标记为不可用特征;继续执行201-204,直至满足第一条件,则:停止分裂所述非叶节点的训练数据集;其中,所述第一条件包括以下任一项:所述非叶节点的训练数据集中没有可分裂的特征;或者,所述非叶节点的训练数据集的所述待挖掘的异常KPI项中的所有特征值均为正常数据;或者,所述非叶节点的训练数据集的所述待挖掘的异常KPI项中的所有特征值均为异常数据。6.根据权利要求5所述的方法,其特征在于,所述确定所述决策树的第一特征以及所述第一特征的参考值,包括:从所述训练数据集每个可用特征的第一信息熵增益中选取最大第一信息熵增益;其中,所述第一信息熵增益为所述训练数据集中可用特征的特征值对应的信息熵增益中的最大信息熵增益;将所述最大第一信息熵增益对应的特征确定为所述决策树的第一特征,以及将所述第一特征的第一信息熵增益对应的特征值确定为所述第一特征的参考值。7.根据权利要求6所述的方法,其特征在于,在所述从所述训练数据集每个可用特征的第一信息熵增益中选取最大第一信息熵增益之前,所述方法还包括:分别计算所述训练数据集中每个可用特征的特征值对应的信息熵增益;分别从所述训练数据集中每个可用特征的特征值对应的信息熵增益中,选取该特征的特征值对应的最大信息熵增益;分别将所述训练数据集中每个可用特征的特征值对应的最大信息熵增益确定为该特征的第一信息熵增益。8.根据权利要求6或7所述的方法,其特征在于,所述参数还包括决策树生长系数;相应的,所述第一条件还包括:所述第一特征的第一信息熵增益小于所述决策树生长系数。9.根据权利要求6-8所述的方法,其特征在于,针对一个决策树,根据所述决策树确定目标KPI根因,包括:统计所述决策树中每个非叶节点的训练数据集中包含的所述第二记录的条数;从所述决策树中读取每个非叶节点的第一特征的第一信息熵增益;根据所述决策树中每个非叶节点的训练数据集中包含的所述第二记录的条数以及每个非叶节点的第一特征的第一信息熵增益,分别计算所述训练数据集中每个特征的加权信息熵增益;将至少一个第二特征确定为所述目标KPI根因,所述第二特征为所述加权信息熵增益中非零的加权信息熵增益对应的特征。10.根据权利要求1-9任一项所述的方法,其特征在于,针对至少两个决策树,根据所述至少两个决策树确定目标KPI根因,包括:根据至少两个决策树确定至少两组KPI根因集合,每组KPI根因集合包括至少一个KPI根因,一个所述KPI根因为第二特征,所述第二特征为所述加权信息熵增益中非零的加权信息熵增益对应的特征;将所述每组KPI根因集合中均包括的KPI根因确定为所述目标KPI根因。11.根据权利要求1-10任一项所述的方法,其特征在于,在所述根据所述至少一个决策树确定目标KPI根因之后,所述方法还包括:获取所述目标KPI根因中每个KPI根因的权重;其中,一个KPI根因的权重为每组KPI根因集合中包含的该KPI根因的加权信息熵增益之和;输出所述目标KPI根因以及所述目标KPI根因中每个KPI根因的权重。12.一种挖掘关键绩效指标KPI根因的装置,其特征在于,包括:获取单元,用于获取参数,所述参数包括KPI报表的存储路径以及待挖掘的异常KPI项;读取单元,用于根据所述KPI报表的存储路径读取KPI报表,所述KPI报表包括N行,M列,所述N和所述M均为大于或者等于1的正整数;其中,一列用于存储一个特征,一个特征为一个KPI项,一个所述KPI项包括该KPI标识和对应的特征值,所述待挖掘的异常KPI项为所述K...
【专利技术属性】
技术研发人员:杨育彬,范仕良,卢文羊,宋平,
申请(专利权)人:华为技术有限公司,南京大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。