本发明专利技术提供一种网络故障定位方法及系统。所述方法包括:获取网络故障监测数据的历史训练样本集,历史训练样本集包括样本属性;计算每个样本属性单独分类历史训练样本集的区分度,将区分度最高的样本属性作为初始决策树的根结点;根据当前结点的取值,将历史训练样本集划分为至少一个子集,每个子集形成一个初始决策树的分支;对每个子集,递归执行上述步骤,对初始决策树的分支进行划分,直至分支结点达到预设终止条件为止,将分支结点作为初始决策树的叶子结点,根据预设规则设定初始决策树的每个叶子结点的故障类别。本发明专利技术根据历史训练样本集生成网络故障定位初始决策树,具有自动学习的能力,从而快速、准确地定位网络故障。
【技术实现步骤摘要】
一种网络故障定位方法及系统
本专利技术涉及通信网络
,具体涉及一种网络故障定位方法及系统。
技术介绍
故障定位作为故障管理系统的一个核心模块,对于保障计算机通信网络的正常运作和业务的可持续性有着重要的意义。伴随着计算机通信网络规模的不断扩大,业务应用的大量部署,以及用户对服务质量要求的不断提高,如何在网络和业务出现故障的时候进行快速的定位并解决故障问题,从而保证业务的正常运作成为现在各计算机通信网络故障管理领域的核心问题。由于当今互联网的飞速发展,以及各类企业应用在计算机通信网络上的大量部署,故障定位系统不再局限于诊断协议栈底层的物理故障,诊断协议栈上层的各类业务应用的故障也逐步成为重点。这类上层业务应用故障的出现,在大型复杂网络中是由不同原因导致的,这对故障定位提出了高准确性的要求。因此,如何在一个复杂、大规模、含有噪声、故障根源具有不确定性的环境中进行有效的故障定位成为现今故障定位应用和研究的重点。当前,已经从计算机科学的不同领域中派生出多种方法应用于故障定位。例如基于规则推理的故障定位系统,由工作内存、推理引擎和知识库组成。推理引擎与知识库合作,将目前网络状态与知识库中规则的条件部分进行比较,以决定该规则是否被采用。一般情况下,采用一条规则很难确定网络中的故障,会反复将推理引擎的结果作为条件进行多次推理,得出最终结果。这种方法虽然符合人的思维便于理解,但规则的获取主要依靠专家的经验积累,自学习能力差,从而导致故障定位系统无法快速、准确地对故障进行定位,排查解决故障效率低。
技术实现思路
针对现有技术中的缺陷,本专利技术实施例提供一种网络故障定位方法及系统。第一方面,本专利技术实施例提供一种网络故障定位方法,包括:获取网络故障监测数据的历史训练样本集,所述历史训练样本集包括样本属性;计算每个所述样本属性单独分类所述历史训练样本集的区分度,将区分度最高的样本属性作为初始决策树的根结点;根据当前结点的取值,将所述历史训练样本集划分为至少一个子集,每个所述子集形成一个初始决策树的分支;对每个所述子集,递归执行上述步骤,对所述初始决策树的分支进行划分,直至分支结点达到预设终止条件为止,将所述分支结点作为所述初始决策树的叶子结点,根据预设规则设定所述初始决策树的每个所述叶子结点的故障类别。第二方面,本专利技术实施例提供一种网络故障定位系统,包括:样本获取单元,用于获取网络故障监测数据的历史训练样本集,所述历史训练样本集包括样本属性;结点确定单元,用于计算每个所述样本属性单独分类所述历史训练样本集的区分度,将区分度最高的样本属性作为初始决策树的根结点;分支划分单元,用于根据当前结点的取值,将所述历史训练样本集划分为至少一个子集,每个所述子集形成一个初始决策树的分支;递归单元,用于对每个所述子集,递归执行上述步骤,对所述初始决策树的分支进行划分,直至分支结点达到预设终止条件为止,将所述分支结点作为所述初始决策树的叶子结点,根据预设规则设定所述初始决策树的每个所述叶子结点的故障类别。第三方面,本专利技术实施例提供一种网络故障定位设备,包括:存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:获取网络故障监测数据的历史训练样本集,所述历史训练样本集包括样本属性;计算每个所述样本属性单独分类所述历史训练样本集的区分度,将区分度最高的样本属性作为初始决策树的根结点;根据当前结点的取值,将所述历史训练样本集划分为至少一个子集,每个所述子集形成一个初始决策树的分支;对每个所述子集,递归执行上述步骤,对所述初始决策树的分支进行划分,直至分支结点达到预设终止条件为止,将所述分支结点作为所述初始决策树的叶子结点,根据预设规则设定所述初始决策树的每个所述叶子结点的故障类别。第四方面,本专利技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如下方法:获取网络故障监测数据的历史训练样本集,所述历史训练样本集包括样本属性;计算每个所述样本属性单独分类所述历史训练样本集的区分度,将区分度最高的样本属性作为初始决策树的根结点;根据当前结点的取值,将所述历史训练样本集划分为至少一个子集,每个所述子集形成一个初始决策树的分支;对每个所述子集,递归执行上述步骤,对所述初始决策树的分支进行划分,直至分支结点达到预设终止条件为止,将所述分支结点作为所述初始决策树的叶子结点,根据预设规则设定所述初始决策树的每个所述叶子结点的故障类别。本专利技术实施例提供的网络故障定位方法及系统,根据网络故障监测数据的历史训练样本集生成网络故障定位初始决策树,不需要人工总结网络故障相关规律,可以从历史数据中自动学习网络故障相关的规则用以决策,具有自动学习的能力,避免了人工归纳的繁复性和可能存在的遗漏,从而快速、准确地定位网络故障。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的网络故障定位方法流程示意图;图2为本专利技术实施例提供的网络故障定位初始决策树示意图;图3为本专利技术实施例提供的网络故障定位实时决策树示意图;图4为本专利技术实施例提供的网络故障定位系统结构示意图;图5为本专利技术实施例提供的网络故障定位设备结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术实施例提供的网络故障定位方法流程示意图,如图1所示,所述方法包括:步骤S11、获取网络故障监测数据的历史训练样本集,所述历史训练样本集包括样本属性;由于分布在计算机通信网络中的各类实体,当发生不能直接向网络管理系统报告的故障时,故障往往通过网络中的各类物理实体和逻辑实体之间所固有的因果依赖关系,反映到其他实体上,从而使网络中的各种类别的实体互相影响。网络管理系统所检测到的症状信息,实际上已经是故障发生后经过各种实体相互作用进而产生的外在表现的结果。所以此时网络故障定位就体现出其不确定的特点。由于计算机通信网络中的各种实体(包括物理实体和逻辑实体)具有明确的因果依赖关系,将这种因果依赖关系转化成决策树模型,不仅可以对确定性的推理关系进行建模,更为重要的是其可以很好的对不确定的推理关系进行建模,因此非常适用于应用在如今的计算机通信网络中。具体地,网络故障监测数据是指与计算机网络相关的性能指标、故障工单、处理手段等数据,将其中与故障相关的数据进行汇总,经过数据预处理,数据预处理中需要进行数据变换和特征选择,数据变换是为了消除数据之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性;特征选择是由于汇总的数据可能无法直接反应出故障特征,因而需要构造恰当的故障特征参数来反应故障本文档来自技高网...
【技术保护点】
1.一种网络故障定位方法,其特征在于,包括:获取网络故障监测数据的历史训练样本集,所述历史训练样本集包括样本属性;计算每个所述样本属性单独分类所述历史训练样本集的区分度,将区分度最高的样本属性作为初始决策树的根结点;根据当前结点的取值,将所述历史训练样本集划分为至少一个子集,每个所述子集形成一个初始决策树的分支;对每个所述子集,递归执行上述步骤,对所述初始决策树的分支进行划分,直至分支结点达到预设终止条件为止,将所述分支结点作为所述初始决策树的叶子结点,根据预设规则设定所述初始决策树的每个所述叶子结点的故障类别。
【技术特征摘要】
1.一种网络故障定位方法,其特征在于,包括:获取网络故障监测数据的历史训练样本集,所述历史训练样本集包括样本属性;计算每个所述样本属性单独分类所述历史训练样本集的区分度,将区分度最高的样本属性作为初始决策树的根结点;根据当前结点的取值,将所述历史训练样本集划分为至少一个子集,每个所述子集形成一个初始决策树的分支;对每个所述子集,递归执行上述步骤,对所述初始决策树的分支进行划分,直至分支结点达到预设终止条件为止,将所述分支结点作为所述初始决策树的叶子结点,根据预设规则设定所述初始决策树的每个所述叶子结点的故障类别。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据预设剪枝条件,修剪所述初始决策树的分支结点。3.根据权利要求1所述的方法,其特征在于,所述预设终止条件包括:第一预设终止条件、第二预设终止条件或第三预设终止条件,其中:所述第一预设终止条件为所述分支结点所对应的剩余训练样本集属于同一故障类别;所述第二预设终止条件为所述分支结点没有剩余样本属性划分所述分支结点所对应的剩余训练样本集;所述第三预设终止条件为所述分支结点所对应的剩余训练样本集为空。4.根据权利要求3所述的方法,其特征在于,所述预设规则包括:若判断获知满足第一预设终止条件,则将所述同一故障类别标记作为所述叶子结点的故障类别;若判断获知满足第二预设条件,则将所述分支结点所对应的剩余训练样本集中最多的故障类别标记为所述叶子结点的故障类别;若判断获知满足第三预设条件,则将所述历史训练样本集中最多的故障类别标记为所述叶子结点的故障类别。5.根据权利要求1-4...
【专利技术属性】
技术研发人员:张兵战,詹晓航,戴天弓,毛平平,罗志全,郑宇,张思洁,
申请(专利权)人:中国移动通信集团广东有限公司,中国移动通信集团公司,广州衡昊数据科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。