基于集成学习和SMOTE的蜂窝网络故障诊断系统技术方案

技术编号:19242524 阅读:21 留言:0更新日期:2018-10-24 05:16
本发明专利技术公开了一种在蜂窝网络下,当网络出现故障时,如何根据已有的网络参数信息,快速地对出现的故障进行诊断,找到出错原因的方法。本发明专利技术是在网络出现故障,并且已经被探测到的情况下进行诊断。本发明专利技术通过对已有历史故障参数数据集进行分析,使用基于AdaBoost的集成学习方法训练得到一个稳定的故障诊断系统,并以此系统为依据,将获取到的未知故障原因的故障用例作为该系统的输入,系统根据故障用例的相关参数对故障进行分类,分类的结果即是故障出现的病因,以此达到故障诊断的目的。此外,系统还使用SMOTE(Synthetic minority over‑sampling technique)对训练样本进行过采样,以提高对故障用例的诊断精度。

【技术实现步骤摘要】
基于集成学习和SMOTE的蜂窝网络故障诊断系统
本专利技术公开了一种在蜂窝网络下,当网络出现故障时,如何根据已有的网络参数信息,快速地对出现的故障进行诊断,找到出错原因的方法。用于在蜂窝网络出现故障时快速找到故障原因,为故障恢复提供参考。属于蜂窝网络故障诊断领域。
技术介绍
近年来,一些对带宽要求较高的应用的激增,例如视频流和多媒体文件共享,对未来的无线蜂窝系统中的用户行为将会产生巨大影响,特别是随着无数智能于持设备的出现,用户对带宽的需求正在发生空前的增长。用户行为体现的这一趋势,给蜂窝系统的容量需求、服务质量和能源效率带来巨大压力。此外,随着各种无线接入技术的应用,例如GSM、UMTS、LTE等,多种网络结构的并存,例如宏蜂窝、毫微蜂窝以及微微蜂窝,未来的网络将会变得越来越复杂,呈现出明显的异构性。一方面,由于各种技术、服务数量、蜂窝类型的增长,网络的部署和运营变得越来越复杂;另一方面,用户不愿意为改善的网络服务付以相应比例的费用。所以,网路运营商必须面临提供高质量服务的同时减少CAPEX(capitalexpenditure,资本费用)和OPEX(operationalexpenditure,运营费用)的挑战。SON(self-organizationnetwork)通过自动化网络各阶段的功能最终达到网络自我管理的目的,减少了人工对网络的干预,降低了网咯的资本费用和运营费用。最终能够在提高网络覆盖,网络容量和服务质量的同时降低投入。总的来说,自组织是未来无线蜂窝网络中唯一能够以高性价比的方式达到最佳性能的方法,因此LTE标准化组织不再把自组织仅仅作为未来无线网络的可选特征,而是作为必然条件。自组织网络按功能可以分为三大块:自配置、自优化以及自治愈。自配置是指在新建网络或新增网络设备后,能够实现设备从预运行状态通过自动配置进入正常运行状态,包括对网络设备的即插即用。自配置之后网络进行运行状态,自优化和自治愈功能开始执行,这两个功能都是以网络的测量信息数据的监测分析为基础的。自优化功能根据测量的数据,对网络从覆盖、容最、干扰、资源分配等角度进行优化。自治愈技术首先是能够快速准确的检测网络中的故障,然后能够自动迅速的对网络中的故障进行恢复,确保受网络故障影响的用户能够进行连续高质量的通信。故障主要是指网络中出现影响系统所提供服务、功能、及性能的情况。例如:掉线、访问失败、拥塞等。故障可能是由多种原因造成的,例如收发失序、干扰(恶意、非恶意)、错误参数设置、以及入侵等。故障诊断作为自治愈的核心功能,其研究难点主要有三个:一是在成千上万的KPI值和告警中找出和故障识别相关的部分;二是故障的原因和KPI值没有直接必然的联系,对于同一故障原因不同蜂窝或者同一蜂窝不同时间的KPI值不尽相同。虽然很多现有技术应用于故障诊断,但是效果并不尽如人意。
技术实现思路
本专利技术主要解决蜂窝网络中,通过网络参数对网络故障进行诊断的问题,主要包括以下内容:1)SMOTE过采样。蜂窝网络的故障诊断是在蜂窝网络的故障探测之后进行,故障探测负责在网络中根据网络参数等信息探测性能严重下降或者出现故障的蜂窝,而故障探测的结果不可避免地会出现错误,即将正常运行的蜂窝探测为故障蜂窝。所以,为了提高真个自治愈系统的鲁棒性和可用性,本专利技术设计的故障诊断系统不仅能够诊断出故障蜂窝的病因,也能够诊断出该蜂窝是否是正常蜂窝,从而不会导致后续的恢复措施错误地用于正常蜂窝。故障诊断的目的是找出病因,以便在后续的故障恢复步骤中采取有诊断的措施,所以故障诊断的实质就是进行分类,将存在故障的蜂窝划分为不同的类,将正常蜂窝分到正常类中去。因此,在包含正常数据和故障数据的训练集上训练分类模型为系统设计的重点。传统的分类算法的设计都是以平衡的训练数据集为基础,而在本系统中,由于故障在蜂窝网络中很少发生,而且相关技术人员在解决的故障后很少对相关情况进行记录,所以历史故障数据很难获取,这就导致了在训练集中的正常训练数据远远多于故障数据,数据集是不平衡的。在不平衡的数据集上训练分类模型,会导致分类模型偏向于大多数类的分类,而对少数类的分类不是那么准确,而少数类正是故障诊断关注的故障类。在蜂窝网络的故障诊断中,对正常蜂窝的误诊只需要二次确认就可以消除误诊带来的影响,而对收障蜂窝的误诊会导致故障难以恢复,持续对蜂窝造成影响,最终导致用户体验和网络容量的降低,其误诊代价远远超过前者。所以,为了获得更高的系统精度和较低的误诊代价,本专利技术将SMOTE过采样技术用于训练数据集,大大提高了诊断精度。2)训练分类模型。故障诊断的实质是故障分类,因此,为了取得较为精确的故障诊断结果,首先要训练一个较好的分类模型。在机器学习领域,很多传统的分类方法被用来进行故障诊断,如支持向量机SVM(SupportVectorMachine)、决策树(DecisionTree)、K-近邻(K-Nearest-Neighbor)等等。集成学习的思路是在对新的实例进行分类的时候,把若干个单个分类器集成起来,通过对多个分类器的分类结果进行某种组合来决定最终的分类,以取得比单个分类器更好的性能。如果把单个分类器比作一个决策者的话,集成学习的方法就相当于多个决策者共同进行一项决策。以本专利技术的系统为例,集成学习的模型如图2所示。3)对未知故障进行诊断。系统设计的最终目的就是用来进行故障诊断,在分类模型训练完成后,就可以将未知病因的故障KPI向量作为分类模型的输入,而分类模型的输出便作为故障诊断的结果,以此达到收障诊断的目的。因为本专利技术的故障系统基于集成学习方法,所以,对于每一个输入的KPI向量,每个分类器都要进行诊断,最终的诊断结果是对所有分类器结果的整合。附图说明图1为本专利技术提出的系统结构图;图2为集成学习模型图;图3位SMOTE过采样示意图。具体实施方式以下结合附图和具体实例对本专利技术做具体的介绍。本专利技术通过对已有历史故障参数数据集进行分析,使用基于AdaBoost的集成学习方法训练得到一个稳定的故障诊断系统,并以此系统为依据,将获取到的未知故障原因的故障用例作为该系统的输入,系统根据故障用例的相关参数对故障进行分类,分类的结果即是故障出现的病因,以此达到故障诊断的目的。良好的分类效果使得故障诊断的结果更加精确。最后,本专利技术的设计保证了整个机制的真实性。具体实施过程如下:步骤1:SMOTE过采样SMOTE过采样技术是一种对随机过采样的改进技术,通过人工合成两个相邻数据的方法来产生新的样本数据,相邻数据通过K-近邻方法选出。例如,对于数据样本Xi,通过K-近邻算法选出最为相近的K个邻居数据样本,从K个邻居中随机选择一个邻居Xj,计算Xi和Xj之间的差值,然后通过以下公式获得新的样本数据Xn=Xi+rand(0,1)*(Xi-Xj)步骤2:分类模型训练AdaBoost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合本文档来自技高网
...

【技术保护点】
1.基于集成学习和SMOTE的蜂窝网络故障诊断系统,其特征在于:1)本系统是AdaBoost在蜂窝网络故障诊断领域的首次应用;2)本系统是SMOTE首次用来处理蜂窝网络环境下的不平衡数据集;3)AdaBoost集成学习方法以决策树桩作为基分类器;4)将二分类算法扩展到多分类中。

【技术特征摘要】
1.基于集成学习和SMOTE的蜂窝网络故障诊断系统,其特征在于:1)本系统是AdaBoost在蜂窝网络故障诊断领域的首次应用;2)本系统是SMOTE首次用来处理蜂窝网络环境下的不平衡数据集;3)AdaBoost集成学习方法以决策树桩作为基分类器;4)将二分类算法扩展到多分类中。2.如权利要求1所述的基于集成学习和SMOTE的蜂窝网络故障诊断系统,其特征在于本系统是AdaBoost集成学习方法在蜂窝网络故障诊断领域的首次应用,近几年提出了许多蜂窝网络的故障诊断方法,包括贝叶斯网络、模糊算法、遗传算法等,但是利用AdaBoost集成学习方法进行故障诊断还是首次提出,本系统通过对已有历史故障参数数据集进行分析,使用AdaBoost集成学习方法训练得到一个稳定的故障诊断系统,并以此系统为依据,将获取到的未知故障原因的故障用例作为该系统的输入,系统根据故障用例的相关参数对故障进行分类,分类的结果即是故障出现的病因,以此达到故障诊断的目的。3.如权利要求1所述的基基于集成学习和SMOTE的蜂窝网络故障诊断系统,其特征在于首次采用SMOTE处理不平衡数据集,有效的提高了故障诊断的精度,降低了误诊的代价。对于数据样本Xi,通过K-近邻算法选出最为相近的K个邻居数据样本,从K个邻居中随机选择个邻居Xi,计算Xi和Xj之间的差值,然后通过以下公式获得新的样本数据Xn=Xi+rand...

【专利技术属性】
技术研发人员:钱红燕孙梦云朱琨
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1