一种基于知识和数据融合的蜂窝网络故障诊断方法技术

技术编号:35066151 阅读:14 留言:0更新日期:2022-09-28 11:24
本发明专利技术公开了一种基于知识和数据融合的蜂窝网络故障诊断方法,使用基于生成对抗网络(GAN)的方法对真实的数据集进行数据扩充,有效地平衡数据集以及减少标记数据所花费的成本;使用朴素贝叶斯法结合专家知识对网络故障数据集进行预诊断分类任务,并根据预诊断结果生成数据间的关联图,有效地解决了GCN生成的数据间拓扑关联图不精确的问题;将生成的拓扑关联图与训练数据集都输入到GCN模型中进行模型的训练,对GCN模型进行改进使之在训练中能够分别调整预诊断先验知识和训练数据集规模对GCN模型精度的影响。对GCN模型精度的影响。对GCN模型精度的影响。

【技术实现步骤摘要】
一种基于知识和数据融合的蜂窝网络故障诊断方法


[0001]本专利技术涉及通信网络
,主要涉及一种基于知识和数据融合的蜂窝网络故障诊断方法。

技术介绍

[0002]随着大数据时代的到来和深度学习等技术的快速发展,人们可以在强大算力的支持下,利用复杂的神经网络模型挖掘和提取海量数据中的关键信息。尤其在复杂的异构网络环境中,成千上万的网络节点每天会产生大量的网络运行信息。在这种网络融合和异构化的发展趋势下,故障诊断是一个关键的研究方向。故障诊断是管理任何网络的主要任务之一。
[0003]CN113709779A一种蜂窝网络故障诊断方法,公开了一种蜂窝网络故障诊断方法,将引入的权重矩阵转换为矩阵元素只有0和1的邻接矩阵;研究了异构无线网络的智能故障诊断,结合大数据处理方法分析样本间的相似特性,将已有的网络故障参数数据集转换成图结构数据,利用图卷积神经网络从图结构数据中提取特征,从而完成对于样本节点的分类任务,预测出小区的故障类型。
[0004]传统的网络故障诊断主要是通过将网络性能指标的报警信息与专家经验库对比,人工的进行故障的分析和排查,但在如今规模庞大、结构复杂的异构无线网络环境中,基于人力分析的诊断方式会占用大量的人力物力,增加维护成本,因此急切地需要一种动态、自适应的网络故障诊断方法,可以实现在复杂网络环境中对网络故障的精准检测和诊断,有效缓解故障传播造成的服务中断、网络瘫痪等危害,对无线网络的演进具有重大意义,而探索和研究异构网络中更高效、更智能的故障诊断技术势必成为未来异构网络研究的重要课题之一。
[0005]由于计算机技术的日益成熟,基于深度学习的故障诊断方法已经在故障诊断领域表现出不俗的实力。作为深度学习的分支,GCN在大数据处理方面表现出优良的性能,GCN现在已经被初步应用到了机械故障诊断领域。基于GCN的网络故障诊断方法在获取数据间的拓扑关联图时首先需要得到数据的特征属性,然后根据特征属性计算相似性从而确定数据集的拓扑关联图。事实上,这种基于谱聚类思想通过数据间的特征属性相似性形成的拓扑关联图比较粗糙且不具有实际意义,在缺乏可解释性的同时难以进一步提高GCN模型分类的精确度。

技术实现思路

[0006]专利技术目的:本专利技术提供了一种基于知识和数据融合的蜂窝网络故障诊断方法,不仅可以减少用于标记数据所花费的成本,同时可以提高故障诊断模型的精度。
[0007]技术方案:为实现上述目的,本专利技术采用的技术方案为:
[0008]一种基于知识和数据融合的蜂窝网络故障诊断方法,包括以下步骤:
[0009]步骤S1、从密集型异构蜂窝网络环境中采集带有标签的网络状态数据集,通过
XGBoost算法,从数据集中选取最优子集;具体选择方法如下:
[0010]步骤S1.1、通过XGBoost的特征重要性排序功能得出各特征的重要性分数,并做降序排序;
[0011]步骤S1.2、XGBoost根据重要性分数不断提高特征选取阈值,将分数高于该阈值的特征参数保留,反之则丢弃,进而得到不同特征组合下XGBoost模型的准确率。
[0012]步骤S1.3、对模型准确率和特征数量进行权衡,得到最优的网络特征参数子集。
[0013]步骤S2、将步骤S1中经过预处理的数据集输入生成对抗网络生成带有标签的表征不同网络状态的模拟数据集,并将其与步骤S1中经过预处理后的数据集汇总;
[0014]步骤S3、使用KPI离散化规则对步骤S1中经过XGBoost算法得到的最优特征子集进行离散化操作,使用专家知识来对KPI进行离散化操作,根据离散化后的KPI属性,通过合理划分训练数据集训练朴素贝叶斯分类器,利用训练好的朴素贝叶斯模型对剩余的数据进行分类,得到预诊断结果。使用预诊断结果集来构建拓扑关联图,即邻接矩阵;
[0015]步骤S4、根据得到的拓扑关联图,在原有的GCN模型的基础上对GCN进行改进,利用改进后的GCN得到最终的网络故障诊断结果。
[0016]进一步地,所述步骤S2中基于生成对抗网络生成模拟数据集的具体步骤为:
[0017]步骤S2.1、所选生成对抗网络模型为WGAN

GP,优化目标具体为:
[0018][0019]D(s)是一个标量,代表s来自于真实数据分布而不是p
g
的概率。其中代表生成器产生的数据服从的分布,是真实数据服从的分布,在这里指不同网络状态下的数据分布。是对真实数据与生成数据组成的整个数据集做采样得来的,利用在[0,1]之间服从均匀分布的∈,然后在和的连线上随机插值采样,得到的连线上随机插值采样,得到作为惩罚项,在惩罚项中希望越接近1,惩罚就越少,λ为惩罚参数。
[0020]步骤S2.2、基于WGAN

GP生成模拟数据集的具体步骤为:
[0021](1)采用两个全连接神经网络分别构成生成器和判别器。
[0022](2)训练生成器,使生成器对异构无线网络环境中采集少量带有标签的不同网络状态数据集分别进行模仿,生成模拟数据。
[0023](3)将从异构无线网络环境中采集少量带有标签的网络状态数据集与生成器产生的模拟数据分别输入到判别器,进行判别器的训练。
[0024](4)对生成器和判别器进行交替迭代训练,最终得到平衡,模型收敛。
[0025](5)生成带有标签的表征不同网络状态的模拟数据集。
[0026]进一步地,所述步骤S3中基于朴素贝叶斯生成预诊断结果,并得到邻接矩阵的具体步骤为:
[0027]步骤S3.1、根据离散化后的KPI属性,通过合理规划训练数据集训练朴素贝叶斯分类器;
[0028]步骤S3.2、利用训练好的朴素贝叶斯模型结合专家知识对剩余的数据进行分类,得到预诊断结果标签集其中N表示经WGAN

GP扩容后数据集的总样本数。具体分类步骤如下:
[0029]选择使得后验概率最大的那个网络故障类别作为当前网络所遭受的网络故障h
*
(X),即:
[0030][0031]为了避免下溢错误,将上式转换为对数形式:
[0032][0033]本章通过拉普拉斯平滑方法来估算先验概率P(y
i
)和条件概率P(x
j
|y
i
),即:
[0034][0035][0036]其中,D
t
表示训练数据集所包含的样本总数;是训练集中处于网络故障y
i
情况下的样本总数;表示训练集中处于网络故障y
i
情况下并且第j个KPI参数取值为x
j
的样本总数;L是之前定义的网络故障类别总数;S
j
是第j个KPI的所有可能的取值数。
[0037]步骤S3.2、基于预诊断结果集来构建拓扑关联图,即邻接矩阵A,具体内容如下:
[0038]在预诊断结果集中,被诊断为具有相同网络故障类型的数据在图中相互连接,而本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识和数据融合的蜂窝网络故障诊断方法,其特征在于,包括以下步骤:步骤S1、从密集型异构蜂窝网络环境中采集带有标签的网络状态数据集,通过XGBoost算法,从数据集中选取最优子集;步骤S2、将步骤S1中经过预处理的带有标签的网络状态数据集输入生成对抗网络中,得到带有标签的表征不同网络状态的模拟数据集,并将其与步骤S1中经过预处理后的数据集汇总;步骤S3、使用KPI离散化规则对步骤S1中经过XGBoost算法得到的最优特征子集进行离散化操作,根据离散化后的KPI属性,通过合理划分训练数据集训练朴素贝叶斯分类器,利用训练好的朴素贝叶斯模型对剩余的数据进行分类,得到预诊断结果;使用预诊断结果集来构建拓扑关联图,即邻接矩阵;步骤S4、根据得到的拓扑关联图,在原有的GCN模型的基础上对GCN进行改进,利用改进后的GCN得到最终的网络故障诊断结果。2.根据权利要求1所述的一种基于知识和数据融合的蜂窝网络故障诊断方法,其特征在于,所述步骤S1中通过XGBoost算法,从数据集中选取最优子集的具体方法如下:步骤S1.1、通过XGBoost的特征重要性排序功能得出各特征的重要性分数,并做降序排序;步骤S1.2、XGBoost根据重要性分数不断提高特征选取阈值,将分数高于该阈值的特征参数保留,反之则丢弃,进而得到不同特征组合下XGBoost模型的准确率;步骤S1.3、对模型准确率和特征数量进行权衡,得到最优的网络特征参数子集。3.根据权利要求1所述的一种基于知识和数据融合的蜂窝网络故障诊断方法,其特征在于,所述步骤S2中得到带有标签的表征不同网络状态的模拟数据集具体步骤为:步骤S2.1、所选生成对抗网络模型为WGAN

GP,优化目标具体为:D(s)是一个标量,代表s来自于真实数据分布;其中代表生成器产生的数据服从的分布,是真实数据服从的分布;是对真实数据与生成数据组成的整个数据集做采样得来的,利用在[0,1]之间服从均匀分布的∈,然后在和的连线上随机插值采样,得到作为惩罚项,在惩罚项中越接近1,惩罚就越少,λ为惩罚参数;步骤S2.2、基于WGAN

GP生成模拟数据集的具体步骤为:(1)采用两个全连接神经网络分别构成生成器和判别器;(2)训练生成器,使生成器对异构无线网络环境中采集带有标签的不同网络状态数据集分别进行模仿,生成模拟数据;(3)将从异构无线网络环境中采集带有标签的网络状态数据集与生成器产生的模拟数据分别输入到判别器,进行判别器的训练;(4)对生成器和判别器进行交替迭代训练,最终得到平衡,模型收敛;
(5)生成带有标签的表征不同网络状态的模拟数据集。4.根据权利要求1所述的一种基于知识和数据融合的蜂窝网络故障诊断方法,其特征在于,所述步骤S3的得到预诊断结果的具体步骤为:步骤S3.1、根据离散化后的KPI属性,通过训练数据集训练朴素贝叶斯分类器;步骤S3.2、基于规则的网络故障诊断方法,假设网络故障集合C={C1,C2,...,C
M
,UN}中前M个记录表示历史数据库中已存储的M种网络故障,UN表示未识别出的网络故障,S=[KPI1,KPI2,...,KPI
n
]是根据各KPI的值得出的用以描述网络状态的特征属性向量;故障诊断的过程如下式所示:IF KPI1>TH
1 AND KPI2<TH2...AND KPI
n
>TH
n
,THEN D(cell)=C
i...

【专利技术属性】
技术研发人员:朱晓荣潘庆亚吴铭骁贺楚闳
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1