一种用于用户稀疏通信系统的故障确认方法技术方案

技术编号:37589450 阅读:11 留言:0更新日期:2023-05-18 11:15
本发明专利技术提供一种用于用户稀疏通信系统的故障确认方法,利用发生故障网络和正常运行网络KPIs之间的相似度,将网络进行分区,仅提取各个分区内与网络故障确认最相关的网络关键性能指标作为后续机器学习的训练序列,从而降低本方法对分区用户数目的要求,减轻用户分布不均衡对无线通信系统故障确认的不良影响。因根据数据相似度特征提取过程中存在随机抽样,因此稳定性低,但由于对区域内用户数目要求低,在面对网络用户分布不均的情况下,性能表现好。本方法降低对分区用户数目的要求,减轻用户分布不均衡对无线通信系统故障确认的不良影响。良影响。良影响。

【技术实现步骤摘要】
一种用于用户稀疏通信系统的故障确认方法


[0001]本专利技术涉及无线通信领域,具体为一种基于不同特征提取方法的代价敏感支持向量机集成学习的通信系统故障确认方法。

技术介绍

[0002]在无线通信网络的运行维护过程中,不可避免地会出现关键性能指标(Key Performance Indicators,KPIs)恶化的问题,随着网络的异构化和复杂化,技术人员需要在大量观测变量中寻找导致通信系统性能下降的原因,使得手动对网络进行故障确认变得难以完成。目前针对网络故障确认问题,现有的方法为使用机器学习方法来解决手动对网络进行故障确认的困难。在机器学习于故障确认问题的方法中,往往考虑理想的用户分布情况。然而在实际无线通信网络中,由于地形地貌、城镇建设等因素影响,用户终端的分布往往具有稀疏性,具体体现在用户分布密度低和用户空间分布不均,这使得本就困难的故障确定变得更加具有挑战性。现有的方法对用户稀疏性的挑战,都集中在应对用户分布密度低的问题上,而忽虑了对用户分布不均情景的考量,这很明显是不合理的。
[0003]因此,如何在实际无线通信网络用户分布不均衡的挑战下,高效率地寻找通信系统性能下降的原因成为亟待解决的技术问题,也是无线通信系统故障确认的任务。

技术实现思路

[0004]技术问题:本专利技术提供一种针对用户分布不均衡无线通信系统的故障确认方法,本方法利用发生故障网络和正常运行网络KPIs之间的相似度,将网络进行分区,仅提取各个分区内与网络故障确认最相关的网络关键性能指标作为后续机器学习的训练序列,从而降低本方法对分区用户数目的要求,减轻用户分布不均衡对无线通信系统故障确认的不良影响。
[0005]技术方案:本专利技术是一种用于用户稀疏通信系统的故障确认方法,该方法首先将基站覆盖区域均匀划为六个分区,对每个分区使用马氏距离MD来对发生故障网络和正常运行网络之间的网络关键性能指标进行数据相似度衡量;马氏距离越大,数据相似度越小,提取各个分区内相似度最小的网络关键性能指标作为机器学习的训练序列,进行特征提取,然后,对原始发生故障网络关键性能指标使用主成分分析进行特征提取;而后,对两种不同方法特征提取后的序列及其对应标签,组合成两个训练集,分别进行机器学习训练;在机器学习方法方面,选择代价敏感支持向量机,它将不同错误根因分类代价分配给属于不同严重程度的故障样本,故障严重程度越高,确认分类错误代价相对更大,使得更合理地关注于不同严重程度的故障根因分类情况;最后,通过两个支持向量机集成学习完成故障确认,获得输出稳定且判断准确的故障根因分类器。
[0006]本专利技术中使用的网络关键性能指标包括信号干扰加噪声比(Signal

to

interference

plus

noise Ratios,SINR)和参考信号接收功率(Reference Signal Received Power,RSRP)。
[0007]本方法考虑网络中可能发生的以下网络故障类型:天线倾角过小(Excessive uptilt,EU),天线倾角过大(Excessive downtilt,ED)和过度降低功率(Excessive reduced power,ERP)。
[0008]本专利技术具体包括如下步骤:
[0009]第一步:生成网络KPIs,
[0010]通过仿真生成M组网络发生各种故障时网络I个用户的参考信号接收功率RSRP和信号干扰加噪声比SINR,并将每组数据组成的集合定义为网络KPIs向量,其中第m∈{1,2,...,M}个网络KPIs向量为x
m
=[RSRP1,SINR1,...,RSRP
i
,SINR
i
,...,RSP
I
,SINR
I
],i∈{1,2,...,I},其中RSRP
i
和SINR
i
是第i个用户的RSRP和SINR;另仿真生成M_Normal组网络正常运行时I个用户的RSRP和SINR,将每组数据组成集合,其中第m_Normal∈{1,...,M_Normal}个网络KPIs向量为其中和是网络正常运行时第i个用户的RSRP和SINR;
[0011]第二步:分区数据相似度计算,并进行特征提取,组成训练集合,包括:
[0012]对任意矢量p=(p1,p2,...,p
l
)
T
和q=(q1,q2,...,q
l
)
T
,其马氏距离的定义如下:
[0013][0014]cov(p,q)=E(p
T
q)

E(p)E(q)
[0015]其中d
M
(
·
)为马氏距离,E(
·
)和(
·
)
T
分别表示求期望和转置,cov(p,q)为p和q的协方差;设基站覆盖区域内含N
section
个扇区,对各个扇区间的用户数据进行对比,提取与故障确认最相关的扇区数据作为机器学习训练序列;同时,为应对用户稀疏性挑战,对每个扇区均匀分为分区,提取分区内用户的特征,使得提取特征时对用户数目要求更小;需要将基站覆盖区域再划分为N
setnurn
个分区并提取特征,至少需要对每个扇区划分为两个,即N
setnum
≥2
·
N
section
,考虑到划分过多区域,会导致提取特征过多,提取效率过低,取N
setnum
=2
·
N
section

[0016]构建机器学习的训练集时,将x
m_1
作为特征向量,并将第m个KPIs向量对应的故障类型作为标签,组成一组训练样本,训练集总样本空间为
[0017]X
MD
={(x
1_1
,actual1),(x
2_1
,actual1),...,(x
M_1
,actua
l
1)}
[0018]其中actual
m
∈{1,2,3}为第m个KPIs向量对应的故障类型,当actual
m
=1时,此训练样本为EU故障;当actual
m
=2时,此训练样本为ED故障;否则,此训练样本为ERP故障;
[0019]络故障类型包括:天线倾角过小EU,天线倾角过大ED,和过度降低功率ERP;
[0020]第三步:主成分分析特征提取,组成训练集合,包括如下流程:
[0021]主成分分析PCA是最常与支持向量机连用的数据降维方法,
[0022]将所有x
m
组成矩阵X:
[0023][0024]对矩阵X去中心化处理,即每列进行减去这一列本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于用户稀疏通信系统的故障确认方法,其特征在于,该方法首先将基站覆盖区域均匀划为六个分区,对每个分区使用马氏距离MD来对发生故障网络和正常运行网络之间的网络关键性能指标进行数据相似度衡量;马氏距离越大,数据相似度越小,提取各个分区内相似度最小的网络关键性能指标作为机器学习的训练序列,进行特征提取,然后,对原始发生故障网络关键性能指标使用主成分分析进行特征提取;而后,对两种不同方法特征提取后的序列及其对应标签,组合成两个训练集,分别进行机器学习训练;在机器学习方法方面,选择代价敏感支持向量机,它将不同错误根因分类代价分配给属于不同严重程度的故障样本,故障严重程度越高,确认分类错误代价相对更大,使得更合理地关注于不同严重程度的故障根因分类情况;最后,通过两个支持向量机集成学习完成故障确认,获得输出稳定且判断准确的故障根因分类器。2.根据权利要求1所述的一种用于用户稀疏通信系统的故障确认方法,其特征在于,该方法具体包括如下步骤:第一步:生成网络KPIs,通过仿真生成M组网络发生各种故障时网络I个用户的参考信号接收功率RSRP和信号干扰加噪声比SINR,并将每组数据组成的集合定义为网络KPIs向量,其中第m∈{1,2,...,M}个网络KPIs向量为x
m
=[RSRP1,SINR1,...,RSRP
i
,SINR
i
,...,RSRP
I
,SINR
I
],i∈{1,2,...,},其中RSRP
i
和SINR
i
是第i个用户的RSRP和SINR;另仿真生成M_Normal组网络正常运行时I个用户的RSRP和SINR,将每组数据组成集合,其中第m_Normal∈{1,...,M_Normal}个网络KPIs向量为其中RSRP
iNormal
和是网络正常运行时第i个用户的RSRP和SINR;第二步:分区数据相似度计算,并进行特征提取,组成训练集合,包括:对任意矢量p=(p1,p2,...,p
l
)
T
和q=(q1,q2,...,q
l
)
T
,其马氏距离的定义如下:cov(p,q)=E(p
T
q)

E(p)E(q)其中d
M
(
·
)为马氏距离,E(
·
)和(
·
)
T
分别表示求期望和转置,cov(p,q)为p和q的协方差;设基站覆盖区域内含N
section
个扇区,对各个扇区间的用户数据进行对比,提取与故障确认最相关的扇区数据作为机器学习训练序列;同时,为应对用户稀疏性挑战,对每个扇区均匀分为分区,提取分区内用户的特征,使得提取特征时对用户数目要求更小;需要将基站覆盖区域再划分为N
setnum
个分区并提取特征,至少需要对每个扇区划分为两个,即N
setnum
≥2
·
N
section
,考虑到划分过多区域,会导致提取特征过多,提取效率过低,取N
setnum
=2
·
N
section
;构建机器学习的训练集时,将x
m_1
作为特征向量,并将第m个KPIs向量对应的故障类型作为标签,组成一组训练样本,训练集总样本空间为X
MD
={(x
1_1
,actual1),(x
2_1
,actual1),...,(x
M_1
,actual1)}其中actual
m
∈{1,2,3}为第m个KPIs向量对应的故障类型,当actual
m
=1时,此训练样本为EU故障;当actual
m
=2时,此训练样本为ED故障;否则,此训练样本为ERP故障;络故障类型包括:天线倾角过小EU,天线倾角过大ED,和过度降低功率ERP;第三步:主成分分析特征提取,组成训练集合,包括如下流程:主成分分析PCA是最常与支持向量机连用的数据降维方法,
其中Cost(k,j)表示第k类分类为第j类的代价,k,
j
∈{1,2,3,4,5,6,7,8,9};现有的多种超参数优化方法,可用于c1,c2,c3的参数寻优,贝叶斯优化通过预测最可能的最佳c1,c2,c3作为下一次计算的值,循环迭代N
BY
次,最终找到最优的c
1*
,c
2*
,c
3*
;通常默认迭代30次,既不需要耗费过多时间,又可以提升优化效果,即N
BY
=30;将c
1*
,c
2*
,c
3*
代入上式从而获得最优代价矩阵Cost
*
,使得分类器性能最优;求得w
k*
、b
k*
和Cost
*
后,使用代价敏感支持向量机对样本集X
MD
中每一个序列x
m_1
进行分类,x
m_1
判定为class
predicted
∈{1,2,3,4,5,6,7,8,9},当且仅当:其中P(predictedclass=j|x
m_1
)表示当对x
m_1
进行分类判断时,判断为第j类的概率,需要将支持向量机输出值w
j*
·
x
m_1
+b
j*
映射为概率值得到,使用现有方法到达该目的;将九分类问题映射为三分类问题,如果class
predicted
∈{1,2,3},则最终判定为EU故障,class
predicted
=1;如果class
predicted
∈{4,5,6},则最终判定为ED故障,class
predicted
=2;如果class
predicted
∈{7,8,9},则最终判定为ERP故障,class
predicted
=3,使用F
actual

score作为性能指标,F
actual

score越大,系统性能越好,其定义如下:score越大,系统性能越好,其定义如下:score越大,系统性能越好,其定义如下:其中n
actual,predicted
表示代价敏感支持向量机将actual∈{1,2,3}类判定到predicted∈{1,2,3}类的样本数,n
actual,actual
表示代价敏感支持向量机将actual类判定到actual类的样本数;第五步:基于集成学习的分类判决训练集X
MD
生成过程中存在随机抽样,因此稳定性低,但由于对区域内用户数目要求低,在面对网络用户分布不均的情况下,性能表现好;训练集X
PCA
成过程中不存在随机抽样,因此稳定性高,需要用户数目多,在面对网络用户分布不均的情况下,性能表现差;因此采用
集成学习,获得稳定且高效的分类器;具体步骤如下:(1).收集待确认故障网络的网络关键指标KPIs x
new
=[RSRP
1_new
,SINR
1_new
,...,RSRP
i_new
,SINR
i_new
,...,RSRP
I_new
,SINR
I_new
],i∈{1,2,...,I};其中RSRP
i_new
和SINR
i_new
是待故障确认网络中第i个用户的RSRP和SINR;(2).将x
new
分别代入第二步、第三步,进行特征提取得到x
new_1
、x
new_2
;(3).分别代入步骤四求解的代价敏感支持向量机,输出P(predictedclass=j|x
new_1
)和P(predictedclass=j|x
new_2
);(4).采用集成学习,对x
new
进行分类判断,x
m_1
判定为class
predicted_new
∈{1,2,3,4,5,6,7,8,9},当且仅当:如果class
predicted_new
∈{1,2,3},最终判定为EU故障;如果class
predicted_new
∈{4,5,6},则最终判定为ED故障;如果class
predicted_new
∈{7,8,9},...

【专利技术属性】
技术研发人员:潘志文王琦刘楠尤肖虎
申请(专利权)人:网络通信与安全紫金山实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1