当前位置: 首页 > 专利查询>云南大学专利>正文

基于贝叶斯网的移动基站投诉根因分析方法技术

技术编号:37795111 阅读:8 留言:0更新日期:2023-06-09 09:25
本发明专利技术公开了一种基于贝叶斯网的移动基站投诉根因分析方法,将运维变量和用户投诉变量作为节点,根据描述业务知识的关联规则构建贝叶斯网,然后生成贝叶斯网中各个变量的嵌入向量,基于变量嵌入向量进行概率推理,得到各变量发生故障的条件概率,最后计算出各个运维变量对于故障的贡献度,将贡献度较大的运维变量作为移动基站投诉根因集合。本发明专利技术将运维变量和用户投诉变量作为节点构建贝叶斯网,基于贝叶斯网推断得到各个运维变量对于故障的贡献度,进而得到准确率高且具有良好可解释性的移动基站投诉根因集合。移动基站投诉根因集合。

【技术实现步骤摘要】
基于贝叶斯网的移动基站投诉根因分析方法


[0001]本专利技术属于移动基站
,更为具体地讲,涉及一种基于贝叶斯网的移动基站投诉根因分析方法。

技术介绍

[0002]移动基站投诉根因分析旨在发现用户投诉问题的原因,定位并解决移动基站运维中存在的问题,为移动基站运维人员提供具有针对性的溯源结果。然而,基站运维数据涉及的变量(称为运维变量)多,且变量之间存在依赖关系,仅少数变量是故障发生的根本原因。传统的基站故障定位,主要依赖于运维人员的工作经验和专业领域知识,当面对海量且复杂的运维数据时,其准确性、运维效率和人工成本已无法满足当前新基建快速推进的需求,也无法满足人们对基站故障精准诊断和故障快速处理日益迫切的需要。如何使用计算机技术、数据分析和知识推理方法,对规模庞大且变量间存在依赖关系的基站运维数据进行根因分析,成为了目前亟待解决的问题,具有重要的研究价值和现实意义。
[0003]公知的根因分析方法中具有代表性的是神经网络方法,但是该方法未考虑运维变量之间的依赖关系,使得根因分析结果缺乏鲁棒性。例如,刘发贵等(<专利202210077012.9>,2022)对云服务器中的时序指标数据进行预处理和划分,在划分后的数据集上训练无监督异常检测模型、进行异常检测,进而得到异常概率、确定异常数据点、标记异常区间,并通过特征选择方法计算异常区间中的多个变量的权重,根据权重大小得到影响异常的指标。武萌等(<专利202111440027.9>,2021)从检测数据中提取特征,将特征输入到监督异常检测器、半监督异常检测器和无监督异常检测器中,发现设备异常后,再将集成异常检测器与根因分析相结合,给出异常数据的定位方法、获得根因分析结果,为决策和管理提供依据。
[0004]概率图模型是能表达不确定性依赖关系的图模型,贝叶斯网(Bayesian Network,BN)作为一种支持不确定性知识表示和推理的重要概率图模型,是以随机变量为节点的有向无环图(Directed Acyclic Graph,DAG),且每个节点有一张条件概率表(Conditional Probability Table,CPT),能定量描述变量间相互影响的程度。直观地,运维变量之间存在的相互依赖关系,可用BN来进行定性和定量描述,并可通过概率推理算法对存在的依赖关系进行推断分析。公知的基于BN的运维数据挖掘和根因分析方法,能很好地表达运维变量之间的依赖关系及其不确定性。例如,向超等(<专利202011435334.3>,2020)使用告警数据构造训练集、并结合Spark引擎构造告警BN,并据此实时告警之间的关联关系,从而定位根源告警。杨睿等(<信息技术>,2022)对工业告警数据进行关系建模生成BN,结合异常告警信息使用向前迭代的路径推理算法,推理出异常路径集,以异常路径集结合证据集,推理出异常的根本原因和路径。然而,面对大规模运维变量集合时,这些公知的方法存在多次重复计算、带来效率低等问题。
[0005]移动基站运维变量之间不仅存在相互依赖的关系,且变量之间还存在潜在的因果关系。相比与依赖关系,因果关系严格区分了原因变量和结果变量,是依赖关系的进一步深化,但公知的利用BN对运维数据进行根因分析的方法未考虑变量之间的潜在因果关系,会
导致根因分析的结果缺乏准确性和可解释性。

技术实现思路

[0006]本专利技术的目的在于克服现有技术的不足,提供一种基于贝叶斯网的移动基站投诉根因分析方法,将运维变量和用户投诉变量作为节点构建贝叶斯网,基于贝叶斯网推断得到各个运维变量对于故障的贡献度,进而得到准确率高且具有良好可解释性的移动基站投诉根因集合。
[0007]为了实现上述专利技术目的,本专利技术基于贝叶斯网的移动基站投诉根因分析方法包括以下步骤:
[0008]S1:根据描述业务知识的关联规则构建贝叶斯网,具体方法如下:
[0009]S1.1:针对当前用户投诉信息,定位到用户所在区域对应移动基站,获取该移动基站与当前用户投诉问题相同的N条历史投诉根因分析记录,历史投诉根因分析记录包括投诉问题、投诉发生所在区域的移动基站异常运维变量和取值;基于历史投诉根因分析记录,建立变量集Q=(x1,

,x
i
,

,x
N
,x
N+1
),其中x
n
表示第n个运维变量,其对应的可能取值数量记为M
n
,n=1,2,

,N,x
N+1
表示用户投诉变量,其取值数量M
N+1
=2,分别为0和1,x
N+1
=1表示用户投诉,x
N+1
=0表示用户未投诉;
[0010]S1.2:采用下式计算变量集Q中任意两个变量x
i
和x
j
之间的支持度sup(x
i
,x
j
):
[0011][0012]其中,i,j=1,2,

,N且i≠j,#(x
i
,x
j
)表示变量x
i
和x
j
在历史投诉根因分析记录中同时出现的次数;
[0013]设定最小支持度sup
min
,0≤sup
min
≤1,通过检索找到所有满足sup(x
i
,x
j
)≥sup
min
的变量对,记筛选出的变量对数量为W,生成频繁二项集V=(v1,

,v
w
,

,v
W
),其中v
w
表示基于支持度筛选出的第w个变量对基于支持度筛选出的第w个变量对分别表示第w个变量对中的两个变量,w=1,2,

,W,1≤i
w
,j
w
≤N且i
w
≠j
w

[0014]S1.3:设定最小置信度c
min
,0≤c
min
≤1,采用下式计算频繁二项集V中每个变量对的置信度
[0015][0016]其中,表示变量和在历史投诉根因分析记录中同时出现的次数,表示历史投诉根因分析记录中变量出现的次数;
[0017]然后通过检索找到所有满足的变量对,并将筛选出的变量对按照置信度从大到小进行排列,记筛选出的变量对数量为T,第t个变量对为置信度从大到小进行排列,记筛选出的变量对数量为T,第t个变量对为分别表示第t个变量对中的两个变量,r=1,2,

,T,1≤i
t
,j
t
≤N且i
t
≠j
t
;根据变量对
生成变量强关联规则构成变量强关本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种于贝叶斯网的移动基站投诉根因分析方法,其特征在于,包括以下步骤:S1:根据描述业务知识的关联规则构建贝叶斯网,具体方法如下:S1.1:针对当前用户投诉信息,定位到用户所在区域对应移动基站,获取该移动基站与当前用户投诉问题相同的N条历史投诉根因分析记录,历史投诉根因分析记录包括投诉问题、投诉发生所在区域的移动基站异常运维变量和取值;基于历史投诉根因分析记录,建立变量集Q=(x1,

,x
i
,

,x
N
,x
N+1
),其中x
n
表示第n个运维变量,其对应的可能取值数量记为M
n
,n=1,2,

,N,x
N+1
表示用户投诉变量,其取值数量M
N+1
=2,分别为0和1,x
N+1
=1表示用户投诉,x
N+1
=0表示用户未投诉;S1.2:采用下式计算变量集Q中任意两个变量x
i
和x
j
之间的支持度sup(x
i
,x
j
):其中,i,j=1,2,

,N且i≠j,#(x
i
,x
j
)表示变量x
i
和x
j
在历史投诉根因分析记录中同时出现的次数;设定最小支持度sup
min
,0≤sup
min
≤1,通过检索找到所有满足sup(x
i
,x
j
)≥sup
min
的变量对,记筛选出的变量对数量为W,生成频繁二项集V=(v1,

,v
w
,

,v
W
),其中v
w
表示基于支持度筛选出的第w个变量对支持度筛选出的第w个变量对支持度筛选出的第w个变量对分别表示第w个变量对中的两个变量,w=1,2,

,W,1≤i
w
,j
w
≤N且i
w
≠j
w
;S1.3:设定最小置信度c
min
,0≤c
min
≤1,采用下式计算频繁二项集V中每个变量对的置信度的置信度其中,表示变量和在历史投诉根因分析记录中同时出现的次数,表示历史投诉根因分析记录中变量出现的次数;然后通过检索找到所有满足的变量对,并将筛选出的变量对按照置信度从大到小进行排列,记筛选出的变量对数量为T,第t个变量对为度从大到小进行排列,记筛选出的变量对数量为T,第t个变量对为分别表示第t个变量对中的两个变量,r=1,2,

,T,1≤i
t
,j
t
≤N且i
t
≠j
t
;根据变量对生成变量强关联规则构成变量强关联规则集R=(r1,

,r
t
,

,r
T
),其中,r
t
表示变量强关联规则S1.4:根据变量强关联规则集R中的强关联规则生成贝叶斯网的有向无环图,具体步骤为:以变量集Q中的变量作为贝叶斯网的节点,并依次取出变量强关联规则集R中每条变量强关联规则若贝叶斯网中变量和之间不存在有向边,则生成一条变量指向变量的有向边,从而得到贝叶斯网的有向无环图;然后基于贝叶斯网的有向无环图和移动基站运维数据,采用最大似然估计得到有向无
环图中每个变量x
i
的条件概率参数计算公式如下:其中,q
i,h
为变量x
i
的父节点集π(x
i
)中节点的第h个取值组合,h=1,2,

,H
i
,H
i
为父节点集π(x
i
)中节点的取值组合数量,为运维变量x
i
的第m
i
个可能取值,m
i
=0,1,

,M
i

1,#()为搜索满足条件的运维数据记录数;S2:生成贝叶斯网中各个变量的嵌入向量,具体方法如下:S2.1:根据有向无环图的变量集Q进行S次采样生成S个样本,构成采样样本集D
c
=(D
c,1
,

,D
c,s
,

,D
c,S
),D
c,s
表示第s个样本,s=1,2,

,S,每次采样生成样本的具体过程如下:以变量集Q=(x1,

,x
i
,

,x
N
,x
N+1
)中变量顺序作为采样顺序逐个采样,根据前向采样算法,对于变量x
i
,如果是贝叶斯网有向无环图中的根节点,则采样取值按P(x
i
)的概率进行采样;如果变量x
i
不是根节点,则采样取值按P(x
i
|π(x
i
)=q
i
)的概率进行采样,记变量x
i
的取值为的概率为生成随机数ram,0<ram<1,如果其中p
i,
‑1=0,则将变量x
i
赋值为第m
i
个可能取值;S2.2:根据采样样本集D
c
,采用如下公式计算不同运维变量对不同取值组合的点互信息值值其中,表示采样样本集D中变量x

【专利技术属性】
技术研发人员:陶厚国岳昆陈祥段亮李剑宇朱恒
申请(专利权)人:云南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1