一种基于机器学习的低开销AMF网络智能故障诊断方法技术

技术编号:36520784 阅读:22 留言:0更新日期:2023-02-01 15:56
本发明专利技术公开了一种基于机器学习的AMF低开销网络智能故障诊断方法,其特点是采用5G移动通信网络模型、低开销故障信息源获取模型、故障定界模型和故障定位模型为四个呈递进关系的子模型构建的5G网络故障诊断模型,实现低开销AMF网络智能故障诊断,该方法借用无监督方式的机器学习算法对网络故障诊断提供一种低开销高性价比的诊断方案,从故障数据源获取以及诊断策略角度入手,运用限流算法、SOM算法、K

【技术实现步骤摘要】
一种基于机器学习的低开销AMF网络智能故障诊断方法


[0001]本专利技术涉及5G移动通信
,尤其是一种基于机器学习的低开销且符合3GPP协议规范的AMF网络智能故障诊断方法。

技术介绍

[0002]目前,通信网络故障诊断主要分为两种模式:离线诊断以及在线诊断方式,离线诊断方式通过实时收集通信网络系统运行过程中发生的所有事件,并根据提前制定好的规则对异常事件进行标签,将收集下来的日志保存在本地系统或者复制到其他存储系统,最后通过对离线日志进行分析,达到故障根因查找的目的。这种方法的弊端在于为了保证日志信息的全面性,往往需要运行大量日志信息获取进程,占用了大量系统运行需要的资源,影响系统运行效率,同时保存所有的事件信息需要占用系统大量存储空间,这种方式对系统的冗余性和容量有很高的要求。在线诊断方式的实现机制是准确复现故障,并保留错误现场,利用人工或者自动化的方式查看相关的日志、接口资料以及相关的错误信息,实时的平台信息是这种故障诊断方式最重要的信息输入源。这种检测方式的弊端在于故障复现成功率可能不是100%,有时需要重复多遍才能准确复现故障现场,而制造故障现场需要所有的资源全部就位,并且这些资源都是不可被剥夺的。如故障现场没有被成功复现,则需要清理生产环境,重新准备资源才能进行下一次复现,复现故障基本是以小时为单位占用人力及系统资源的,由此可见,重现故障场景成本极高。
[0003]针对通信网络故障存在的问题,学者们提出了不同的检测和诊断方法。王媛湲等人基于改进SOM神经网络提出了一种指挥通信网络故障检测的算法,有效解决了在输入向量过近但类别分类不相同时,普通SOM算法分类能力差的问题,同时提出了基于反馈的自动定制迭代次数的策略。Chernogorov F等人通过研究无线网络故障,提出了通过移动终端向服务基站报告的时间序列进行N元序列分析的方法,运用降维和分类手段得到一系列异常用户,最后映射到发生故障的基站的方法。Chernogorov F等人利用了预处理、交叉验证等技术全面地介绍了随机接入信道故障场景的检测流程步骤。卓雪虹等人通过对状态码的监控提出了一种针对信令大数据的故障诊断方法。Steinder M等人针对通信系统中端到端服务的问题进行研究,提出了一种基于贝叶斯概率推理的故障定位模型,但这种故障定位方式不适用于复杂的故障场景。Xue W等人致力于解决异构网络的复杂性与脆弱度,目标是实现对两层异构无线网络小区终端的故障检测目标,作者基于K

Means算法以及通过分析时域上的关键性能指标的变化来实现网络故障的异常捕捉。但是这种算法没有考虑到参数在时域上的关联关系,所以这种故障诊断方法的正确率还有待考证。Agrawal R首先通过遍历每种网络故障的原因,然后建立对原因建立故障树,最后通过概率推理的办法对故障原因进行排序然后进行故障定位。这种方法的弊端是如果网络中涉及到的节点数量巨大,那么关系运算复杂度就会变得极高,概率推理的正确性也会受到极大的影响。Al

Rubaiey B利用时钟同步以及消息传递接口的方式对虚拟网络故障进行检测。故障发生前使用时钟同步算法测算超时时间,故障发生时,接口会发送探针来验证节点之间的连接,以此来推测故障
发生的位置。这种方式需要验证每一条链路的连接状态,链路连接复杂时故障诊断的时延开销会大幅增加,这对故障诊断的有效率与时效性都有极大影响。Shaikh R B致力于运用往返时延以及往返路径计算方法保障网络服务质量。但是这种方法在收集节点以及链路信息时会产生巨额流量开销,会降低系统运行的流畅度。A Framework利用概率推理模型对故障进行在线检测与诊断,但是这种方法对故障信息知识库的要求极高,是否能够运用于实际的生产环境仍然需要接受考验。
[0004]综上所述,当前通信网络故障智能检测与诊断研究已经取得了较大进展,但是由于通信网络复杂性与实时性带来的开销高昂问题仍然是故障检测与诊断研究领域需要突破的一大难关,而且以上这些停留在实验以及模拟阶段的学术成果不一定能够运用于复杂的实际通信生产环境,真正能够在工程实践中成功应用的低开销诊断实例还比较少。因此,如何将先进的故障检测与诊断理论方法以及技术运用到实际工业环境中去改善系统开销依旧是移动通信网络故障诊断的研究重点和难点。
[0005]现有技术存在着5G移动通信网络故障诊断开销大以及诊断结果不够权威,不但故障诊断所需的资源大,而且故障复现速度慢、准确率。

技术实现思路

[0006]本专利技术的目的是针对现有技术的不足而设计的一种基于机器学习的低开销AMF网络智能故障诊断方法,采用无监督方式的机器学习算法,实现低开销的5G网络故障信息源获取,以及流程指向性的故障定界,该方法主要从故障数据源获取以及诊断策略角度入手,运用限流算法、SOM算法、K

Means算法、TF

IDF算法等以及3GPP相关知识,帮助使用者快速整理思路以及定位故障方向,减少故障信息源的容量开销和系统为保证信息完整性所耗费的资源,大大降低了故障判决点开销、故障信息源收集开销、故障复现成本开销和故障诊断结果映射到3GPP官方解释的开销,符合3GPP协议规范,网络故障诊断技术具备低开销、快速、准确、轻量、通用的优点,而且实用性很强,不仅适用于5G移动通信网络故障的诊断,还能用于其他领域的故障诊断。
[0007]本专利技术的目的是这样实现的:一种基于机器学习的低开销AMF网络智能故障诊断方法,其特点是采用5G移动通信网络模型、低开销故障信息源获取模型、故障定界模型和故障定位模型为四个呈递进关系的子模型构建的5G网络故障诊断模型,实现低开销AMF网络智能故障诊断,所述5G移动通信网络模型采用基于状态的用户调度方式运行流程流量构建的子模型;所述低开销故障信息源获取模型采用限流算法中的滑动窗口算法和漏斗算法以及自组织映射算法构建的子模型,以降低数据获取部分低开销;所述故障定界模型采用逆文本指数分数算法、K

Means算法以及案例推理法判断故障所处的流程类别构建的子模型,以降低故障诊断结果映射到3GPP官方解释的开销;所述故障定位模型采用SBI、N1以及N2接口的故障标识映射关系构建的子模型,实现故障定位的步骤具体包括:
[0008]1)构建移动通信网络;
[0009]2)获取移动通信网络数据信息,其中包括数据流量、日志信息以及系统告警;
[0010]3)对故障进行定界;
[0011]4)对故障进行定位。
[0012]所述实现低开销AMF网络智能故障诊断具体包括以下步骤:
[0013]S1、完成移动通信网络的构建
[0014]根据5G网络架构拓扑结构搭建AMF网元以及AMF周边的网元;根据3GPP协议用户属性规范设计5G通信网络用户模拟机制;通过AMF网元、AMF周边的网元及其它们相互之间的通信关系,建立基于状态调度的5G流量调度周期模拟机制。
[0015]S2、故障信息源获取模型的构建
[0016]S21、告本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的低开销AMF网络智能故障诊断方法,其特征在于采用5G移动通信网络模型、低开销故障信息源获取模型、故障定界模型和故障定位模型为四个呈递进关系的子模型构建的5G网络故障诊断模型,实现低开销AMF网络智能故障诊断,所述5G移动通信网络模型采用基于状态的用户调度方式运行流程流量构建的子模型;所述低开销故障信息源获取模型采用限流算法中的滑动窗口算法和漏斗算法以及自组织映射算法构建的子模型,以降低数据获取部分低开销;所述故障定界模型采用逆文本指数分数算法、K

Means算法以及案例推理法判断故障所处的流程类别构建的子模型,以降低故障诊断结果映射到3GPP官方解释的开销;所述故障定位模型采用SBI、N1以及N2接口的故障标识映射关系构建的子模型,实现故障定位的步骤具体包括:1)构建移动通信网络;2)获取移动通信网络数据信息,其中包括数据流量、日志信息以及系统告警;3)对故障进行定界;4)对故障进行定位。2.根据权利要求1所述的基于机器学习的低开销AMF网络智能故障诊断方法,其特征在于所述实现低开销AMF网络智能故障诊断具体包括以下步骤:S1、完成移动通信网络的构建根据5G网络架构拓扑结构搭建AMF网元以及AMF周边的网元;根据3GPP协议用户属性规范设计5G通信网络用户模拟机制;通过AMF网元、AMF周边的网元及其它们相互之间的通信关系,建立基于状态调度的5G流量调度周期模拟机制;S2、故障信息源获取模型的构建S21、告警分类及模板设计以全覆盖的方式收集AMF平台发生的所有原始告警数据,对其分析后进行分类,并将通信网络故障告警设置为:Critical、Error、Warning、Info和Debug五个等级,当告警等级为Critical或Error时启动错误定位及诊断功能;当告警等级为Warning、Info或Debug时则不作处理;S22、设计数据监控包获取方案采用限流算法中的滑动窗口算法获取故障数据监控包,所述滑动窗口算法将总阈值切分为总个数为N的连续小窗口,当窗口容量被填满时,加入一个小窗口的同时淘汰一个最旧的窗口;S24、故障通信数据包的预处理将通信数据包经过滤操作得到的故障关键信息点和收集故障时刻的平台日志信息存储到容量富裕的另一磁盘;S3、基于机器学习的5G网络故障定界模型的设计S31、故障分类专家知识库的建立基于历史经验及知识建立故障分类专家数据库的信息索引系统,通过查询得到充足经验的查询结果,提取故障与故障根因的对应关系以及关联模式;S32、故障定界机制实现S321、数据采集及预处理采用机器学习算法对采集的通信流程错误日志故障数据进行预处理,所述预处理包
括:数据清洗及集成、数据变换以及数据数据格式化;所述数据清洗是对数据样本异常段落进行替代、填充或估计处理,判断离群点数据是否为有用数据,如是有用数据则保留,若不是有用数据则当噪声做抛弃处理,异常范围值当作缺失值处理;所述数据格式化用于发现适合用于故障定界的特征;S322、数据关键信息的提取利用逆文本指数算法计算每篇日志中每个关键词的逆文本指数分数,以统计每一份日志区别于其他日志的重要程度;S323、故障数据分类将多维逆文本指数分数作为无监督学习的K

means聚类算法的输入特征值进行训练,得到的分类结果为多维乘多维的字符串分数矩阵;S324、数据降维可视化对多维的分类后数据使用T

SNE算法进行非线性降维达到可视化的目的;S4、5G网络故障定位模型的设计S41、SBI接口定位的实现方案AMF在与其他网络功能服务交互时,通信接口均采用基于服务的接口SBI,所述SBI接口应用层采用HTTP协议;所述AMF分别使用AUSF、SMF、UDM、EIR、NSSF以及SMSF分别执行Nausf服务、Nsmf服务、Nudm服务、Neir服务、Nnssf以及Nsmsf服务操作,这些服务操作包括:AMF和这些网元之间的HTTP请求以及响应,AMF在请求这些服务时,会根据流程的不同在HTTP消息中包含不同的请求,AMF要么获得请求内容,要么收到包含于返回HTTP响应中的故障事件:S42、N1及N2接口定位的实现方案根据AMF的主要流程以及3GPP协议规定错误标识码,建立包含协议类型、错误场景以及错误标识码的专家库,并给出错误标识码的故障描述以及解释,所述AMF的主要流程有:注册、去注册、会话建立、切换以及服务请求,这些流程通信使用的接口除了N1和N2,其他均采用SBI接口;所述N1和N2接口应用层以及非接入层分别采用的协议为NGAP和NAS

MM,并根据该协议建立NAS

MM和NGAP故障专家库。3.根据权利要求2所述的基于机器学习的低开销AMF网络智能故障诊断方法,其特征在于所述步骤S322中的逆文本指数算法实现步骤如下:1)切词评分:使用Jiaba工具对每篇初始日志数据文件进行分词,并模仿英文句子,将分词后日志数据组装成以空格为分割的字符串;2)词频矩阵转换:将文本分...

【专利技术属性】
技术研发人员:王廷王文艳杨武松
申请(专利权)人:华东师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1