故障定界方法及装置制造方法及图纸

技术编号:23534747 阅读:32 留言:0更新日期:2020-03-20 08:33
本发明专利技术实施例提供一种故障定界方法及装置。所述方法包括:监测到终端当前进行的互联网应用服务OTT业务发生故障时,获取所述终端在故障时刻的信令数据;根据所述信令数据,确定所述终端当前所处的进程,所述进程包括建链阶段、初缓阶段和/或播放阶段;根据所述进程以及预设规则,确定所述信令数据中的关键业务指标值;根据所述关键业务指标值,确定所述故障对应的故障类型,所述故障类型包括无线侧故障以及非无线侧故障。本发明专利技术实施例解决了现有技术中通用OTT业务的故障定界方式,流程繁琐,对人工的依赖程度较高的问题。

Fault demarcation method and device

【技术实现步骤摘要】
故障定界方法及装置
本专利技术实施例涉及移动通信
,尤其涉及一种故障定界方法及装置。
技术介绍
现阶段,分组交换(PacketSwitch,PS)域在进行故障定界时,通常依据PS业务监控、PS业务质量评估或者第三方网络评估等数据,对具体指标或者网络中影响用户感知的潜在因素进行根因排查,最终输出定界结果进行优化提升。通常情况下,信令平台对整体业务感知类指标主要从设备层、管道层、业务层以及互联网应用服务(OverTheTop,OTT)业务层等四个维度进行评估,而针对PS业务问题的故障定界主要采用通用的OTT业务定界规则。具体地,OTT业务层主要包括通用类的即时通信(InstantMessaging,IM),业务、社交网络服务(SocialNetworkingServices,SNS)业务、网络电话(VoiceoverInternetProtocol,VOIP)和文件存取(FileAccess)四类业务,以及OTT业务建模;OTT业务层的各种指标定界面向网元或者终端、无线、核心网、服务提供商(ServiceProvider,SP)四个方向。由于目前视频业务激增,对于快速定界视频业务的故障,是提升视频感知的重要手段。网络级通用OTT业务的指标中,只有速率和流量是属于OTT业务特有的,而其他指标都是基础的传输控制协议(TransmissionControlProtocol,TCP)指标。流量指标在用于故障定界时,通常是当业务流量发生突降时,若网络中其他WEB/Streaming业务未发生通断类故障的情况,此时可能是具体业务的SP服务器或业务网到服务器之间的路由发生了问题,可通过查看该大类中TOP业务,针对SP的分析将问题定界到具体业务服务器上。而对于速率或时延类指标,该类关键质量指标(KeyQualityIndicators,KQI)主要受端到端因素的影响。在进行故障定界时,若其他WEB/Streaming业务速率或时延类KQI未发生同步异常,则对具体业务KQI的终端、网络中对该类业务的限速因素、对应SP进行多维度分析,判断问题根因所在。若其他业务和OTT类速率或时延类指标发生同步异常,则使用TCP指标辅助进行问题隔离定界。目前,对于通用OTT业务的故障定界方式,对于速率类指标的通用分析,通用定界工具原则上是基于故障树平台承载的,对于不具备故障树支持能力的场景,可以使用信令平台的多维数据查询,按照分析逻辑,逐步获取分析维度数据并进行人工分析定界。然而,通用OTT业务的故障定界流程繁琐,无线侧的故障定界主要还是依据无线侧的常规指标进行分析,无法快速定界是否为无线侧原因;且需要结合其他平台分析,跨平台较多,其中存在较多的人工分析定界,对人工的依赖程度较高,导致故障定界的效率低,精准度较差。
技术实现思路
本专利技术实施例提供一种故障定界方法及装置,用以解决现有技术中通用OTT业务的故障定界方式,流程繁琐,对人工的依赖程度较高的问题。一方面,本专利技术实施例提供一种故障定界方法,所述方法包括:监测到终端当前进行的互联网应用服务OTT业务发生故障时,获取所述终端在故障时刻的信令数据;根据所述信令数据,确定所述终端当前所处的进程,所述进程包括建链阶段、初缓阶段和/或播放阶段;根据所述进程以及预设规则,确定所述信令数据中的关键业务指标值;根据所述关键业务指标值,确定所述故障对应的故障类型,所述故障类型包括无线侧故障以及非无线侧故障。另一方面,本专利技术实施例提供一种故障定界装置,所述装置包括:数据获取模块,用于监测到终端当前进行的互联网应用服务OTT业务发生故障时,获取所述终端在故障时刻的信令数据;进程确定模块,用于根据所述信令数据,确定所述终端当前所处的进程,所述进程包括建链阶段、初缓阶段和/或播放阶段;指标确定模块,用于根据所述进程以及预设规则,确定所述信令数据中的关键业务指标值;故障界定模块,用于根据所述关键业务指标值,确定所述故障对应的故障类型,所述故障类型包括无线侧故障以及非无线侧故障。另一方面,本专利技术实施例还提供了一种电子设备,包括存储器、处理器、总线以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述故障定界方法中的步骤。再一方面,本专利技术实施例还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述故障定界方法中的步骤。本专利技术实施例提供的故障定界方法及装置,监测到终端当前进行OTT业务发生故障时,获取所述终端在故障时刻的信令数据,并根据所述信令数据,确定所述终端当前所处的进程;根据所述进程以及预设规则,确定所述信令数据中的关键业务指标值;根据所述关键业务指标值,确定所述故障对应的故障类型,实现自动对通用OTT业务的故障定界,无需依赖人工操作。且故障定界过程中,主要依据终端的信令数据实现,涉及的网元较少,过程简单,无需从设备层、管道层、业务层等逐层进行评估;从进程、预设规则以及多个关键业务指标值,综合考虑多个因素进行评估,提高故障定界的精确度。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的故障定界方法的流程示意图;图2为本专利技术实施例的第一示例的流程示意图;图3为本专利技术实施例的第二示例的流程示意图;图4为本专利技术实施例的第三示例的流程流程图;图5为本专利技术实施例的第四示例的流程流程图;图6为本专利技术实施例提供的故障定界装置的结构示意图;图7为本专利技术实施例提供的电子设备的结构示意图。具体实施方式为使本专利技术要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。在下面的描述中,提供诸如具体的配置和组件的特定细节仅仅是为了帮助全面理解本专利技术的实施例。因此,本领域技术人员应该清楚,可以对这里描述的实施例进行各种改变和修改而不脱离本专利技术的范围和精神。另外,为了清楚和简洁,省略了对已知功能和构造的描述。应理解,说明书通篇中提到的“实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本专利技术的至少一个实施例中。因此,在整个说明书各处出现的“实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。在本专利技术的各种实施例中,应理解,下述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本专利技术实施例的实施过程构成任何限定。在本申请所提供的实施例中,应理解,“与A相应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确本文档来自技高网
...

【技术保护点】
1.一种故障定界方法,其特征在于,包括:/n监测到终端当前进行的互联网应用服务OTT业务发生故障时,获取所述终端在故障时刻的信令数据;/n根据所述信令数据,确定所述终端当前所处的进程,所述进程包括建链阶段、初缓阶段和/或播放阶段;/n根据所述进程以及预设规则,确定所述信令数据中的关键业务指标值;/n根据所述关键业务指标值,确定所述故障对应的故障类型,所述故障类型包括无线侧故障以及非无线侧故障。/n

【技术特征摘要】
1.一种故障定界方法,其特征在于,包括:
监测到终端当前进行的互联网应用服务OTT业务发生故障时,获取所述终端在故障时刻的信令数据;
根据所述信令数据,确定所述终端当前所处的进程,所述进程包括建链阶段、初缓阶段和/或播放阶段;
根据所述进程以及预设规则,确定所述信令数据中的关键业务指标值;
根据所述关键业务指标值,确定所述故障对应的故障类型,所述故障类型包括无线侧故障以及非无线侧故障。


2.根据权利要求1所述的方法,其特征在于,所述获取所述终端在故障时刻的信令数据的步骤,包括:
获取所述终端所属基站的测量报告MR数据;
根据所述MR数据,判断所述终端所属小区当前是否处于弱覆盖和/或重叠覆盖情况:
若判断结果为是,则确定所述故障对应的故障类型为无线侧故障;
否则,获取所述终端在故障时刻的信令数据。


3.根据权利要求1所述的方法,其特征在于,所述监测到终端当前进行的互联网应用服务OTT业务发生故障的步骤,包括:
获取终端的网络之间互连的协议IP数据包以及域名系统DNS数据包;
当判断所述IP数据包以及DNS数据包满足预设故障判别模型时,确定所述终端当前进行的互联网应用服务OTT业务发生故障;其中,所述预设故障判别模型为对所述IP数据包以及DNS数据包进行深度学习得到的。


4.根据权利要求1所述的方法,其特征在于,所述根据所述进程以及预设规则,确定所述信令数据中的关键业务指标值的步骤,包括:
当所述进程为建链阶段时,所述终端的关键业务指标值包括第一时延值、第一指标值以及第二指标值;其中,所述第一指标值包括传输控制协议TCP建链上游时延值、DNS响应时延值以及获取数据GET响应时延值;所述第二指标值包括TCP建链空口时延值;
当所述进程为初缓阶段或播放阶段时,所述终端的关键业务指标值包括第二时延值,还包括第三指标值以及第四指标值;所述第三指标值包括:无线侧空口速率指标、无线侧入口速率指标以及时延占比指标;所述第四指标值包括窗口指标。


5.根据权利要求4所述的方法,其特征在于,所述非无线侧故障包括无线侧上游故障;
所述根据所述关键业务指标值,确定所述故障对应的故障类型的步骤,包括:
当所述进程为建链阶段且所述第一时延值大于第一预设时延阈值时;
若所述第一指标值中的各个指标均大于对应的阈值,则所述故障对应的故障类型为无线侧上游故障;或
若所述第二指标值小于对应的阈值,则所述故障对应的故障类型为无线侧故障。


6.根据权利要求4所...

【专利技术属性】
技术研发人员:李宗璋
申请(专利权)人:中国移动通信集团山东有限公司中国移动通信集团有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1