告警事务提取方法、装置、设备及计算机存储介质制造方法及图纸

技术编号:26478583 阅读:31 留言:0更新日期:2020-11-25 19:22
本发明专利技术实施例公开了一种告警事务提取方法、装置、设备及计算机存储介质。该方法包括:根据原始告警数据的特点,利用DBSCAN聚类算法将原告警数据划分为多个告警发生比较密集的时间段,并通过约束条件选取DBSCAN最佳输入参数,然后在各个时间段利用滑动时间窗口法提取告警事务。本发明专利技术有效地降低了噪声数据对告警事务提取的影响,能够剔除噪声告警,可有效减少计算过程并提高告警数据处理结果的准确性。

【技术实现步骤摘要】
告警事务提取方法、装置、设备及计算机存储介质
本专利技术属于通信
,尤其涉及一种告警事务提取方法、装置、设备及计算机存储介质。
技术介绍
随着计算机技术和移动通信网络的发展,网络中各设备产生的告警信息对网络风险分析至关重要,由于通信网络中告警传播的复杂性,故障的发生往往伴随着大量的相关告警出现,为故障的精确定位带来很大的困难。另外,通信网络时刻均会产生大量的告警数据,由于网络设备的异构性,且原始告警数据通常存在信息冗余、告警发生时间点不同步、含有噪声等问题,无法对原始告警数据直接进行关联规则挖掘。现有技术无法有效的分辨出噪音告警,且算法复杂度较高,影响告警数据处理的效率以及结果的准确性。
技术实现思路
为了解决上述中的至少一个技术问题,本专利技术实施例提供一种告警事务提取方法、装置、设备及计算机存储介质,能够剔除噪声告警,可有效减少计算过程并提高告警数据处理结果的准确性。第一方面,本专利技术实施例提供一种告警数据提取方法,方法包括:根据获取的多个原始告警数据,确定告警时间序列;利用具有噪声的基于密度的聚类算法(Density-BasedSpatialClusteringofApplicationswithNoise,DBSCAN)对告警时间序列进行聚类处理,获得多个第一时间段;确定每个第一时间段的中心时间点,并根据中心时间点确定相邻两个第一时间段之间的段间差异和每个第一时间段的段内差异;根据段间差异、段内差异及预设的噪声数据百分比,优化DBSCAN聚类算法的参数,得到优化后的DBSCAN聚类算法;利用优化后的DBSCAN聚类算法对告警时间序列进行聚类处理,获得多个第二时间段,并利用滑动时间窗口法提取每个第二时间段内的原始告警数据对应的告警事务。第二方面,本专利技术实施例提供了一种告警数据提取装置,装置包括:数据获取模块,用于根据获取的多个原始告警数据,确定告警时间序列;聚类模块,用于利用具有噪声的基于密度的聚类算法DBSCAN对告警时间序列进行聚类处理,获得多个第一时间段;约束条件确定模块,用于确定每个第一时间段的中心时间点,并根据中心时间点确定相邻两个第一时间段之间的段间差异和每个第一时间段的段内差异;优化模块,用于根据段间差异、段内差异及预设的噪声数据百分比,优化DBSCAN聚类算法的参数,得到优化后的DBSCAN聚类算法;告警事务提取模块,用于利用优化后的DBSCAN聚类算法对告警时间序列进行聚类处理,获得多个第二时间段,并利用滑动时间窗口法提取每个第二时间段中的多个原始告警数据对应的告警事务。第三方面,本专利技术实施例提供了一种告警数据提取设备,设备包括:处理器以及存储有计算机程序指令的存储器;所述处理器执行所述计算机程序指令时实现如第一方面所述的告警数据提取方法。第四方面,本专利技术实施例提供了一种计算机存储介质,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如第一方面所述的告警数据提取方法。本专利技术实施例的告警数据提取方法、装置、设备及计算机存储介质,根据原始告警数据的特点,利用DBSCAN聚类算法将原告警数据划分为多个告警发生比较密集的时间段,并通过约束条件选取DBSCAN最佳输入参数,然后在各个时间段利用滑动时间窗口法提取告警事务。本专利技术有效地降低了噪声数据对告警事务提取的影响,能够剔除噪声告警,可有效减少计算过程并提高告警数据处理结果的准确性。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的告警事务提取方法的流程示意图;图2是本专利技术实施例提供第一邻域半径下的DBSCAN分段总体质量示意图;图3是本专利技术实施例提供第二邻域半径下的DBSCAN分段总体质量示意图;图4是本专利技术实施例提供第三邻域半径下的DBSCAN分段总体质量示意图;图5是本专利技术实施例提供第四邻域半径下的DBSCAN分段总体质量示意图;图6是本专利技术实施例提供第一邻域半径下的DBSCAN分段噪声数据占比示意图;图7是本专利技术实施例提供第二邻域半径下的DBSCAN分段噪声数据占比示意图;图8是本专利技术实施例提供第三邻域半径下的DBSCAN分段噪声数据占比示意图;图9是本专利技术实施例提供第四邻域半径下的DBSCAN分段噪声数据占比示意图;图10是本专利技术实施例提供的均匀滑动时间窗口的示意图;图11是本专利技术实施例提供的针对第一数据集的三种滑动时间窗口方法提取的事务数量示意图;图12是本专利技术实施例提供的针对第二数据集的三种滑动时间窗口方法提取的事务数量示意图;图13是本专利技术实施例提供的针对第一数据集的三种滑动时间窗口方法段内差异示意图;图14是本专利技术实施例提供的针对第二数据集的三种滑动时间窗口方法段内差异示意图;图15是本专利技术实施例提供的针对第一数据集的三种滑动时间窗口方法事务集总体质量示意图;图16是本专利技术实施例提供的针对第二数据集的三种滑动时间窗口方法事务集总体质量示意图;图17是本专利技术实施例提供的告警数据提取装置的结构示意图;图18是本专利技术实施例提供的告警数据提取设备的结构示意图。具体实施方式下面将详细描述本专利技术的各个方面的特征和示例性实施例,为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本专利技术进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本专利技术,并不被配置为限定本专利技术。对于本领域技术人员来说,本专利技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本专利技术的示例来提供对本专利技术更好的理解。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。由于网络短暂的振动或不稳定产生噪声告警,因此噪声告警可能和正常告警同时发生,现有技术仅对原始告警数据进行分段无法剔除噪声告警。另外,告警的发生具有无规律性和不确定性,因此无法提前确定划分告警时间序列的时间段的个数,提前确定划分的时间段的数量是不合理也是不科学的,且算法复杂度较高。因此,目前存在两大难题:第一,怎样有效地从告警数据中发现噪声告警数本文档来自技高网...

【技术保护点】
1.一种告警事务提取方法,其特征在于,包括:/n根据所获取的多个原始告警数据,确定告警时间序列;/n利用具有噪声的基于密度的聚类算法DBSCAN对所述告警时间序列进行聚类处理,获得多个第一时间段;/n确定每个所述第一时间段的中心时间点,并根据所述中心时间点确定相邻两个所述第一时间段之间的段间差异和每个所述第一时间段的段内差异;/n根据所述段间差异、所述段内差异及预设的噪声数据百分比,优化所述DBSCAN聚类算法的参数,得到优化后的DBSCAN聚类算法;/n利用所述优化后的DBSCAN聚类算法对所述告警时间序列进行聚类处理,获得多个第二时间段,并利用滑动时间窗口法提取每个所述第二时间段中的多个原始告警数据对应的告警事务。/n

【技术特征摘要】
1.一种告警事务提取方法,其特征在于,包括:
根据所获取的多个原始告警数据,确定告警时间序列;
利用具有噪声的基于密度的聚类算法DBSCAN对所述告警时间序列进行聚类处理,获得多个第一时间段;
确定每个所述第一时间段的中心时间点,并根据所述中心时间点确定相邻两个所述第一时间段之间的段间差异和每个所述第一时间段的段内差异;
根据所述段间差异、所述段内差异及预设的噪声数据百分比,优化所述DBSCAN聚类算法的参数,得到优化后的DBSCAN聚类算法;
利用所述优化后的DBSCAN聚类算法对所述告警时间序列进行聚类处理,获得多个第二时间段,并利用滑动时间窗口法提取每个所述第二时间段中的多个原始告警数据对应的告警事务。


2.根据权利要求1所述的告警事务提取方法,其特征在于,所述根据所述段间差异、所述段内差异及预设的噪声数据百分比,优化所述DBSCAN聚类算法的参数,得到优化后的DBSCAN聚类算法,包括:
根据所述段间差异和所述段内差异的比值及实际的噪声数据百分比,调整所述DBSCAN聚类算法的参数;
利用调整后的所述DBSCAN聚类算法对所述告警时间序列重新进行聚类处理,得到当前段间差异和当前段内差异;
若在实际的噪声数据百分比小于预设的噪声数据百分比的情况下,所述当前段间差异和所述当前段内差异的比值大于上一次调整后的段间差异和段内差异的比值,则继续调整所述DBSCAN聚类算法的参数;
直至在实际的噪声数据百分比小于预设的噪声数据百分比的情况下,当前段间差异和当前段内差异的比值不大于上一次调整后的段间差异和段内差异的比值,得到优化后的DBSCAN聚类算法。


3.根据权利要求2所述的告警事务提取方法,其特征在于,所述DBSCAN聚类算法的参数包括邻域半径和邻域阈值。


4.根据权利要求1所述的告警事务提取方法,其特征在于,所述方法还包括:
确定每个所述第二时间段内的告警事务的事务间差...

【专利技术属性】
技术研发人员:姚旭清张志睿张琳齐小刚刘立芳胡秋秋王冰纯
申请(专利权)人:中国移动通信集团山西有限公司中国移动通信集团有限公司
类型:发明
国别省市:山西;14

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1