数据输出系统异常检测方法、装置、设备及可读存储介质制造方法及图纸

技术编号:27806352 阅读:32 留言:0更新日期:2021-03-30 09:20
本发明专利技术公开一种数据输出系统异常检测方法、装置、设备及可读存储介质。该方法包括:获取数据输出系统输出的对应于多个时段的待检测数据;基于异常数据检测模型,分别检测出每一时段的待检测数据中的异常数据;分别将每一时段的异常数据数目与对应时段的预测数目进行比较;以及当异常数据数目大于预测数目,且异常数据数目与预测数目之差大于预设阈值时,确定数据输出系统在该时段存在异常;其中,异常数据检测模型的训练数据由数据输出系统的输出数据确定。根据本发明专利技术提供的数据输出系统异常检测方法,能够基于对系统多个时段输出数据的异常检测结果,自动化确定系统的实时状态或系统在任意时段的历史状态是否存在异常。或系统在任意时段的历史状态是否存在异常。或系统在任意时段的历史状态是否存在异常。

【技术实现步骤摘要】
数据输出系统异常检测方法、装置、设备及可读存储介质


[0001]本专利技术涉及异常检测领域,具体而言,涉及一种数据输出系统异常检测方法、装置、计算机设备及计算机可读存储介质。

技术介绍

[0002]目前,异常检测技术广泛应用于入侵检测、欺诈检测、故障检测、系统健康监测、传感器网络事件检测、生态系统干扰检测等众多领域。随着各种软硬件系统逐渐庞大且先进,越来越多的内、外因素导致了异常的发生,例如流量的突涨、系统某组件的失效、某次运维误操作、某个代码上线时引发的未知漏洞等。在现实生活中,异常可引发银行欺诈、结构缺陷、医疗风险、文本错误等诸多问题。因此,系统维护人员需要检测系统运行的各项数据指标以监控系统状态,及时发现可能存在的异常并分析原因,导致人工成本投入极大。
[0003]此外,传统的异常检测通常基于统计学方法:假设系统数据符合某个概率分布对系统进行建模,根据采集数据的实际分布对异常值进行判断,例如假设系统数据符合正态分布,则如果某个数据与样本均值μ的偏差大于3σ即认为其很有可能是异常值。
[0004]然而,基于统计学方法的异常检测存在如下缺陷:1)用于估计假设分布的数据需保证不含有或者极少含有噪声(离群值),否则难以估计出准确的变异指标;2)基于统计学方法的异常检测通用性较差,通常只适用于在科学研究中挖掘单变量的数值型数据,而对于真实应用场景中的数据,例如高维度图像或文本数据则无法基于统计学方法满足检测要求。
[0005]在所述
技术介绍
部分公开的上述信息仅用于加强对本专利技术的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]有鉴于此,本专利技术提供一种数据输出系统异常检测方法、装置、计算机设备及计算机可读存储介质。
[0007]本专利技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利技术的实践而习得。
[0008]根据本专利技术的一方面,提供一种数据输出系统异常检测方法,包括:获取数据输出系统输出的对应于多个时段的待检测数据;对每一时段的待检测数据,分别执行如下操作:基于异常数据检测模型,检测出所述待检测数据中的异常数据;以及对每一时段的异常数据,分别执行如下操作:将所述时段的异常数据数目与对应时段的预测数目进行比较;以及当所述异常数据数目大于所述预测数目,且所述异常数据数目与所述预测数目之差大于预设阈值时,确定所述数据输出系统在所述时段存在异常;其中,所述异常数据检测模型的训练数据由所述数据输出系统的输出数据确定。
[0009]根据本专利技术的一实施方式,所述异常数据检测模型基于孤立森林算法而建立。
[0010]根据本专利技术的一实施方式,所述方法还包括:分别对各时段的异常数据数目执行
如下操作,以确定各时段的预测数目:对所述时段及所述时段之前各时段的异常数据数目进行平滑处理,得到平滑处理的结果;及确定所述结果为所述时段的预测数目。
[0011]根据本专利技术的一实施方式,对所述时段及所述时段之前各时段的异常数据数目进行平滑处理包括:基于指数加权移动平均算法,平滑处理所述时段及所述时段之前各时段的异常数据数目。
[0012]根据本专利技术的一实施方式,每一时段的待检测数据由所述数据输出系统在所述时段的输出数据及在所述时段的前一时段的输出数据确定。
[0013]根据本专利技术的一实施方式,所述训练数据由所述数据输出系统在一预先选出的时段的输出数据及在所述预先选出的时段的前一时段的输出数据确定。
[0014]根据本专利技术的一实施方式,所述多个时段为连续的多天。
[0015]根据本专利技术的另一方面,提供一种数据输出系统异常检测装置,包括:数据获取模块,用于获取数据输出系统输出的对应于多个时段的待检测数据;异常检测模块,用于对每一时段的待检测数据,分别执行如下操作:基于异常数据检测模型,检测出所述待检测数据中的异常数据;其中,所述异常数据检测模型的训练数据由所述数据输出系统的输出数据确定;数目比较模块,用于对每一时段的异常数据,分别执行如下操作:将所述时段的异常数据数目与对应时段的预测数目进行比较;以及异常确定模块,用于当所述异常数据数目大于所述预测数目,且所述异常数据数目与所述预测数目之差大于预设阈值时,确定所述数据输出系统在所述时段存在异常。
[0016]根据本专利技术的再一方面,提供一种计算机设备,包括:存储器、处理器及存储在所述存储器中并可在所述处理器中运行的可执行指令,所述处理器执行所述可执行指令时实现上述任一种数据输出系统异常检测方法。
[0017]根据本专利技术的再一方面,提供一种计算机可读存储介质,其上存储有计算机可执行指令,所述可执行指令被处理器执行时实现上述任一种数据输出系统异常检测方法。
[0018]根据本专利技术提供的数据输出系统异常检测方法,能够基于对系统多个时段输出数据的异常检测结果,自动化确定系统的实时状态或系统在任意时段的历史状态是否存在异常,摆脱了系统异常检测对人工成本的依赖。
[0019]另外,在一些实施例中,本专利技术提供的数据输出系统异常检测方法所使用的异常检测模型是基于孤立森林算法而建立的,打破了统计学方法面对高维度图像或文本数据等异常检测场景时的局限性。
[0020]应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本专利技术。
附图说明
[0021]通过参照附图详细描述其示例实施例,本专利技术的上述和其它目标、特征及优点将变得更加显而易见。
[0022]图1是根据一示例性实施方式示出的一种数据输出系统异常检测方法的流程图。
[0023]图2是根据一示例性实施方式示出的另一种数据输出系统异常检测方法的流程图。
[0024]图3是根据一示例性实施方式示出的一种数据输出系统异常检测装置的框图。
[0025]图4是根据一示例性实施方式示出的一种计算机设备的结构示意图。
[0026]图5是根据一示例性实施例示出的一种数据输出系统某个时段输出数据的二维分布图。
[0027]图6是根据一示例性实施例示出的一种判定数据输出系统状态异常的示意图。
具体实施方式
[0028]现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本专利技术将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本专利技术的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
[0029]此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本专利技术的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本专利技术的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、装置、步骤等。在其它情况下,不详细示出或描述公知结构、方法、装置、实现或者操作以避免喧宾夺主而使得本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据输出系统异常检测方法,其特征在于,包括:获取数据输出系统输出的对应于多个时段的待检测数据;对每一时段的待检测数据,分别执行如下操作:基于异常数据检测模型,检测出所述待检测数据中的异常数据;以及对每一时段的异常数据,分别执行如下操作:将所述时段的异常数据数目与对应时段的预测数目进行比较;以及当所述异常数据数目大于所述预测数目,且所述异常数据数目与所述预测数目之差大于预设阈值时,确定所述数据输出系统在所述时段存在异常;其中,所述异常数据检测模型的训练数据由所述数据输出系统的输出数据确定。2.根据权利要求1所述的方法,其特征在于,所述异常数据检测模型基于孤立森林算法而建立。3.根据权利要求1或2所述的方法,其特征在于,还包括:分别对各时段的异常数据数目执行如下操作,以确定各时段的预测数目:对所述时段及所述时段之前各时段的异常数据数目进行平滑处理,得到平滑处理的结果;及确定所述结果为所述时段的预测数目。4.根据权利要求3所述的方法,其特征在于,对所述时段及所述时段之前各时段的异常数据数目进行平滑处理包括:基于指数加权移动平均算法,平滑处理所述时段及所述时段之前各时段的异常数据数目。5.根据权利要求1或2所述的方法,其特征在于,每一时段的待检测数据由所述数据输出系统在所述时段的输出数据及在所述时段的前一时段的...

【专利技术属性】
技术研发人员:祖辰罗尚勇
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1