一种数据状态检测方法、装置和存储介质制造方法及图纸

技术编号:33444597 阅读:7 留言:0更新日期:2022-05-19 00:30
本申请提供一种数据状态检测方法、装置和存储介质,涉及网络安全技术领域,用于解决如何准确的检测数据状态的技术问题。该方法包括:在获取第一流量数据,并确定用于表示第一流量数据的统计特征的第一特征数据后,可以将第一特征数据输入至检测模型中,以得到状态检测值。其中,第一流量数据包括:位于当前时刻之前的第一时间段的流量数据和当前时刻的流量数据。状态检测值用于表示当前时刻的流量数据的数据状态。检测模型为基于用于表示第二流量数据的统计特征的第二特征数据训练得到的。第二流量数据包括:位于当前时刻之前的第二时间段的流量数据。本申请提高了检测数据状态的准确性。确性。确性。

【技术实现步骤摘要】
一种数据状态检测方法、装置和存储介质


[0001]本申请涉及网络安全
,尤其涉及一种数据状态检测方法、装置和存储介质。

技术介绍

[0002]在互联网中,网络蠕虫传播、分布式拒绝服务(distributed denial of service,DDOS)攻击、僵尸网络攻击和硬件故障等情况的发生,通常会造成异常流量。异常流量往往会导致网络阻塞、网络设备的中央处理器(central processing unit,CPU)与内存爆满等,甚至于网络瘫痪。
[0003]相关技术中,一般是通过人工凭经验设定阈值等方法,对历史流量进行划分并标注标签,从而采用有监督的机器学习算法训练得到用于检测异常流量的模型,以避免异常流量带来的危害。
[0004]但是,这种依赖于人工经验的训练方式,会存在人工标注错误等问题,无法保证模型检测异常流量的准确性,容易导致检出率低的情况。

技术实现思路

[0005]本申请提供一种数据状态检测方法、装置和存储介质,用于解决如何准确的检测数据状态的技术问题。
[0006]为达到上述目的,本申请采用如下技术方案:
[0007]第一方面,提供一种数据状态检测方法,包括:在获取第一流量数据,并确定用于表示第一流量数据的统计特征的第一特征数据后,可以将第一特征数据输入至检测模型中,以得到状态检测值。其中,第一流量数据包括:位于当前时刻之前的第一时间段的流量数据和当前时刻的流量数据。状态检测值用于表示当前时刻的流量数据的数据状态。检测模型为基于用于表示第二流量数据的统计特征的第二特征数据训练得到的。第二流量数据包括:位于当前时刻之前的第二时间段的流量数据。
[0008]可选的,第一特征数据包括:第一流量数据在第一时间长度内的最大值、最小值、均值、方差和平方和。第一流量数据在第二时间长度内的自相关系数和变异系数。第一流量数据在第三时间长度内的累计流量和平均值。第二特征数据包括多个样本特征数据。一个样本特征数据包括:第二流量数据在一个第一时间长度内的最大值、最小值、均值、方差和平方和。第二流量数据在一个第二时间长度内的自相关系数和变异系数。第二流量数据在一个第三时间长度内的累计流量和平均值。
[0009]可选的,该数据状态检测方法,还包括:获取第二流量数据。确定第二流量数据的第二特征数据。基于第二特征数据,训练得到检测模型。
[0010]可选的,基于第二特征数据,训练得到检测模型的方法,具体包括:从第二特征数据中,确定多个样本集合。一个样本集合包括目标数量的样本特征数据。目标数量为预设数量范围内的任意数量。对每个样本集合,均执行二叉树构建操作,以得到多个二叉树。将多
个二叉树组成的二叉树森林确定为检测模型。
[0011]可选的,将第一特征数据输入至检测模型中,以得到状态检测值的方法,具体包括:确定第一特征数据在每个二叉树中的叶子结点的层次值,以得到与多个二叉树一一对应的多个层次值。将多个层次值的平均值确定为状态检测值。
[0012]可选的,第一流量数据和第二流量数据的五元组信息相同。
[0013]可选的,该数据状态检测方法,还包括:当状态检测值小于或者等于预设期望值时,确定数据状态为异常状态。当状态检测值大于预设期望值时,确定数据状态为正常状态。
[0014]可选的,确定数据状态为异常状态之后,该数据状态检测方法还包括:输出与异常状态对应的告警信息。
[0015]第二方面,提供一种数据状态检测装置,包括:获取单元和处理单元。获取单元,用于获取第一流量数据。第一流量数据包括:第一时间段的流量数据和当前时刻的流量数据。第一时间段位于当前时刻之前。处理单元,用于确定获取单元获取到的第一流量数据的第一特征数据。第一特征数据用于表示第一流量数据的统计特征。处理单元,还用于将第一特征数据输入至检测模型中,以得到状态检测值。状态检测值用于表示当前时刻的流量数据的数据状态。检测模型为基于第二流量数据的第二特征数据训练得到的。第二流量数据包括:位于当前时刻之前的第二时间段的流量数据。第二特征数据用于表示第二流量数据的统计特征。
[0016]可选的,第一特征数据包括:第一流量数据在第一时间长度内的最大值、最小值、均值、方差和平方和。第一流量数据在第二时间长度内的自相关系数和变异系数。第一流量数据在第三时间长度内的累计流量和平均值。第二特征数据包括多个样本特征数据。一个样本特征数据包括:第二流量数据在一个第一时间长度内的最大值、最小值、均值、方差和平方和。第二流量数据在一个第二时间长度内的自相关系数和变异系数。第二流量数据在一个第三时间长度内的累计流量和平均值。
[0017]可选的,获取单元,还用于获取第二流量数据。处理单元,还用于确定获取单元获取到的第二流量数据的第二特征数据。处理单元,还用于基于第二特征数据,训练得到检测模型。
[0018]可选的,处理单元,具体用于:从第二特征数据中,确定多个样本集合。一个样本集合包括目标数量的样本特征数据。目标数量为预设数量范围内的任意数量。对每个样本集合,均执行二叉树构建操作,以得到多个二叉树。将多个二叉树组成的二叉树森林确定为检测模型。
[0019]可选的,处理单元,具体用于:确定第一特征数据在每个二叉树中的叶子结点的层次值,以得到与多个二叉树一一对应的多个层次值。将多个层次值的平均值确定为状态检测值。
[0020]可选的,第一流量数据和第二流量数据的五元组信息相同。
[0021]可选的,处理单元,还用于当状态检测值小于或者等于预设期望值时,确定数据状态为异常状态。处理单元,还用于当状态检测值大于预设期望值时,确定数据状态为正常状态。
[0022]可选的,该数据状态检测装置,还包括:输出单元。输出单元,用于输出与异常状态
对应的告警信息。
[0023]第三方面,提供一种数据状态检测装置,包括存储器和处理器;存储器用于存储计算机执行指令,处理器与存储器通过总线连接;当数据状态检测装置运行时,处理器执行存储器存储的计算机执行指令,以使数据状态检测装置执行如第一方面的数据状态检测方法。
[0024]该数据状态检测装置可以是网络设备,也可以是网络设备中的一部分装置,例如网络设备中的芯片系统。该芯片系统用于支持网络设备实现第一方面及其任意一种可能的实现方式中所涉及的功能,例如,接收、确定、分流上述数据处理方法中所涉及的数据和/或信息。该芯片系统包括芯片,也可以包括其他分立器件或电路结构。
[0025]第四方面,提供一种计算机可读存储介质,其特征在于,计算机可读存储介质包括计算机执行指令,当计算机执行指令在计算机上运行时,使得计算机执行如第一方面的数据状态检测方法。
[0026]需要说明的是,上述计算机指令可以全部或者部分存储在第一计算机可读存储介质上。其中,第一计算机可读存储介质可以与数据状态检测装置的处理器封装在一起的,也可以与数据状态检测装置的处理器单独封装,本申请对此不作限定。
[0027]在本申请中,上述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据状态检测方法,其特征在于,包括:获取第一流量数据;所述第一流量数据包括:第一时间段的流量数据和当前时刻的流量数据;所述第一时间段位于所述当前时刻之前;确定所述第一流量数据的第一特征数据;所述第一特征数据用于表示所述第一流量数据的统计特征;将所述第一特征数据输入至检测模型中,以得到状态检测值;所述状态检测值用于表示所述当前时刻的流量数据的数据状态;所述检测模型为基于第二流量数据的第二特征数据训练得到的;所述第二流量数据包括:位于所述当前时刻之前的第二时间段的流量数据;所述第二特征数据用于表示所述第二流量数据的统计特征。2.根据权利要求1所述的数据状态检测方法,其特征在于,所述第一特征数据包括:所述第一流量数据在第一时间长度内的最大值、最小值、均值、方差和平方和;所述第一流量数据在第二时间长度内的自相关系数和变异系数;所述第一流量数据在第三时间长度内的累计流量和平均值;所述第二特征数据包括多个样本特征数据;一个样本特征数据包括:所述第二流量数据在一个所述第一时间长度内的最大值、最小值、均值、方差和平方和;所述第二流量数据在一个所述第二时间长度内的自相关系数和变异系数;所述第二流量数据在一个所述第三时间长度内的累计流量和平均值。3.根据权利要求2所述的数据状态检测方法,其特征在于,还包括:获取所述第二流量数据;确定所述第二流量数据的所述第二特征数据;基于所述第二特征数据,训练得到所述检测模型。4.根据权利要求3所述的数据状态检测方法,其特征在于,所述基于所述第二特征数据,训练得到所述检测模型,包括:从所述第二特征数据中,确定多个样本集合;一个样本集合包括目标数量的样本特征数据;目标数量为预设数量范围内的任意数量;对每个样本集合,均执行二叉树构建操作,以得到多个二叉树;将所述多个二叉树组成的二叉树森林确定为所述检测模型。5.根据权利要求4所述的数据状态检测方法,其特征在于,所述将所述第一特征数据输入至检测模型中,以得到状态检测值,包括:确定所述第一特征数据在每个二叉树中的叶子结点的层次值,以得到与所述多个二叉树一一对应的多个层次值;将所述多个层次值的平均值确定为所述状态检测值。6.根据权利要求1

5任一项所述的数据状态检测方法,其特征在于,所述第一流量数据和所述第二流量数据的五元组信息相同。7.根据权利要求1

5任一项所述的数据状态检测方法,其特征在于,还包括:当所述状态检测值小于或者等于预设期望值时,确定所述数据状态为异常状态;当所述状态检测值大于所述预设期望值时,确定所述数据状态为正常状态。8.根据权利要求7所述的数据状态检测方法,其特征在于,所述确定所述数据状态为异常状态之后,还包括:
输出与所述异常状态对应的告警信息。9.一种数据状态检测装置,其特征在于,包括:获取单元和处理单元;所述获取单元,用于获取第一流量数据;所述第一流量数据包括:第一时间段的流量数据和当前时刻的流量数据;所述第一时间段位于所述当前时刻之前;所述处理单元,用于确定所述获取单元获取到的所述第一流量数据的第一特征数据;所述第一特征数据用于表示所述第一流量数据的统计特征;所述处理单元,...

【专利技术属性】
技术研发人员:陈磊张莹莹叶晟
申请(专利权)人:亚信科技成都有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1