【技术实现步骤摘要】
一种预测模型的自学习方法、装置和计算机可读存储介质
[0001]本公开涉及但不限于信息安全技术,更具体地,涉及一种预测模型的自学习方法、装置和计算机可读存储介质。
技术介绍
[0002]在信息安全领域中,网络安全态势感知是通过将例如入侵检测系统、日志审计系统、终端防护系统等安全系统的数据进行收集后,针对当前网络的安全情况进行评估并预测未来变化趋势。预测是态势感知的重要任务之一,其中时间序列等基于历史数据构建预测趋势基线的算法是趋势预测的主要方法之一。在时间序列的预测过程中,通过观测值来持续对时间序列模型所预测的趋势值进行修正是很有必要的,很多时间序列的周期性都比较容易被准确预测,但趋势性会容易受到近期一些实时的随机事件影响,如果使用时间间隔较久的历史数据训练出的模型来预测,会让时间序列预测的趋势性判断出现较大偏差,尤其在将时间序列方法使用在网络安全态势感知预测中时,如对网络安全事件数量的趋势预测、对网络流量值的趋势预测等,其采样点的时间数量级往往都在小时甚至分钟级。
[0003]相关技术中,一些态势感知系统采用周期性 ...
【技术保护点】
【技术特征摘要】
1.一种预测模型的自学习方法,包括:获取预测模型的预测边界阈值,所述预测模型是网络安全态势感知的预测模型;连续采集N个窗口的数据样本,N≥2;根据所述预测边界阈值和所述采集的数据样本计算偏离阈值区间,其中所述偏离阈值区间用于表示所述数据样本相对于所述预测边界阈值发生偏离的阈值;判断每个窗口内实时数据的偏离值是否超过所述偏离阈值区间,在实时数据的偏离值大于所述偏离阈值区间的情况下,重新训练预测模型并更新预测模型。2.根据权利要求1所述的预测模型的自学习方法,其特征在于:所述连续采集N个窗口的数据样本,N≥2,包括:设置滑动窗口大小和滑动距离;按照预先设置的滑动距离向前滑动所述滑动窗口以连续采集N个窗口的数据样本。3.根据权利要求1所述的预测模型的自学习方法,其特征在于:所述根据所述预测边界阈值和所述采集的数据样本计算偏离阈值区间,包括:根据所述预测边界阈值和所述采集的数据样本计算第一偏离阈值区间;和/或,根据所述预测边界阈值和所述采集的数据样本计算第三偏离阈值区间;其中,所述第一偏离阈值区间用于表示发生偏离的数据样本的数量;所述第三偏离阈值区间用于表示发生偏离的数据样本的偏离总量。4.根据权利要求3所述的预测模型的自学习方法,其特征在于:所述根据所述预测边界阈值和所述采集的数据样本计算第一偏离阈值区间,包括:计算所述N个窗口的每个窗口内数据样本超过所述预测边界阈值的样本个数N1;将N1除以每个窗口总样本数N2,得到每个窗口内的偏离率;计算所述N个窗口的窗口内偏离率的高斯分布,得到第一偏离阈值区间。5.根据权利要求3所述的预测模型的自学习方法,其特征在于:所述根据所述预测边界阈值和所述采集的数据样本计算第三偏离阈值区间,包括:计算所述N个窗口内所有非重复数据样本的偏离值的高斯分布,得到第二偏离阈值区间;其中,数据样本的偏离值为数据样本的真实值超过所述预测边界阈值的差值;找出每个窗口内数据样本偏离值超过所述第二偏离阈值区间的数据样本,计算找出的数据样本的偏离值的和;计算所述N个窗口偏离值的和的高斯...
【专利技术属性】
技术研发人员:李陟,田源,罗欢,
申请(专利权)人:北京启明星辰信息安全技术有限公司启明星辰信息技术集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。