【技术实现步骤摘要】
一种时间序列数据异常点检测方法及系统
本专利技术涉及流程工业质量管控与优化
,特别涉及一种时间序列数据异常点检测方法及系统。
技术介绍
在流程工业生产过程中,需要建立一个良好的监控手段来对整个生产流程进行数据检测,从而得到高质量的良好产品。然而几乎所有的生产过程都可能会出现工艺设定或控制异常等情况,所以得到的数据经常会存在局部异常问题。在实际生产过程中,需要找到生产过程数据异常发生的时刻和严重程度,从而进行对应的质量分析。因此,需要利用时间序列异常点检测来寻找流程工业生产中工艺数据发生异常波动的时间。但实际生产过程可能包含复杂的原料波动、人工干预、工艺状态变化等使生产过程处于非稳态过程,现有的常规统计监控方法无法准确检测数据异常的时刻,也无法量化数据异常的严重程度。
技术实现思路
本专利技术提供了一种时间序列数据异常点检测方法及系统,以解决现有方法无法准确检测时间序列数据异常的时刻,无法量化数据异常的严重程度的问题。为解决上述技术问题,本专利技术提供了如下技术方案:一方面,本 ...
【技术保护点】
1.一种时间序列数据异常点检测方法,其特征在于,所述方法包括:/n获取待检测的时间序列数据,所述时间序列数据包括多段子时间序列;/n利用相关向量机计算所述时间序列数据中当前观测数据的预测概率分布;/n基于计算出的当前观测数据的预测概率分布,利用贝叶斯框架判断当前观测数据是否为异常点,以得到所述时间序列数据中异常点位置和异常点概率值;/n对所述时间序列数据中的每一段子时间序列中的异常点位置和异常点概率值分别进行合并处理,得到各段子时间序列对应的异常点位置和异常点概率值。/n
【技术特征摘要】
1.一种时间序列数据异常点检测方法,其特征在于,所述方法包括:
获取待检测的时间序列数据,所述时间序列数据包括多段子时间序列;
利用相关向量机计算所述时间序列数据中当前观测数据的预测概率分布;
基于计算出的当前观测数据的预测概率分布,利用贝叶斯框架判断当前观测数据是否为异常点,以得到所述时间序列数据中异常点位置和异常点概率值;
对所述时间序列数据中的每一段子时间序列中的异常点位置和异常点概率值分别进行合并处理,得到各段子时间序列对应的异常点位置和异常点概率值。
2.如权利要求1所述的时间序列数据异常点检测方法,其特征在于,所述获取待检测的时间序列数据,包括:
获取流程工业生产过程中预设工艺变量产生的实时原始时间序列数据集;
对所述实时原始时间序列数据集进行预处理,去除所述实时原始时间序列数据集中不符合预设要求的时间序列数据,以得到所述待检测的时间序列数据。
3.如权利要求2所述的时间序列数据异常点检测方法,其特征在于,所述对所述实时原始时间序列数据集进行预处理,去除所述实时原始时间序列数据集中不符合预设要求的时间序列数据,包括:
对所述实时原始时间序列数据集进行预处理,去除所述实时原始时间序列数据集中的不正确的时间序列数据和包含空值的不完整的时间序列数据。
4.如权利要求2所述的时间序列数据异常点检测方法,其特征在于,所述利用相关向量机计算所述时间序列数据中当前观测数据的预测概率分布,包括:
根据不同工艺变量所产生的时间序列数据,确定所述相关向量机中的核函数,以及选择预设的模型超参数,并为所述模型超参数建立预设的收敛标准;
对于所述时间序列数据中的当前观测数据,基于相关向量机,利用对应的历史时间序列数据迭代计算其预测概率分布的均值和方差来更新所述模型超参数,直至满足所述预设的收敛标准后,计算得到当前观测数据的预测概率分布。
5.如权利要求1所述的时间序列数据异常点检测方法,其特征在于,所述利用贝叶斯框架判断当前观测数据是否为异常点,包括:
为贝叶斯框架选择预设的惩罚函数,以及为选择的惩罚函数设置预设的超参数,以用来计算当前观测数据的异常点条件先验分布;
利用当前观测数据的预测概率分布和异常点条件先验概率分布,计算当前运行长度的后验概率分布,并根据后验概率分布确定当前可能的最大运行长度;
将所述当前可能的最大运行长度与前一时刻的最大...
【专利技术属性】
技术研发人员:何飞,杜学飞,吕志民,张志研,
申请(专利权)人:北京科技大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。