The invention discloses a method for rapid screening of the steady state mass data in process data include: initialization processing A, steady-state data screening; B, from the starting point to the end point of sliding window data of mobile, mobile per time, there will be a new data point into the sliding window, and the starting point of the original sliding data in the window to give up, calculating the mean and standard data within the new sliding window; C, the new sliding window is contained within the N data standard deviation and standard deviation threshold delta y, according to the comparison results of the screening operation; D, data on the selected static data segment both ends are removed, improve the calculation accuracy of the steady-state value of data. The invention can improve the deficiency of the prior art and improve the screening speed of large-scale process data.
【技术实现步骤摘要】
一种快速筛选大规模过程数据中的稳态工况数据的方法
本专利技术涉及过程数据挖掘
,尤其是一种快速筛选大规模过程数据中的稳态工况数据的方法。
技术介绍
在过程数据模型辨识、系统稳定工况的参数判定等过程中,都需要应用过程数据中的稳态工况数据,对于大量的过程数据而言,人工筛选耗时费力。滑动窗口是一种通用性的数据统计处理方法,即通过一个固定长度的窗口对数据进行遍历处理。例如中国专利技术专利CN103679218B公开的一种手写体关键词检测方法,通过使用滑动窗口对待检测文本图像的特征点进行提取,进而与关键词特征库对比。但是现有技术中所使用的滑动窗口方法由于处理方法复杂,无法适应大数据量的快速处理。
技术实现思路
本专利技术要解决的技术问题是提供一种快速筛选大规模过程数据中的稳态工况数据的方法,能够解决现有技术的不足,提高了大规模过程数据的筛选速度。为解决上述技术问题,本专利技术所采取的技术方案如下。一种快速筛选大规模过程数据中的稳态工况数据的方法,包括以下步骤:A、稳态数据筛选的初始化处理,对需要进行稳态工况数据筛选的数据段进行数据滤波,选取长度为n的存储空间作为滑动窗口,所述存储空间为判断所述过程数据段稳定的最小单元,其中n表示所述滑动窗口中包含数据的个数,根据包含n个数据的滑动窗口中的单个数据允许偏差值α,计算所述滑动窗口中n个数据的标准偏差的阈值δy;计算数据段起始位置的n个数据的均值,作为滑动窗口均值的初值计算数据段起始位置的n个数据的标准差,作为滑动窗口标准差的初值σ1B、滑动窗口由数据起点向终点移动,每移动一次,会有一个新数据点进入滑动窗口,同时将原滑动 ...
【技术保护点】
一种快速筛选大规模过程数据中的稳态工况数据的方法,其特征在于包括以下步骤:A、稳态数据筛选的初始化处理,对需要进行稳态工况数据筛选的数据段进行数据滤波,选取长度为n的存储空间作为滑动窗口,所述存储空间为判断所述过程数据段稳定的最小单元,其中n表示所述滑动窗口中包含数据的个数,根据包含n个数据的滑动窗口中的单个数据允许偏差值α,计算所述滑动窗口中n个数据的标准偏差的阈值δy;计算数据段起始位置的n个数据的均值,作为滑动窗口均值的初值
【技术特征摘要】
1.一种快速筛选大规模过程数据中的稳态工况数据的方法,其特征在于包括以下步骤:A、稳态数据筛选的初始化处理,对需要进行稳态工况数据筛选的数据段进行数据滤波,选取长度为n的存储空间作为滑动窗口,所述存储空间为判断所述过程数据段稳定的最小单元,其中n表示所述滑动窗口中包含数据的个数,根据包含n个数据的滑动窗口中的单个数据允许偏差值α,计算所述滑动窗口中n个数据的标准偏差的阈值δy;计算数据段起始位置的n个数据的均值,作为滑动窗口均值的初值计算数据段起始位置的n个数据的标准差,作为滑动窗口标准差的初值σ1B、滑动窗口由数据起点向终点移动,每移动一次,会有一个新数据点进入滑动窗口,同时将原滑动窗口内数据的起始点舍弃,计算新的滑动窗口内数据的均值和标准差;C、将所述新的滑动窗口内所含n个数据的标准差与标准差阈值δy进行比较,若其小于所述标准差阈值δy,则将新加入的数据计入稳态数据;若其大于所述标准差阈值δy,对于新的滑动窗口,则新的滑动窗口内所含第n个数据赋0;若对于初始的滑动窗口其标准差大于所述标准差阈值δy,则初始的滑动窗口内所含n个数据全部赋0;设需要进行筛选的原始数据长度为N,则直至所述滑动窗口的起点移动至N-n+1后,筛选过程结束;D、对所选稳态数据段两端的数据进行剔除,提高数据稳态值的计算准确度。2.根据权利要求1所述的快速筛选大规模过程数据中的稳态工况数据的方法,其特征在于:步骤A中,标准差的阈值δy的计算方法为,3.根据权利要求2所述的快速筛选大规模过程数据中的稳态工况数据的方法,其特征在于:步骤A中,滑动窗口均值的初值的计算方法为,4.根据权利要求3所述的快速筛选大规模过程数据中的稳态工况数据的方法,其特征在于:步骤A中,滑动窗口标准差的初值σ1的计算方法为,其中,diff1为初始时刻的方差。5.根据权利要求4所述的快速筛选大规模过程数据中的稳态工况数据的方法,其特征在于:步骤B中,新的滑动窗口内数据均值的计算方法为,设此时滑动窗口起点所处位置为k,此时窗口内数据的均值为则有当滑动窗口移动至k+1时刻时,新的滑动窗口内n个数据的均值为,6.根据权利要求5所述的快速筛选大规模过程数据中的稳态工况数据的方法,其特征在于:步骤B中,新的滑动窗口内数据标准差的计算方法为,k时刻的方差diff值为,则有对公式(6)进行展开可得如下公式,
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。