一种用于系统辨识的数据分段方法和数据评价方法技术方案

技术编号:39839156 阅读:9 留言:0更新日期:2023-12-29 16:25
本发明专利技术公开了一种用于系统辨识的数据分段方法和数据评价方法,数据分段方法包括采集待进行系统辨识的回路的区间历史数据,对历史数据进行预处理;计算历史数据中的变化点和变化量指标,并基于确定的变化点采用回归树结构对历史数据进行初步分段;对初步分段后的数据段构造子集进行变化检测从而确定最终保留数据段,评价方法包括基于

【技术实现步骤摘要】
一种用于系统辨识的数据分段方法和数据评价方法


[0001]本专利技术涉及一种控制系统的数据处理领域,具体涉及一种用于系统辨识的数据分段方法和数据评价方法


技术介绍

[0002]在流程工业中,往往使用装置的历史运行数据进行系统辨识

但是运行装置的历史数据往往是平稳的

没有太多变化的,这样的历史数据其实不太适合用于系统辨识,得出一个正确的模型的前提条件就是需要充分激励的数据

在数据量很大的情况,人工选取数据段就变得不太可行,并且人工选取极大地降低了工作效率

因此历史数据的自动分段及自动选取的技术是系统辨识领域中非常重要和值得去研究的关键技术

[0003]专利申请号为
US13890818
的美国专利技术专利,提出了一种应用于多变量过程控制系统辨识的数据自动选取的方法

该专利较为系统的总结了自动筛选数据的方法,包括异常数据的标记及处理方法

形成数据分段的方法

数据段质量评价方法等

在数据分段中,该专利主要考虑的一些异常数据,例如缺失值

超限值等,但是对于长时间稳态数据并没有进行有效处理,只是将闭环回路中的设定值长期不变的数据进行了剔除;在判断坏的数据段是否要剔除时,该专利采用构造多入单出
(MISO)
回路进行子空间辨识的方法,但是该方法在坏的数据段过多时,需要辨识很多次
MISO
回路子空间模型,计算量很大

[0004]专利申请号为
CN202010629595.2
的中国专利技术专利,提出了正常运行数据与系统辨识的控制回路性能评价方法,除了从历史数据中选取辨识数据的方法,并提出了评估历史数据辨识品质的方法

在该专利中,预处理只是简单剔除异常数据;在选取辨识质量较好的数据段时,采用判断回路是否震荡的方法

根据
Fisher
信息矩阵条件数来筛选数据段

在此专利提出的技术方案中,并没有对长时间稳态的数据进行处理,判断数据辨识质量时,也只是直接对数据直接进行处理和评价,并没有结合系统辨识的方法

[0005]在已发表论文
(DOI

10.1515/auto

2019

0055)
中提出了一种数据筛选系统

该系统利用累积和
(CUSUM)
算法来计算数据段的起点,然后用变化检测的方法计算该段数据的终点;在将原始数据变为分段数据之后,每段数据都可以计算出辨识模型参数,然后根据模型参数构造价值函数,将所有价值函数的和最小化就得到最后的辨识模型参数

该方法在进行数据分段时会导致数据分段过多,不利于后续进行系统辨识,并且稳态段被全部剔除,对辨识结果的准确性有一定影响


技术实现思路

[0006]本专利技术为了克服以上技术的不足,提供了一种用于系统辨识的数据分段方法和数据评价方法,通过计算流程工业过程的历史数据的变化点和变化量指标进行数据自动分段,通过构造子集选取适合用于系统辨识的数据段,在对异常值进行处理的基础上剔除较长时间的稳态段,在保证辨识准确度的前提下减少辨识输入的数据量,提高辨识效率

[0007]本专利技术克服其技术问题所采用的技术方案是:本专利技术的第一个方面提出了一种用
于系统辨识的数据分段方法,包括:采集待进行系统辨识的回路的区间历史数据,对历史数据进行预处理;计算历史数据中的变化点和变化量指标,并基于确定的变化点采用回归树结构对历史数据进行初步分段;对初步分段后的数据段构造子集进行变化检测从而确定最终保留数据段

[0008]进一步的,所述对历史数据进行预处理,具体包括:对历史数据的输入数据和输出数据分别进行滑动均值滤波

[0009]采用滑动均值滤波对历史数据进行处理,使计算变化量指标时得到的数据更加稳定,便于计算

[0010]进一步的,所述计算历史数据中的变化点和变化量指标具体包括:预设数据段分段之后的长度的上限值和下限值;计算所有数据点在数据段中的相对位置;根据相对位置的累加和,基于假设检验的方法确定数据段中是否为变化点

[0011]通过设置数据长度的上下限阈值,结合回归树结构基于变化点对数据进行初步自动分段

采用非参数化方法计算变化量指标,无需额外参数输入,通用性强

[0012]进一步的,所述基于确定的变化点采用回归树结构对历史数据进行初步分段,具体包括:若历史数据段中没有变化点且历史数据段的数据长度小于上限值,则不继续分段;若历史数据段中没有变化点且历史数据段的数据长度大于上限值,则设定该段数据的初始点
+
下限值位置的数据点为该段数据的分段点;若数据段中有变化点,则将变化点作为初步分段点,并判断分段之后的两段数据是否满足长度的上限值和下限值区间,若分段之后的两段数据不满足长度的上限值和下限值区间,则调整分段点位置;对分段后的两段数据分别基于假设检验的方法确定数据段中是否有变化点,并再次基于变化点分段,形成回归树结构,直至分段后的数据长度满足上限值和下限值区间

[0013]进一步的,所述若分段之后的两段数据不满足长度的上限值和下限值区间,则调整分段点位置,具体包括:分段之后的数据分为第一数据段和第二数据段,若第一数据长度小于下限值,则初步分段点的位置调整使分段后的数据长度等于下限值,第二数据段的长度对应进行调整

[0014]进一步的,所述上限值大于等于下限值的2倍

[0015]进一步的,所述对初步分段后的数据段构造子集进行变化检测从而确定最终保留数据段,具体包括:对历史数据的输入数据段和输出数据段初步分段后的每一段数据构造子集进行变化检测;保留变化检测中有变化数据段;对输入数据段和输出数据段变化检测中得到的无变化数据段取交集,取交集后的数据段为需要剔除的数据,剩余数据段作为最终保留数据段

[0016]进一步的,所述初步分段后的每一段数据进行变化检测,具体包括:计算每一段数据中所有点的变化分数,其中每一个点的变化分数的计算包括如下步骤:基于每一个点的左端连续数据和右端连续数据分别构建左端子序列和右端子序列;将左端子序列和右端子序列分别拼接为一个
Hankel
矩阵;比较左端
Hankel
矩阵和右端
Hankel
矩阵的不相似度确定每一个点的变化分数;若每一段数据中的任意一个时间点的变化分数超过预设阈值,则该段数据为变化数据段,否则为无变化数据段

[0017]通过构造子集为
Hankel
矩阵来进行变化检测,从本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种用于系统辨识的数据分段方法,其特征在于,包括:采集待进行系统辨识的回路的区间历史数据,对历史数据进行预处理;计算历史数据中的变化点和变化量指标,并基于确定的变化点采用回归树结构对历史数据进行初步分段;对初步分段后的数据段构造子集进行变化检测从而确定最终保留数据段
。2.
根据权利要求1所述的用于系统辨识的数据分段方法,其特征在于,包括:所述对历史数据进行预处理,具体包括:对历史数据的输入数据和输出数据分别进行滑动均值滤波
。3.
根据权利要求1所述的用于系统辨识的数据分段方法,其特征在于,所述计算历史数据中的变化点和变化量指标具体包括:预设数据段分段之后的长度的上限值和下限值;计算所有数据点在数据段中的相对位置;根据相对位置的累加和,基于假设检验的方法确定数据段中是否为变化点
。4.
根据权利要求1所述的用于系统辨识的数据分段方法,其特征在于,所述基于确定的变化点采用回归树结构对历史数据进行初步分段,具体包括:若历史数据段中没有变化点且历史数据段的数据长度小于上限值,则不继续分段;若历史数据段中没有变化点且历史数据段的数据长度大于上限值,则设定该段数据的初始点
+
下限值位置的数据点为该段数据的分段点;若数据段中有变化点,则将变化点作为初步分段点,并判断分段之后的两段数据是否满足长度的上限值和下限值区间,若分段之后的两段数据不满足长度的上限值和下限值区间,则调整分段点位置;对分段后的两段数据分别基于假设检验的方法确定数据段中是否有变化点,并再次基于变化点分段,形成回归树结构,直至分段后的数据长度满足上限值和下限值区间
。5.
根据权利要求4所述的用于系统辨识的数据分段方法,其特征在于,所述若分段之后的两段数据不满足长度的上限值和下限值区间,则调整分段点位置,具体包括:分段之后的数据分为第一数据段和第二数据段,若第一数据长度小于下限值,则初步分段点的位置调整使分段后的数据长度等于下限值,第二数据段的长度对应进行调整
。6.
根据权利要求1‑5任一项所述的用于系统辨识的数据分段方法,其特征在于,所述上限值大于等于下限值的2倍
。7.
根据权利要求1所述的用于系统辨识的数据分段方法,其特征在于,所述对初步分段后的数据段构造子集...

【专利技术属性】
技术研发人员:吴庆尉杨励阳刘志勇高宇廷王家栋刘磊
申请(专利权)人:浙江中控技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1