一种工业现场时间序列数据的自动标注方法及系统技术方案

技术编号:39575775 阅读:11 留言:0更新日期:2023-12-03 19:27
本发明专利技术公开了一种工业现场时间序列数据的自动标注方法及系统,属于工业自动化技术领域,考虑到各工业现场时间序列数据如有错误类别标注会导致整体工业现场时间序列数据集的模型误差显著增大,单条工业现场时间序列数据的标注依赖于其它时间序列数据标注反馈出的信息,同时关注到工业现场时间序列数据的自相关特性,分别对待标注的各工业现场时间序列数据建立其

【技术实现步骤摘要】
一种工业现场时间序列数据的自动标注方法及系统


[0001]本专利技术属于工业自动化
,更具体地,涉及一种工业现场时间序列数据的自动标注方法及系统


技术介绍

[0002]工业自动化是指机器设备或生产过程在不需要人工直接干预的情况下,按预期的目标实现测量

操纵等信息处理和过程控制的统称,是
21
世纪现代制造领域中重要的技术之一

在纺织

包装

建材

造纸

汽车

电子

环保

钢铁

交通及水处理等领域,工业自动化技术涉及这些行业加工过程的单台设备

工段

生产线,甚至整个工厂,是现代工业的基础支撑技术

企业通过引进自动化技术,可实现提高生产效率

保证产品质量

节省人力成本和确保安全等目的

[0003]而工业现场时间序列数据的自动标注技术作为工业自动化的一个典型应用,依托人工智能等高新技术为工业自动化的发展注入了新的活力

而随着工业场景下传感器设备的大量化和多样化,“动态”数据时间序列
(
例如可穿戴设备
)
的收集迅速增长,如何高效准确地对多个传感器采集的向量时间序列数据进行自动标注变得越来越重要

[0004]但是当前大多数时间序列数据的自动标注方法往往只处理单个传感器所采集的标量时间序列,需要对每个传感器所采集的标量时间序列逐一进行标注,耗时较大,并且也并未关注多个传感器采集的向量时间序列数据的自相关模式
/
特征,准确率也较低,无法适用于多个传感器采集的向量时间序列数据的自动标注


技术实现思路

[0005]针对现有技术的以上缺陷或改进需求,本专利技术提供了一种工业现场时间序列数据的自动标注方法及系统,用以解决现有技术无法在工业现场的传感器较多的情况下,对工业现场时间序列数据进行准确自动标注的技术问题

[0006]为了实现上述目的,第一方面,本专利技术提供了一种工业现场时间序列数据的自动标注方法,包括:
[0007]分别对待标注的各工业现场时间序列数据建立其
MVAR
模型,进而得到其在给定类别下的条件概率分布;
[0008]将各工业现场时间序列数据在给定类别下的条件概率分布进行联立,得到所有工业现场时间序列数据的似然函数后,进行极大似然估计,得到每一个工业现场时间序列属于不同类别的概率,进而对该工业现场时间序列数据的类别进行标注;
[0009]其中,第
n
个工业现场时间序列数据为第
n
个加工过程中所有时刻下的传感器数据向量所构成的序列;每一时刻下的传感器数据向量为该时刻下加工流水线上所有传感器的采集数据所构成的向量

[0010]进一步优选地,对第
n
个工业现场时间序列数据建立的
MVAR
模型为:
[0011][0012]其中,表示在
t
时刻之前的历史数据为数据的条件下在
Y
n,t
出现的概率;
Y
n,t
为第
n
个工业现场时间序列数据中前
t
个时刻下的传感器数据向量所构成的序列;
K
为预设类别总数;
α
k
为在
t
时刻之前的历史数据为数据的条件下任意工业现场时间序列数据属于第
k
个类别的概率;
Φ
(
·
)
是均值为零且拥有单位协方差矩阵的高斯分布的多元累积分布函数;
Ω
k
为第
k
个类别所对应的
m
×
m
大小的系数矩阵;
p
k

MVAR
模型的预设阶次集合中的第
k
个阶次;均为
MVAR
模型的参数,
Θ
k
,0为
m
维系数向量,均为大小为
m
×
m
的系数矩阵;
m
为加工流水线上传感器的总数量

[0013]进一步优选地,第
n
个工业现场时间序列数据在给定类别下的条件概率分布为:
[0014][0015]其中,
Z
n

k
=1表示第
n
个工业现场时间序列数据属于第
k
个类别标签;
p

MVAR
模型预设阶次集合中的最大阶次;预设阶次集合中的最大阶次;
[0016]进一步优选地,所有工业现场时间序列数据的似然函数的对数表达式
log L
为:
[0017][0018]f
k
(e
n

k

t

Ω
k
)

p(Y
n

t
|Z
n

k
=1,
Y
n

t
‑1,


Y
n

t

p
)
[0019]其中,
N
为工业现场时间序列数据的总数量;
T
为加工过程的总时刻数

[0020]进一步优选地,进行极大似然估计的方法,包括以下步骤:
[0021]初始化
τ
n

k


Ω
k
;其中,
τ
n

k
为第
n
个工业现场时间序列数据属于第
k
个类别的概率;
n
=1,
...

N

[0022]在
E
步骤中:遍历
k
=1,
...

K
,若则将
τ
n

k
更新为1,否则,将
τ
n

k
更新为0;其中,
[0023]在
M
步骤中:
[0024]将
α
k
更新为
[0025]获取当
τ
n

k
=1时的所有
n...

【技术保护点】

【技术特征摘要】
1.
一种工业现场时间序列数据的自动标注方法,其特征在于,包括:分别对待标注的各工业现场时间序列数据建立其
MVAR
模型,进而得到其在给定类别下的条件概率分布;将各工业现场时间序列数据在给定类别下的条件概率分布进行联立,得到所有工业现场时间序列数据的似然函数后,进行极大似然估计,得到每一个工业现场时间序列属于不同类别的概率,进而对该工业现场时间序列数据的类别进行标注;其中,第
n
个工业现场时间序列数据为第
n
个加工过程中所有时刻下的传感器数据向量所构成的序列;每一时刻下的传感器数据向量为该时刻下加工流水线上所有传感器的采集数据所构成的向量
。2.
根据权利要求1所述的工业现场时间序列数据的自动标注方法,其特征在于,对第
n
个工业现场时间序列数据建立的
MVAR
模型为:其中,表示在
t
时刻之前的历史数据为数据的条件下在
Y
n,t
出现的概率;
Y
n,t
为第
n
个工业现场时间序列数据中前
t
个时刻下的传感器数据向量所构成的序列;
K
为预设类别总数;
α
k
为在
t
时刻之前的历史数据为数据的条件下任意工业现场时间序列数据属于第
k
个类别的概率;
Φ
(
·
)
是均值为零且拥有单位协方差矩阵的高斯分布的多元累积分布函数;
Ω
k
为第
k
个类别所对应的
m
×
m
大小的系数矩阵;
p
k

MVAR
模型的预设阶次集合中的第
k
个阶次;均为
MVAR
模型的参数,
Θ
k,0

m
维系数向量,均为大小为
m
×
m
的系数矩阵;
m
为加工流水线上传感器的总数量
。3.
根据权利要求2所述的工业现场时间序列数据的自动标注方法,其特征在于,第
n
个工业现场时间序列数据在给定类别下的条件概率分布为:其中,
Z
n,k
=1表示第
n
个工业现场时间序列数据属于第
k
个类别标签;
p

MVAR
模型预设阶次集合中的最大阶次;阶次集合中的最大阶次;
4.
根据权利要求3所述的工业现场时间序列数据的自动标注方法,其特征在于,所有工业现场时间序列数据的似然函数的对数表达式
log L
为:
f
k
(e
n,k,t
,
Ω
k
)

p(Y
n,t
|Z
n,k

1,Y
n,t
‑1,

,Y
n,t

p
)
其中,
N
为工业现场时间序列数据的总数量;
T
为加工过程的总时刻数
。5.
根据权利要求4所述的工业现场时间序列数据的自动标注方法,其特征在于,所述进行极大似然估计的方法,包括以下步骤:初始化
τ

【专利技术属性】
技术研发人员:岳作功王心怡杨璐遥
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1