基于自监督表征网络的异常时序序列检测方法及存储介质技术

技术编号:35863347 阅读:18 留言:0更新日期:2022-12-07 10:54
本发明专利技术的一种基于自监督表征网络的异常时序序列检测方法及存储介质,包括以下步骤,S1:抽取道路移动源OBD数据集,并预处理;S2:构建时序行驶工况数据集;将污染物NOx浓度和其他特征属性组成多维度的OBD工况时序数据集,按照时间戳整理出连续时间段的排放序列;S3:构建高排放浓度序列识别模型,具体为构建一种基于自监督表征网络的异常时序序列检测模型。本发明专利技术结合OBD数据集中多元车辆运行属性信息,避免了外界因素对监测环境的干扰,为获取真实排放状况数据提供了前提。同时,采用基于重构的方法划分高排放的和正常排放的序列的表征。解决同类的基于深度学习方法因行驶工况丰富多变、排放表征学习能力不足而造成的高排放源识别准确率低的问题。放源识别准确率低的问题。放源识别准确率低的问题。

【技术实现步骤摘要】
基于自监督表征网络的异常时序序列检测方法及存储介质


[0001]本专利技术涉及环境监测
,具体涉及一种基于自监督表征网络的异常时序序列检测方法。

技术介绍

[0002]随着国民经济水平的提升,机动车保有量逐年提高,随之而来的是尾气排放对城市空气质量构成了严重威胁。其中,数量占比较低的高排放类别移动源往往贡献了车辆排放总量的大部分。因此,实现对高排放移动源的精准识别与筛查是十分必要的,同时为相关治理政策的制定提供一定的依据。
[0003]现有的高排放源筛查手段主要依赖于车辆年检站,即规定每半年或一年的检测周期内,要求车辆通过安装有固定尾气排放监测装置的路段,然后与固定的排放标准进行比较,最后判定车辆的排放类别。例如遥感检测装置,虽然它可以在不干扰道路车辆正常行驶的情况下同时对多个车辆进行检测,但是其监测的瞬时结果对外界因素(如风速、温度、空气湿度等)的影响十分敏感。同时,考虑到周期性检测成本高、耗时长,因而不能频繁进行检测,增加了检测结果的随机性和偶然性。
[0004]车载诊断系统(On

Board Diagnostic,OBD)是一种车载式运行监测装置,它可以实时监测发动机运行状态和尾气排放等数据。因其具有移动便捷、成本低廉、体积小巧等特点,近些年逐渐应用到车辆排放检测中。相较于传统的排放检测装置,OBD能够在不受环境因素影响的条件下连续时间记录车辆的尾气排放和发动机参数等数据特征,很大程度上避免了瞬时检测结果带来的不确定性,为高排放道路移动源的准确识别与筛查提供了更加稳定的数据基础。

技术实现思路

[0005]鉴于以上实际问题和技术背景,本专利技术采用数据驱动的方法,利用OBD数据的NOx排放浓度、发动机转速和实际输出扭矩等信息,提出了一种基于自监督表征网络的异常时序序列检测方法。具体地,实现对时序状态下车辆高排放浓度序列的准确识别,需要解决因行驶工况丰富多变导致的排放浓度序列间的差异问题:(1)正常与正常排放浓度序列之间差异性较大;(2)正常与异常排放浓度序列之间相似性较大,可用于时序行驶工况下高排放道路移动源的识别与筛查。
[0006]为实现上述目的,本专利技术采用了以下技术方案:
[0007]一种基于自监督表征网络的异常时序序列检测方法,包括以下步骤,S1:抽取道路移动源OBD数据集,并预处理;
[0008]S2:构建时序行驶工况数据集;将污染物NOx浓度和其他特征属性组成多维度的OBD工况时序数据集,按照时间戳整理出连续时间段的排放序列;
[0009]S3:构建高排放浓度序列识别模型,具体为构建一种基于自监督表征网络的异常时序序列检测模型。
[0010]进一步的,步骤S1中具体包括采集数辆机动车多日连续时间段内的车载诊断系统实时监测数据,其中包含时间戳、后处理下游NOx值、发动机转速、实际输出扭矩百分比、油门踏板开度、发动机瞬时喷油量、发动机瞬时燃油消耗率、经纬度这些特征属性;
[0011]上述步骤S1中预处理具体细分为如下步骤:
[0012]S11:对于抽取得到的车辆OBD数据集中存在的空值,删除其所对应的整行数据;
[0013]S12:根据车辆实际排放状况将数个OBD数据集人为划分为“正常排放”和“高排放”标签;
[0014]S13:对数据集使用归一化处理,表达为:
[0015][0016]其中,x
i
表示真实值,表示x
i
的归一化值,x
max
和x
min
分别为当前属性中的最大值和最小值。
[0017]进一步的,所述上述步骤S2具体细分为如下步骤:
[0018]S21:考虑一个经步骤S1处理得到的车辆排放特征数据集其中的x
(i)
∈R
m
是一个包含m维特征的向量,该数据集根据时间戳被划分为时间步长为l的排放序列集合X={X1,X2,

,X
N
},其中,X
i
∈R
l
×
m
表示一个二维矩阵。
[0019]进一步的,上述步骤S3具体细分为如下步骤:
[0020]S31:编码;根据车辆排放输入序列x的维度,经过编码器映射后得到编码向量z;
[0021]S32:自监督学习模块;
[0022]S33:表征记忆模块,通过记录原型模式来增强模型区分正常和异常数据的能力;
[0023]S34:解码;车辆排放输入序列x经过一系列重构后,需要进行解码器Decoder进行解码得到原始维度空间下的输出序列x


[0024]S35:模型的训练和预测;
[0025]S36:模型分类性能评估。
[0026]进一步的,步骤S311的编码过程被表示为:
[0027]z=f
e
(x;θ
e
)(19)
[0028]其中,f
e
表示编码器Encoder的映射函数,θ
e
表示编码器内部所有的参数。
[0029]进一步的,步骤S32具体包括:
[0030]S321:以下六种信号变换来增加源数据集的表征数量,具体描述如下:
[0031]以时序排放序列T=[t1,t2,...,t
n
]为例:
[0032](7)噪声;加入了高斯噪声的变换;
[0033](8)反向;这种变换使样本沿着时间维度反向,从而得到时间方向相反的样本T
op

[0034]T
op
=[t
n
,...,t2,t1](20)
[0035](9)置换:这种变换通过对不同的时间窗口进行切片和交换,假设切片长度为2,使信号沿时间维度随机扰动,增强所得模型的置换不变性质,生成新的样本T
pe

[0036]T
pe
=[...,t1,t2,....,t
n

l
,t
n

l+1
,....](l<n)(21)
[0037](10)缩放:通过乘以一个随机标量来改变一个时间窗口内信号的大小;缩放信号T
sc
的添加可以帮助模型学习缩放不变模式,被表示为:
[0038]T
sc
=[t1×
s,t2×
s,...,t
n
×
s],s∈S(22)
[0039](11)否定:按

1缩放,得到输入信号的镜像序列T
ne

[0040]T
ne
=[

t1,

t2,...,

t
n
](23)
[0041](12)平滑:应用Savitzk本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自监督表征网络的异常时序序列检测方法,其特征在于,包括以下步骤,S1:抽取道路移动源OBD数据集,并预处理;S2:构建时序行驶工况数据集;将污染物NOx浓度和其他特征属性组成多维度的OBD工况时序数据集,按照时间戳整理出连续时间段的排放序列;S3:构建高排放浓度序列识别模型,具体为构建一种基于自监督表征网络的异常时序序列检测模型。2.根据权利要求1所述的基于自监督表征网络的异常时序序列检测方法,其特征在于:步骤S1中具体包括采集数辆机动车多日连续时间段内的车载诊断系统实时监测数据,其中包含时间戳、后处理下游NOx值、发动机转速、实际输出扭矩百分比、油门踏板开度、发动机瞬时喷油量、发动机瞬时燃油消耗率、经纬度这些特征属性;上述步骤S1中预处理具体细分为如下步骤:S11:对于抽取得到的车辆OBD数据集中存在的空值,删除其所对应的整行数据;S12:根据车辆实际排放状况将数个OBD数据集人为划分为“正常排放”和“高排放”标签;S13:对数据集使用归一化处理,表达为:其中,x
i
表示真实值,表示x
i
的归一化值,x
max
和x
min
分别为当前属性中的最大值和最小值。3.根据权利要求2所述的基于自监督表征网络的异常时序序列检测方法,其特征在于:所述上述步骤S2具体细分为如下步骤:S21:考虑一个经步骤S1处理得到的车辆排放特征数据集其中的x
(i)
∈R
m
是一个包含m维特征的向量,该数据集根据时间戳被划分为时间步长为l的排放序列集合X={X1,X2,

,X
N
},其中,X
i
∈R
l
×
m
表示一个二维矩阵。4.根据权利要求3所述的基于自监督表征网络的异常时序序列检测方法,其特征在于:上述步骤S3具体细分为如下步骤:S31:编码;根据车辆排放输入序列x的维度,经过编码器映射后得到编码向量z;S32:自监督学习模块;S33:表征记忆模块,通过记录原型模式来增强模型区分正常和异常数据的能力;S34:解码;车辆排放输入序列x经过一系列重构后,需要进行解码器Decoder进行解码得到原始维度空间下的输出序列x

;S35:模型的训练和预测;S36:模型分类性能评估。5.根据权利要求4所述的基于自监督表征网络的异常时序序列检测方法,其特征在于:步骤S311的编码过程被表示为:z=f
e
(x;θ
e
)(2)其中,f
e
表示编码器Encoder的映射函数,θ
e
表示编码器内部所有的参数。6.根据权利要求5所述的基于自监督表征网络的异常时序序列检测方法,其特征在于:
步骤S32具体包括:S321:以下六种信号变换来增加源数据集的表征数量,具体描述如下:以时序排放序列T=[t1,t2,...,t
n
]为例:(1)噪声;加入了高斯噪声的变换;(2)反向;这种变换使样本沿着时间维度反向,从而得到时间方向相反的样本T
op
:T
op
=[t
n
,...,t2,t1](3)(3)置换:这种变换通过对不同的时间窗口进行切片和交换,假设切片长度为2,使信号沿时间维度随机扰动,增强所得模型的置换不变性质,生成新的样本T
pe
:T
pe
=[...,t1,t2,....,t
n

l
,t
n

l+1
,....](l<n)(4)(4)缩放:通过乘以一个随机标量来改变一个时间窗口内信号的大小;缩放信号T
sc
的添加可以帮助模型学习缩放不变模式,被表示为:T
sc
=[t1×
s,t2×
s,...,t
n
×
s],s∈S(5)(5)否定:按

1缩放,得到输入信号的镜像序列T
ne
:T
ne
=[

t1,

t2,...,

t
n...

【专利技术属性】
技术研发人员:许镇义王仁军康宇曹洋
申请(专利权)人:合肥综合性国家科学中心人工智能研究院安徽省人工智能实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1