System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及内燃机数据处理领域,具体涉及一种基于改进图偏差网络的内燃机异常数据识别修复方法。
技术介绍
1、动力机械保有量呈现直线式增长,作为主要动力装置之一,内燃机规模也在不断壮大。在日常使用和研究开发实验中,内燃机会产生大量的运行数据。在实际过程中,由于环境干扰等各种因素,难免会产生一些异常数据。这些异常数据是大数据分析和决策的主要障碍之一。因此,在如何有效地利用好海量的内燃机运行数据和充分发挥运行数据潜在价值问题中,异常运行数据识别和修复是十分重要的。
2、异常运行数据识别和修复的主要技术有基于规则处理、基于统计学处理和基于机器学习处理。基于规律处理方法,需要领域资深专家制定规则,然后判断运行数据是否异常,这种方法主要依赖专家的知识水平,并且耗时很长,不适合大数据的处理。基于统计学处理方法能够较好的处理好低维数据,但是对假设依赖严重。基于统计学处理方法不适合处理复杂的多维度的非线性内燃机系统运行数据。
3、根据数据的标签情况,基于机器学习处理方法主要包括有监督、半监督和无监督三种情况。面对海量的内燃机运行数据,只存在较少的异常运行数据。在海量的数据中寻找异常数据,这是非常困难的。因此,内燃机异常运行数据识别和修复中,基于有监督和半监督的机器学习方法的适用性不强。在无监督的机器学习方法中,主要是通过lstm和图神经网络等神经网络,通过学习正常数据等内在关系,然后通过判断生成的结果和实际结果的差异来进行异常数据识别,然后进行数据修复。但是lstm神经网络存在梯度爆炸和计算量大等问题。对于多维的内燃机系
4、综上所述,需要一种能够自动学习内燃机各运行数据特征维度的图结构,进行多维数据融合学习,异常数据识别和修复的方法。
技术实现思路
1、为了解决上述问题,本专利技术提出一种基于改进图偏差网络的内燃机异常数据识别修复方法,其特征在于,包括以下步骤:
2、步骤1:获取内燃机运行数据;
3、步骤2:内燃机运行数据预处理;
4、步骤3:构建改进的图偏差神经网络模型;
5、步骤4:输出异常数据位置标签和对应的逆归一化预测数据;
6、步骤5:异常数据修复。
7、进一步地,所述内燃机运行数据包括但不限于基本运行参数(发动机转速、扭矩、油门位置、空压比等)、温度数据(环境温度、进排气温度、冷却水温度、油温、机油温度、缸内最高燃烧温度等)、压力数据(环境压力、喷油压力、进气压力、缸内压力等)、性能数据(燃料消耗率等)、排放数据(氮氧化物(nox)、颗粒物等排放物的浓度等)和运行时间数据。
8、更进一步地,所述内燃机运行数据预处理包括:使用minmaxscaler对所述内燃机运行数据进行归一化处理;按照时间戳顺序将所述内燃机运行数据进行排列,得到内燃机时间序列运行数据。
9、更进一步地,所述的改进图偏差神经网络模型包括传感器嵌入层、图结构学习层、图注意力预测层和图偏差评分层;
10、传感器嵌入层:将每种数据特征维度都作为一个节点,用每个节点学习到一个embedding向量来表示节点特征,以多维方式捕捉节点行为背后的不同关系;
11、
12、式中, v i为第 i个节点的embedding向量, d表示提取节点的 d个特征, n为节点数。每个节点的embedding向量用于以下两个方面:(ⅰ)用于图结构学习,判断节点之间的相关性;(ⅱ)注意力系数学习,考虑不同节点之间的异质影响程度;
13、图结构学习层:以图形结构的形式来学习节点之间的关系,所述关系用有向图表示,用邻接矩阵 a表示所述有向图,其中从第一个节点到另一个节点的边缘表示第一个节点用于模拟第二个节点的行为。对于每个节点 i,其依赖的候选关系为。如果有先验信息, c i可以自定义;如果没有,那么 c i为除本身外的全集。计算cos距离来表示节点 i的embedding向量与其它节点之间的相似度,如式(2)、式(3)所示:
14、
15、
16、式中, e ji为节点 i和其它节点 j的相似度, a ji为节点的邻接矩阵,选取相似度前top-k个节点作为依赖节点; k值由用户根据所需的稀疏程度进行选择;
17、图注意力预测层:利用每个特征维度的过去行为和节点之间的图结构关系预测每个特征维度的预期行为;
18、图偏差评分层:基于所述图注意力预测层所预测的当前时刻每个特征维度的预期行为和实际行为,计算每个特征的异常分数,并将每个特征的异常分数合并为当前时间点的整体异常分数,根据整体异常分数来对运行数据进行异常判断。
19、更进一步地,所述的图注意力预测层为改进的多头门控图注意力预测层;在所述的多头门控图注意力预测层中,在时间 t时,利用大小为 w的滑动窗口对历史时间序列数据进行截取,即将 t时刻前 w时间长度的历史时间序列数据定义为改进图偏差神经网络模型的输入;
20、{x}^{(t)}:=[{s}^{(t-w)},{s}^{(t-w+1)},...,{s}^{(t-1)}](4)
21、式中, s (t-w)为 t-w时刻的特征维度的数据,模型的目标是预测当前 t时刻的特征维度数据 s (t);
22、多头门控图注意力预测层为多头图注意力网络加上学习门单元;多头图注意力网络的目的是聚集当前目标节点 i的自身和邻居信息来更新当前目标节点 i中的信息。多头图注意力网络是将单头图注意本文档来自技高网...
【技术保护点】
1.一种基于改进图偏差网络的内燃机异常数据识别修复方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于改进图偏差网络的内燃机异常数据识别修复方法,其特征在于,所述内燃机运行数据包括但不限于基本运行参数(发动机转速、扭矩、油门位置、空压比等)、温度数据(环境温度、进排气温度、冷却水温度、油温、机油温度、缸内最高燃烧温度等)、压力数据(环境压力、喷油压力、进气压力、缸内压力等)、性能数据(燃料消耗率等)、排放数据(氮氧化物(NOx)、颗粒物等排放物的浓度等)和运行时间数据。
3.根据权利要求1所述的一种基于改进图偏差网络的内燃机异常数据识别修复方法,其特征在于,所述内燃机运行数据预处理包括:使用MinMaxScaler对所述内燃机运行数据进行归一化处理;按照时间戳顺序将所述内燃机运行数据进行排列,得到内燃机时间序列运行数据。
4.根据权利要求1所述的一种基于改进图偏差网络的内燃机异常数据识别修复方法,其特征在于,所述的改进图偏差神经网络模型包括传感器嵌入层、图结构学习层、图注意力预测层和图偏差评分层;
5.根据权利要求4所
6.根据权利要求4所述的一种基于改进图偏差网络的内燃机异常数据识别修复方法,其特征在于,所述图偏差评分层的输入为所述多头门控图注意力预测层输出的t时刻的各个特征维度预测数值,即;所述图偏差评分层将t时刻的预测行为和观测到的实际行为进行比较,计算出t时刻的错误值Err:
7.根据权利要求1所述的一种基于改进图偏差网络的内燃机异常数据识别修复方法,其特征在于,在所述步骤4中,获取步骤3的输出异常位置标签和对应的预测数据,然后对所述预测数据进行逆归一化处理,得到对应的逆归一化预测数据。
8.根据权利要求1所述的一种基于改进图偏差网络的内燃机异常数据识别修复方法,其特征在于,在所述步骤5中,异常数据修复为根据所述步骤4输出的异常数据标签和对应的逆归一化预测数据,用所述对应的逆归一化预测数据在对应的异常数据位置进行替换。
9.根据权利要求4所述的一种基于改进图偏差网络的内燃机异常数据识别修复方法,其特征在于,对于所述改进的图偏差神经网络模型采用无监督学习方法进行端到端的训练,具体训练过程如下:
...【技术特征摘要】
1.一种基于改进图偏差网络的内燃机异常数据识别修复方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于改进图偏差网络的内燃机异常数据识别修复方法,其特征在于,所述内燃机运行数据包括但不限于基本运行参数(发动机转速、扭矩、油门位置、空压比等)、温度数据(环境温度、进排气温度、冷却水温度、油温、机油温度、缸内最高燃烧温度等)、压力数据(环境压力、喷油压力、进气压力、缸内压力等)、性能数据(燃料消耗率等)、排放数据(氮氧化物(nox)、颗粒物等排放物的浓度等)和运行时间数据。
3.根据权利要求1所述的一种基于改进图偏差网络的内燃机异常数据识别修复方法,其特征在于,所述内燃机运行数据预处理包括:使用minmaxscaler对所述内燃机运行数据进行归一化处理;按照时间戳顺序将所述内燃机运行数据进行排列,得到内燃机时间序列运行数据。
4.根据权利要求1所述的一种基于改进图偏差网络的内燃机异常数据识别修复方法,其特征在于,所述的改进图偏差神经网络模型包括传感器嵌入层、图结构学习层、图注意力预测层和图偏差评分层;
5.根据权利要求4所述的一种基于改进图偏差网络的内燃机异常数据识别修复方法,其特征在于,所述的图注意力预测层为改进的多头门控图注意力预测层;在...
【专利技术属性】
技术研发人员:黄豪中,黄海碧,何冠璋,卢华林,唐雷,
申请(专利权)人:广西大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。