基于连续型工业数据的稀疏贝叶斯网络增量式学习方法技术

技术编号:20076059 阅读:34 留言:0更新日期:2019-01-15 00:55
本发明专利技术公开一种基于连续型工业数据的稀疏贝叶斯网络增量式学习方法。所述基于连续型工业数据的稀疏贝叶斯网络增量式学习方法包括:步骤1,数据预处理:将训练样本进行正则化等预处理,保证均值为0、方差为1;步骤2,结构学习:基于滑动窗口,采用批样本的形式进行结构的增量式学习;步骤3,参数学习:利用结构学习得到的关系系数矩阵以及正则化样本获得当前状态下每一个特征的混合高斯分布的均值和方差,即连续型贝叶斯网络参数;步骤4,网络更新:对新到来的样本,利用总体样本的正则化参数进行预处理,利用滑动窗口形成同样规模的批样本进行结构以及参数的更新。

Sparse Bayesian Network Incremental Learning Method Based on Continuous Industrial Data

The invention discloses a sparse Bayesian network incremental learning method based on continuous industrial data. The incremental learning method of sparse Bayesian network based on continuous industrial data includes: step 1, data preprocessing: regularization of training samples to ensure that the mean value and variance are 0 and 1; step 2, structure learning: incremental learning of structure by batch samples based on sliding windows; step 3, parameter learning: learning by structure learning Relational coefficient matrix and regularized samples are used to obtain the mean and variance of each feature in the current state, i.e. continuous Bayesian network parameters. Step 4, network updating: For new samples, the regularized parameters of the whole sample are used to preprocess, and the sliding window is used to form batch samples of the same size for structure and parameter updating.

【技术实现步骤摘要】
基于连续型工业数据的稀疏贝叶斯网络增量式学习方法
本专利技术属于计算机应用
,具体的涉及一种基于连续型工业数据的稀疏贝叶斯网络增量式学习方法。
技术介绍
随着我国工业技术的发展,越来越多现代化的工业设备投入到实际生产当中,为国家和社会创造了巨大的经济价值。但是随着工业设备的更新换代,虽然解放了大量人工劳动,但是也为整套工业流程的监控带来了不小的困难。虽然当前实现了很多大型工业设备的自动化,但是设备的正常运转仍然需要人们不断进行调控。由于设备的复杂性,当设备出现部件异常情况,需要对运行流程熟记于心、经验丰富的工人才能进行故障追溯。因此通过复杂的工业设备数据,从数据中学习到设备内部各个部件之间的依赖关系,并对异常数据源进行精准定位,是一个非常值得研究的方向。贝叶斯网络是一个完整的关于变量和变量间关系的模型,通过建立变量之间的概率模型,提供变量之间的依赖关系并从数据中挖掘隐含的因果关系,因此可以用来解答各种有关变量的概率问题。并且,贝叶斯网络拥有极强的有逻辑、易理解地处理不确定性问题的能力,还可以基于不确定的信息进行推理,因此它在数据挖掘领域有着广泛的应用。一个贝叶斯网络主要包含两个部分:网络结构和网络参数,其中网络结构是一个有向无环图,表示变量之间的依赖关系,而网络参数表示变量相对于其父节点的概率分布。对于离散型变量的贝叶斯网络学习已经有了比较成熟的方法,常用的方法有基于约束的方法和基于评分函数的方法,在此基础上对图空间进行贪婪或者启发式的搜索,在获得的最优结构上进行参数学习,为每一个变量维护一个条件概率表。但是,这些方法对于特征较多的数据需要大量的时间开销。而在工业数据中,一个设备的参数往往较多,并且数据常为连续型数据。同时,对于某些特殊设备,设备参数之间的依赖关系往往会随着时间变化而变化。基于以上事实,我们提出了一种基于连续型数据的贝叶斯网络增量式学习方法。
技术实现思路
针对于上述现有技术的不足,本专利技术的目的在于提供一种基于连续型工业数据的稀疏贝叶斯网络增量式学习方法,旨在根据大型工业设备运行状态参数建立当前运行状态下各个参数之间的依赖关系以及相关概率模型,直观展示参数之间的因果关系,并可以进一步对异常数据进行异常源追溯,有效减少人工对于设备参数的调控。为达成上述目的,本专利技术采用如下技术方案:一种基于连续型工业数据的稀疏贝叶斯网络增量式学习方法包括:步骤1,数据预处理:将训练样本进行正则化等预处理,保证均值为0、方差为1;步骤2,结构学习:基于滑动窗口,采用批样本的形式进行结构的增量式学习;步骤3,参数学习:利用结构学习得到的关系系数矩阵以及正则化样本获得当前状态下每一个特征的混合高斯分布的均值和方差,即连续型贝叶斯网络参数;步骤4,网络更新:对新到来的样本,利用总体样本的正则化参数进行预处理,利用滑动窗口形成同样规模的批样本进行结构以及参数的更新。优选地,步骤1具体包括如下步骤;步骤1.1:剔除原始数据中的异常数据;步骤1.2:将原始样本进行总体的正则化,并记录总体样本的均值和方差的正则化参数信息。优选地,步骤2具体包括如下步骤:步骤2.1:首先按照滑动窗口的大小,将原始大规模样本分割成若干个相互部分重叠的训练批样本;步骤2.2:初始化与样本量和维度有关的惩罚项等参数,调控网络结构的稀疏度;步骤2.3:利用稀疏贝叶斯网络算法,依次对每一个节点进行父节点的搜索,并加入广度优先搜索方法避免生成环路。经过若干次迭代,父节点及其对应关系系数矩阵趋于稳定,获得当前数据下的网络结构;步骤2.4:移动滑动窗口,将步骤2.2和步骤2.3中生成的网络结构和关系系数矩阵作为初始状态进行结构微调。优选地,步骤3具体计算过程如下:步骤3.1:根据结构学习得到的关系系数矩阵获得每一个节点针对父节点的混合高斯分布的均值;步骤3.2:计算任意父节点组合的协方差;步骤3.3:将父节点组合的关系系数作为权值,累加协方差获得混合高斯分布的方差。优选地,步骤4具体包括如下步骤:步骤4.1:利用总体样本的均值和方差对新样本进行正则化预处理;步骤4.2:根据时序关系将新样本和部分全样本组成新的窗口,在原始网络基础上进行结构和参数的更新。相较于现有技术,本专利技术提供的技术方案具有如下有益效果:所述基于连续型数据的稀疏贝叶斯网络增量学习方法有别于大多数基于离散型数据的贝叶斯网络学习算法,本专利技术利用混合高斯分布替代简单的条件概率表,能够更好得适应现实世界复杂的工业数据。并且,常见贝叶斯网络学习算法都需要先寻找候选父节点,在搜索过程中会遗漏正确的父节点,而本专利技术不需要寻找候选父节点,从而消除前一类方法的弊端。最后,本专利技术提出的增量式学习方法,不仅能够在大样本数据上加快收敛速度,还能够处理存在部分概念漂移的流数据,随着时间不断自动更新结构。基于以上内容,本专利技术能够解决工业上数据量过大以及流数据更新的问题,更好得满足了连续型海量工业数据因果分析和异常追溯的需求。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本专利技术的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1本专利技术实施的基于连续型工业数据的稀疏贝叶斯网络增量式学习技术总体流程图;图2本专利技术实施的基于连续型工业数据的稀疏贝叶斯网络增量式学习技术详细流程图;图3本专利技术实施的基于连续型工业数据的稀疏贝叶斯网络增量式学习技术得到的贝叶斯网络结构图。具体实施方式为了使本专利技术所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。本专利技术的权利要求书、说明书及上述附图中,除非另有明确限定,如使用术语“第一”、“第二”或“第三”等,都是为了区别不同对象,而不是用于描述特定顺序。本专利技术的权利要求书、说明书及上述附图中,除非另有明确限定,对于方位词,如使用术语“中心”、“横向”、“纵向”、“水平”、“垂直”、“顶”、“底”、“内”、“外”、“上”、“下”、“前”、“后”、“左”、“右”、“顺时针”、“逆时针”等指示方位或位置关系乃基于附图所示的方位和位置关系,且仅是为了便于叙述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位或以特定的方位构造和操作,所以也不能理解为限制本专利技术的具体保护范围。本专利技术的权利要求书、说明书及上述附图中,除非另有明确限定,如使用术语“固接”或“固定连接”,应作广义理解,即两者之间没有位移关系和相对转动关系的任何连接方式,也就是说包括不可拆卸地固定连接、可拆卸地固定连接、连为一体以及通过其他装置或元件固定连接。本专利技术的权利要求书、说明书及上述附图中,如使用术语“包括”、“具有”以及它们的变形,意图在于“包含但不限于”。如图1和图2所示,本专利技术提供的一种基于连续型工业数据的稀疏贝叶斯网络增量式学习技术,包括以下步骤:步骤1,数据预处理:将训练样本进行正则化等预处理,保证均值为0、方差为1。具体包括如下步骤:步骤1.1:根据先验知识对原始数据中的异常数据进行排除。异常数据是指设备非正常状态下的数据,例如停机状态或者故障状态下的数据,获得样本数据矩阵rawD,其大小为N×p;步骤1.2:对原始样本本文档来自技高网
...

【技术保护点】
1.一种基于连续型工业数据的稀疏贝叶斯网络增量式学习方法,其特征在于,包括:步骤1,数据预处理:将训练样本进行正则化等预处理,保证均值为0、方差为1;步骤2,结构学习:基于滑动窗口,采用批样本的形式进行结构的增量式学习;步骤3,参数学习:利用结构学习得到的关系系数矩阵以及正则化样本获得当前状态下每一个特征的混合高斯分布的均值和方差,即连续型贝叶斯网络参数;步骤4,网络更新:对新到来的样本,利用总体样本的正则化参数进行预处理,利用滑动窗口形成同样规模的批样本进行结构以及参数的更新。

【技术特征摘要】
1.一种基于连续型工业数据的稀疏贝叶斯网络增量式学习方法,其特征在于,包括:步骤1,数据预处理:将训练样本进行正则化等预处理,保证均值为0、方差为1;步骤2,结构学习:基于滑动窗口,采用批样本的形式进行结构的增量式学习;步骤3,参数学习:利用结构学习得到的关系系数矩阵以及正则化样本获得当前状态下每一个特征的混合高斯分布的均值和方差,即连续型贝叶斯网络参数;步骤4,网络更新:对新到来的样本,利用总体样本的正则化参数进行预处理,利用滑动窗口形成同样规模的批样本进行结构以及参数的更新。2.如权利要求1所述的一种基于连续型工业数据的稀疏贝叶斯网络增量式学习方法,其特征在于:步骤1具体包括如下步骤;步骤1.1:剔除原始数据中的异常数据;步骤1.2:将原始样本进行总体的正则化,并记录总体样本的均值和方差等正则化参数信息。3.如权利要求1所述的一种基于连续型工业数据的稀疏贝叶斯网络增量式学习方法,其特征在于:步骤2具体包括如下步骤:步骤2.1:首先按照滑动窗口的大小,将原始大规模样本分割成若干个相互部分重叠的训练批样本;步骤2.2:初始化与样本量和维度有关的惩罚...

【专利技术属性】
技术研发人员:周春蕾张友卫高阳张天诚帅云峰孙栓柱綦小龙李逗李春岩潘苗杨晨琛王其祥高进王明
申请(专利权)人:江苏方天电力技术有限公司南京大学国网江苏省电力有限公司国家电网公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1