一种基于海量数据挖掘的设备状态预测方法技术

技术编号:8532837 阅读:226 留言:0更新日期:2013-04-04 15:51
本发明专利技术属于基于工业设备海量数据的数据挖掘领域,提供一种设备状态预测方法,该方法从历史数据中充分挖掘有用知识,结合设备实时情况对设备状态进行的有效的预测,能在较低开销下以较高的效率完成知识学习,并且实时的给出设备状态的预测与诊断结果,为企业实现大型设备的状态监测、预警诊断等起到良好的作用。

【技术实现步骤摘要】

本专利技术属于基于工业设备海量数据的数据挖掘领域,特别是涉及一种基于海量数据挖掘的设备状态预测算法。
技术介绍
现代大型工业企业的发展离不开设备。这些设备稳定、持续的运行与企业的利益息息相关,它们的故障甚至是异常停机将给企业带来难以想象的重大损失。因此在其运行过程中,提前发现可能的故障并加以预防和排除非常重要。对此有一些传统方法,如定期的人工巡视、设备停工进行例行检查等。这些传统方法有几个问题1.定期的检测需要耗费大量的人力、物力,效率很低2.对一些不必要的设备也进行了检测,造成资源的浪费3.停机检测可能会带来巨大的经济上的损失。在这样的背景下,企业对设备状态预警方面的需求日益突出。近年来设备状态预警技术逐渐进入人们的视野,该技术是利用现代传感技术和计算机技术对运行中的设备进行监测,获取反映运行状态的各种数据值,并对其进行分析处理,预测运行状况,在必要时提供报警和故障诊断信息,避免因故障的进一步扩大而导致事故的发生,为状态检修提供实时数据。状态预警技术在很多领域,如电力、医学、航空、核工业等都有着深刻而广阔的应用前景。本专利技术立足设备状态预警技术,实现了一种基于工业设备海量数据的设备状态预测算法。
技术实现思路
本专利技术的目的是提供一种设备状态预测方法,该方法从历史数据中充分挖掘有用知识,结合设备实时情况对设备状态进行的有效的预测。本专利技术的技术方案为包括阶段一学习算法;阶段二 预测算法; 所述阶段一学习算法包括步骤如下反映设备历史运行状态的数据样本作为训练数据圯,聚类结果的类集合为 C,其中,■■■,*}, O, =( ■■■,O*.-> I ,I < k < H , V* 为数据集11中向量0I的第fc维参数的值,n为每个数据向量的维度;步骤I [初始化]:C = ·,读入第一个训练数据向量并对其标准化,记录结果为O1,生成初始聚类G,并记录 upper limit 和 lower limit , C = {C^ ;步骤2 [处理新数据向量]:读入一个新的训练数据向量并对其标准化,记录结果为O2 ,如果3C』eC,使得= O ,那么转至步骤3,否则转至步骤4 ;步骤3[ Of并入C』—]:q—同时更新Cj的参数,现有的类总个数不变;步骤4[七自成一类]:由=其中n为聚类结果集中聚类的个数;步骤5 :所有历史训练数据向量都已经处理完,则阶段一终止;否则,返回步骤2 ;阶段二 预测算法包括如下步骤步骤6 [初始化]:1=d ;步骤7[计算距离]:计算向量0与聚类结果集C = Cj中聚类的距离,若4 二 O,转至步骤9 ;若i ,转至步骤8 ;否则,令i = i+Ι,转至步骤7 ;步骤8[寻找最近距离]:从距离集合= …》rfj中找到一个< 使得^为集合 d中的最小值;步骤9 [确定相似模型]:根据4确定聚类模型在聚类结果集中的序号为i,即相似的聚类模型为Ci ;步骤10 [计算预测向量]:根据聚类模型Ci得到向量0的预测向量。根据阶段一学习算法设定预测向量安全范围。本专利技术方法的有益效果是,能在较低开销下以较高的效率完成知识学习,并且实时的给出设备状态的预测与诊断结果,为企业实现大型设备的状态监测、预警诊断等起到良好的作用。附图说明图1是算法模拟实际应用模型。图2是初始类Ci的第Jt维分量的可吸收范围示意图。图3是聚类《^经过扩展后的第Jfc维分量的可吸收范围示意图。 图4是实时数据向量0各难度与类模型Ci计算距离示意图。图5是实时数据向量| 通过相似类模型C1-确定各维度预测值示意图。具体实施方式下面结合附图详细说明本专利技术的优选实施例。算法的实现分为两大步骤,一是利用设备运行的历史数据建立起设备运行状态模型,这一步通过聚类算法实现;二是利用经过聚类得到的设备状态模型,结合设备运行的实时状态数据对当前运行状态进行回归预测。在此之后再结合一些报警规则实现设备的在线实时预警,算法的整体应用模型如附图1所示。算法步骤一学习算法。该算法将反映设备历史运行状态的数据样本作为训练数据集,依次读入训练集中的数据向量(Data Vector),根据训练集的最大值、最小值向量将其标准化,然后确定其所在的类(或者属于某个当前已有类,或者自成一个新的类),直到所有数据向量被扫描一遍,聚类过程结束。这样的处理过程避免了需要把所有数据一次性全部读入内存而后才能进行聚类的弊端,是凝聚型层次聚类算法的一种改进方法。该算法思想的实现过程如下假定数据向量训练集经标准化后为D…聚类结果的类集合为G,其中,Vi= {KX O1 = {αΛ,... ,Oa OxI κ > I J < fc < * , 为数据集U 中向量 % 的第 fc维参数的值。Η为每个数据向量的维度。步骤I [初始化].C =伞,读入第一个训练数据向量并对其标准化,记录结果为 ι,生成初始聚类C1,并记录upper limit和lower limit , C = (1 ,生成过程的示意图如附图2所示;步骤2 [处理新数据向量].读入一个新的训练数据向量并对其标准化,记录结果为O2 ,如果BCj. eC ,使彳= O ,那么转至步骤3,否则转至步骤;/* flfisteniceCOiXy表示向量 与某个类£;各个维度的欧式距离之和,如果β的每个维度分量值都在类G对应的分量值范围内(包括扩展和扰动范围),那么步骤3[ Of-并入C』].Ci=CjU0f,同时更新Cj的参数,现有的类总个数不变;步骤4[七自成一类]., C = CuCim1其中η为聚类结果集中聚类的个数;/*此时,C中类的总个数要加I*/步骤5.若所有历史训练数据向量都已经处理完,则算法终止,终止后的训练结果示意图如附图3所示;否则,返回步骤步骤2。算法步骤二预测算法。按照学习算法的聚类结果,每个类代表了设备运行过程中的一种正常状态 ,当异常的实时数据输入时,将无法把它合并到任何一个正常类中。基于历史训练数据集的完整性,算法结果正确性,正常的设备状态必定落在学习算法聚类结果中的某个类中。如果测得的实时数据向量正常,根据其相似的聚类模型得到的预测值必定与其自身相差不大,而若实时数据向量异常,那么预测值与其相差会很明显。预测算法正是利用这种原理给出设备运行状态的实时情况。该算法思想的实现过程如下步骤I [初始化]. -0 ;步骤2[计算距离].计算向量O (该向量为接收到的实时的数据向量)与聚类结果集 C =中聚类的距离,计算距离的示意图如附图4所示,若《=0,转至步骤4;若 =1 ,转至步骤3 ;否则,令i =1-H ,转至步骤2 ;步骤3[寻找最近距离].从距离集合*# = {4,4,.-.<}中找到一个^使得《 力集合 d中的最小值;步骤4 [确定相似模型].根据沁确定聚类模型在聚类结果集中的序号为i,即相似的聚类模型为G;步骤5 [计算预测向量].根据聚类模型q得到向量·的预测向量,得到预测向量的示意图如附图5所示。根据阶段一学习算法设定预测向量安全范围。该安全范围可根据设备可靠性要求调整范围大小,并辅以超范围报警机制,即可更好实现大型设备的状态监测、预警诊断坐 寸ο本专利技术按照优选实施例进行了说明,应当理解,但上述实施例不以任何形式限定 本专利技术,凡本文档来自技高网...

【技术保护点】
一种基于海量数据挖掘的设备状态预测方法,其特征在于:包括阶段一:学习算法;阶段二:预测算法;所述阶段一:学习算法包括步骤如下:反映设备历史运行状态的数据样本作为训练数据集????????????????????????????????????????????????,聚类结果的类集合为,其中,为数据集中向量的第维参数的值,为每个数据向量的维度;步骤1[初始化]:,读入第一个训练数据向量并对其标准化,记录结果为,生成初始聚类,并记录upper?limit和lower?limit?,;步骤2[处理新数据向量]:读入一个新的训练数据向量并对其标准化,记录结果为,如果,使得,那么转至步骤3,否则转至步骤4;步骤3[并入]:,同时更新的参数,现有的类总个数不变;步骤4[自成一类]:由,其中n为聚类结果集中聚类的个数;步骤5:所有历史训练数据向量都已经处理完,则阶段一终止;否则,返回步骤2;阶段二:预测算法包括如下步骤:步骤6[初始化]:;步骤7[计算距离]:计算向量与聚类结果集中聚类的距离,若,转至步骤9;若,转至步骤8;否则,令,转至步骤7;步骤8[寻找最近距离]:从距离集合中找到一个,使得为集合中的最小值;步骤9[确定相似模型]:根据确定聚类模型在聚类结果集中的序号为,即相似的聚类模型为;步骤10[计算预测向量]:根据聚类模型得到向量的预测向量。dest_path_image001.jpg,587261dest_path_image002.jpg,dest_path_image003.jpg,737619dest_path_image004.jpg,dest_path_image005.jpg,4653dest_path_image006.jpg,dest_path_image007.jpg,16602dest_path_image008.jpg,dest_path_image009.jpg,482218dest_path_image010.jpg,dest_path_image011.jpg,551281dest_path_image012.jpg,dest_path_image013.jpg,367927dest_path_image014.jpg,dest_path_image015.jpg,104939dest_path_image006.jpg,441374dest_path_image016.jpg,dest_path_image017.jpg,933535dest_path_image016.jpg,909581dest_path_image006.jpg,450284dest_path_image018.jpg,dest_path_image019.jpg,906804dest_path_image020.jpg,dest_path_image021.jpg,304288dest_path_image022.jpg,dest_path_image023.jpg,846258dest_path_image024.jpg,dest_path_image025.jpg,987390dest_path_image026.jpg,dest_path_image027.jpg,485367dest_path_image027.jpg,807414dest_path_image028.jpg,23632dest_path_image027.jpg,dest_path_image029.jpg,968454dest_path_image030.jpg,320938dest_path_image030.jpg,76535dest_path_image021.jpg,dest_path_image031.jpg...

【技术特征摘要】
1.一种基于海量数据挖掘的设备状态预测方法,其特征在于包括阶段一学习算法;阶段二 预测算法; 所述阶段一学习算法包括步骤如下 反映设备历史运行状态的数据样本作为训练数据集B = .,.,Oj ,聚类结果的类集合为 C,其中,Vl={1,2, o, = ( ,...OmX为数据集U中向量的第fc维参数的值为每个数据向量的维度; 步骤I [初始化]:C = # ,读入第一个训练数据向量并对其标准化,记录结果为O1,生成初始聚类^ ,并记录 upper limit 和 lower limit , C = {(^ ; 步骤2[处理新数据向量]:读入一个新的训练数据向量并对其标准化,记录结果为O2,如果彐Cj- e C,使得 dis Ibd Csfoi^Cj)= O,那么转至步骤3,否则转至步骤4 ; 步骤3 =Cjf = CjUOl,同时更...

【专利技术属性】
技术研发人员:唐胜胡洁
申请(专利权)人:国家电网公司江苏瑞中数据股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1