一种基于大数据融合聚类分析的关联参数故障分类方法技术

技术编号:15640464 阅读:220 留言:0更新日期:2017-06-16 06:05
本发明专利技术提供的一种基于大数据融合聚类分析的关联参数故障分类方法,本发明专利技术的故障分类方法从装备运行的海量数据中,根据判读规则挑选故障数据,并进行有监督的机器自主聚类,形成关联参数故障自动分类结果,能够解决目前装备故障诊断过度依赖专家知识库,而忽略了各子系统间深度非线性耦合的参数之间的关联关系的问题,以及实际装备型号运行中海量有效数据没有获得很好的挖掘利用的问题;同时,由于本发明专利技术的故障分类方法的实施无需依赖于对对象装备的精确物理建模,因此避免了传统复杂系统难以建模的难处,实现了基于海量数据挖掘的故障智能分类及关联参数分析,具有准确率可控的故障分类能力。

【技术实现步骤摘要】
一种基于大数据融合聚类分析的关联参数故障分类方法
本专利技术涉及装备故障预测和健康管理(PHM)领域,具体涉及一种基于大数据融合聚类分析的关联参数故障分类方法。
技术介绍
故障预测和健康管理已经发展成为航空航天领域系统后勤保障、维护和自主健康管理的重要支撑技术和基础,在“国家中长期科学和技术发展规划纲要2006-2020”中,“重大产品和重大设施寿命预测技术”作为前沿技术提出在近年的航天、航空科学技术学科发展报告中,均将PHM技术列为关键和支撑技术。PHM技术已经成为一个涵盖基础材料、机械结构、能源、电子、自动测试、可靠性、信息等多领域的交叉学科和研究热门方向,具有重要的应用价值和现实意义。在大多数的工业系统PHM应用中,建立复杂部件或系统的数学或物理模型十分困难甚至无法实现,或识别模型的参数较为复杂,因此,部件或系统设计、仿真、运行和维护等各个阶段的测试数据、传感器历史数据就成为掌握系统性能下降的主要手段。由此,基于测试或传感器历史数据挖掘的PHM方法逐渐获得重视并取得快速发展,成为PHM领域的重要研究热点。特别是针对航空航天等复杂系统,很难直接获取或构建表征部件、系统退化和剩余寿命的物理模型,同时,这些对象系统和部件具备大量可用的状态监测和测试数据,因此,以数据驱动为主的PHM方法体系,获得美军、美国航空航天局及众多研究机构、工业企业的广泛重视。数据驱动PHM方法是基于先进的传感器技术采集和获取与系统属性有关的特征参数,并将这些特征参数和有用信息关联,借助智能算法和模型进行检测、分析和预测,给出目标系统的剩余寿命分布、性能退化程度或任务失效的概率,从而为维护系统和系统保障提供决策信息。在数据驱动PHM方法体系当中,方法流程、不同方法融合、模型选择、模型适应性等问题已成为了现今该领域内的研究重点,数据驱动PHM方法以其灵活的适应性和易用性获得了广泛的应用和推广。
技术实现思路
本专利技术的目的在于,为解决现有的数据驱动PHM方法存在着故障数据获取困难的技术问题,本专利技术提供一种基于大数据融合聚类分析的关联参数故障分类方法,用于改善现有复杂装备蕴含海量信息的运行数据未被有效挖掘、有效利用的现状。为实现上述目的,本专利技术提供了一套完整的算法流程,进行运算和解析,得出最终的故障分类和参数关联概率模型。所述的关联参数故障分类方法包括:步骤1)获取对象装备的各种运行数据。步骤2)根据对象装备的设计资料,建立涵盖对象装备全部参数的参数判读规则库。参数判读规则库不仅包含参数的门限判断规则,同时也包含参数的趋势判断规则及跳变判断规则。步骤3)以参数判读规则库的规则为准,对步骤1)中所有的运行数据筛选获得故障数据,将所有故障数据集合形成无分类故障数据集。步骤4)以无分类故障数据集通过聚类算法进行有监督的数据自主聚类,获得满足要求的聚类数目和各项聚类中心。聚类的数目从2开始逐渐增大至适当的数目,最终选取使各聚类核平均加权距离不再减小的最小值为聚类的总数。同时,通过确定的各项聚类中心对无分类故障数据集进行分类获得分类故障数据集。步骤5)将步骤3)中的无分类故障数据集采用映射-规约算法,生成参数关联概率模型,所述的参数关联概率模型包含对象装备中每条参数发生故障的同时,其他参数也发生故障的概率分布数据,数据从高到低排列成概率表格。步骤6)以步骤4)中的分类故障数据集作为故障判别标准,采用最近邻算法,对步骤1)中获取的运行数据进行故障类别识别,获得故障分类结果。步骤7)根据故障分类结果与步骤5)中的参数关联概率模型相结合,得出综合的故障诊断分类结果。综合诊断分类结果包含的内容为:故障分类结果、该故障分类结果的所有参数的概率分布数据。作为上述技术方案的进一步改进,所述步骤1)中获取的运行数据的格式满足:每个完整的数据条目包含该数据条目发生的时刻以及在该时刻对象装备的所有参数值;每个数据条目中的单个数据值表征某一时刻的对象设备中一个参数的实测值;各数据条目之间按照发生时刻的先后顺序逐一排列。作为上述技术方案的进一步改进,所述步骤3)中筛选的故障数据的格式满足:每个数据条目包含该数据条目发生的时刻以及在该时刻发生故障的全部故障参数;对于数据条目中发生故障的参数,根据参数判读规则库标注故障发生所触发的规则。作为上述技术方案的进一步改进,所述的参数判读规则库包含参数的上下限、参数跳变异常判定规则、参数趋势渐变异常判定规则。作为上述技术方案的进一步改进,所述的步骤4)具体包括:步骤101)设定聚类数目K的初始个数为2个,依照当前的K值对无分类故障数据集进行聚类运算,获取K个聚类中心及其对应的K个聚类;步骤102)计算K个聚类的平均轮廓系数,将K个聚类的平均轮廓系数与K-1个聚类的平均轮廓系数相比较,如果两个平均轮廓系数不变,则选取当前K值作为聚类总数,否则设定K=K+1后重新执行步骤101);所述的轮廓系数表示各聚类中包含的所有数据条目对应的向量点到聚类中心的几何距离的平均值;步骤103)以步骤102)中确定的聚类总数对无分类故障数据集进行聚类运算,并通过获取的各项聚类中心对无分类故障数据集中的所有故障数据进行分类,获得分类故障数据集。作为上述技术方案的进一步改进,所述的步骤101)中获取聚类中心的操作步骤包括:步骤101-1)从对象装备的所有运行数据中随机挑选一个数据条目对应的向量点作为第一个聚类中心,并寻找与第一个聚类中心的几何距离最近的向量点作为第二聚类中心;步骤101-2)计算每个聚类中心与其最近的聚类中心的几何距离Distance(x),将所有几何距离Distance(x)相加获得总距离Sum(Distance(x));步骤101-3)随机选取一个能落在总距离Sum(Distance(x))中的数据条目对应的向量点Random,作为新增加的一个聚类中心,重新执行步骤101-2),直至挑选出K个聚类中心。作为上述技术方案的进一步改进,所述的步骤5)具体包括:步骤201)依次将包含各条参数的全部故障数据条目分别映射到一起,形成各条参数对应的映射类,所述的映射类包含一个参数的全部故障数据条目及其出现的频度;步骤202)计算每一映射类中故障数据条目的总数,作为概率计算的分母;步骤203)累计每一映射类中包含除该映射类对应参数之外的其他参数出现的次数,作为概率计算的分子;步骤204)将步骤203)中的分子与步骤202)中的分母之比,得到每一参数发生故障的同时,其他参数也发生故障的概率分布数据。作为上述技术方案的进一步改进,所述的步骤6)具体包括:计算步骤1)中的所有运行数据与确定的各项聚类中心的几何距离,取最小的距离值与对应的聚类的平均轮廓系数进行比较,如果该距离值小于对应的聚类的平均轮廓系数,则判定运行数据为该聚类所对应的故障类型。本专利技术的一种基于大数据融合聚类分析的关联参数故障分类方法优点在于:本专利技术提供了一种定义清晰的、实际可操作的、具有良好效果的基于海量数据的融合聚类分析的关联参数故障分类方法,改善了现有故障诊断方法存在的以下几点技术问题:1.目前装备故障诊断过度依赖专家知识库,而专家知识库在面对复杂系统时,面临组合爆炸问题,难以覆盖全部故障情况及其关联参数,忽略了各子系统间深度耦合的参数之间的非线性关联关系的问题。对此,本专利技术的故本文档来自技高网
...
一种基于大数据融合聚类分析的关联参数故障分类方法

【技术保护点】
一种基于大数据融合聚类分析的关联参数故障分类方法,其特征在于,包括:步骤1)获取对象装备的各种运行数据;步骤2)根据对象装备的相关资料,建立涵盖对象装备全部参数的参数判读规则库;步骤3)以参数判读规则库的规则为准,对步骤1)中所有的运行数据筛选获得故障数据,将所有故障数据集合形成无分类故障数据集;步骤4)将无分类故障数据集通过聚类算法进行有监督的数据自主聚类,获得满足要求的聚类数目和各项聚类中心后,通过确定的各项聚类中心对无分类故障数据集中的所有故障数据进行分类,获得分类故障数据集;步骤5)将步骤3)中的无分类故障数据集采用映射‑规约算法,生成参数关联概率模型,所述的参数关联概率模型包含对象装备中每一参数发生故障的同时,其他参数也发生故障的概率分布数据;步骤6)以步骤4)中的分类故障数据集作为故障判别标准,对步骤1)中的所有运行数据采用最近邻算法进行故障类别识别,获得故障分类结果;步骤7)将故障分类结果与步骤5)中的参数关联概率模型相结合,获得发生该故障分类结果的所有参数的概率分布数据。

【技术特征摘要】
1.一种基于大数据融合聚类分析的关联参数故障分类方法,其特征在于,包括:步骤1)获取对象装备的各种运行数据;步骤2)根据对象装备的相关资料,建立涵盖对象装备全部参数的参数判读规则库;步骤3)以参数判读规则库的规则为准,对步骤1)中所有的运行数据筛选获得故障数据,将所有故障数据集合形成无分类故障数据集;步骤4)将无分类故障数据集通过聚类算法进行有监督的数据自主聚类,获得满足要求的聚类数目和各项聚类中心后,通过确定的各项聚类中心对无分类故障数据集中的所有故障数据进行分类,获得分类故障数据集;步骤5)将步骤3)中的无分类故障数据集采用映射-规约算法,生成参数关联概率模型,所述的参数关联概率模型包含对象装备中每一参数发生故障的同时,其他参数也发生故障的概率分布数据;步骤6)以步骤4)中的分类故障数据集作为故障判别标准,对步骤1)中的所有运行数据采用最近邻算法进行故障类别识别,获得故障分类结果;步骤7)将故障分类结果与步骤5)中的参数关联概率模型相结合,获得发生该故障分类结果的所有参数的概率分布数据。2.根据权利要求1所述的基于大数据融合聚类分析的关联参数故障分类方法,其特征在于,所述步骤1)中获取的运行数据的格式满足:每个完整的数据条目包含该数据条目发生的时刻以及在该时刻对象装备的所有参数值;每个数据条目中的单个数据值表征某一时刻的对象设备中一个参数的实测值;各数据条目之间按照发生时刻的先后顺序逐一排列。3.根据权利要求1所述的基于大数据融合聚类分析的关联参数故障分类方法,其特征在于,所述步骤3)中筛选的故障数据的格式满足:每个数据条目包含该数据条目发生的时刻以及在该时刻发生故障的全部故障参数;对于数据条目中发生故障的参数,根据参数判读规则库标注故障发生所触发的规则。4.根据权利要求1所述的基于大数据融合聚类分析的关联参数故障分类方法,其特征在于,所述的参数判读规则库包含参数的上下限、参数跳变异常判定规则、参数趋势渐变异常判定规则。5.根据权利要求1所述的基于大数据融合聚类分析的关联参数故障分类方法,其特征在于,所述的步骤4)具体包括:步骤101)设定聚类数目K的初始个数为2个,依照当前的K值对无分类故障数据集进行聚类运算,获取K个聚类中心及其对应的K个聚类;步骤102)计算K个...

【专利技术属性】
技术研发人员:董云帆房红征樊焕贞高健熊毅李蕊
申请(专利权)人:北京航天测控技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1