基于工业设备预测性维护的数据处理方法技术

技术编号:14600444 阅读:807 留言:0更新日期:2017-02-09 03:41
本发明专利技术实施例提供了一种基于工业设备预测性维护的数据处理方法,包括:建立基于Hadoop架构的存储平台的步骤,所述基于Hadoop架构的存储平台包括用于存储海量设备数据的HBase数据库;建立基于R语言的分析平台的步骤,所述基于R语言的分析平台通过所述HBase数据库内的设备数据进行分析;建立Hadoop接口程序的步骤,所述Hadoop接口程序用于提供接口实现业务数据能按规定的格式存入Hadoop平台的HBase数据库,使基于R语言的分析平台读取基于Hadoop架构的存储平台内的设备数据。上述的技术方案提供一种基于Hadoop+R语言平台的数据分析技术。

【技术实现步骤摘要】

本专利技术属于涉及信息
,尤其涉及一种基于工业设备预测性维护的数据处理方法
技术介绍
近年来,预测性维护策略逐渐受到工厂设施管理人员的关注。预测性维护策略是通过在线监测和分析设备运行状态,以期在早期发现设备性能下降或发生故障的迹象,并给出可执行的处理措施建议,通知产线维护人员进行维护或排除故障。由于预测性维护对设备的状态检测一般都是在线进行,所以不会对设备的正常运转产生干扰;同时可以实现按需维护,这样不仅可以降低停机时间,提高产量,还能消除在不必要的维护上所花费的时间和资源。实施预测性维护需要采集海量的设备数据,然后对数据进行详尽的分析。随着智能设备的引入、传感器技术的发展,使得设备数据的采集变得越来越便利。然而采集到海量的设备数据后如何进行存储和分析则是实现预测性维护策略的关键。传统的数据存储方式和分析方法具有以下劣势:1、数据存储压力大,不能长时间保存设备历史数据,只能保存近期少量数据,从而影响分析预测的准确性;2、存储瓶颈还会导致数据分析效率低,显然不能满足准确预测的需求。因此,如何以技术手段实现对工业设备数据的有效存储和分析,提出工业设备预测性维护分析方案是一个亟待解决的问题。
技术实现思路
针对现有技术中对海量数据进行存储和分析存在的问题,本专利技术实施例的目的是提供一种有效且高效的基于工业设备预测性维护的数据处理方法,能够提高针对海量数据进行有效存储和分析的效果。为了解决上述问题,本专利技术实施例提出了一种基于工业设备预测性维护的数据处理方法,包括:建立基于Hadoop架构的存储平台的步骤,所述基于Hadoop架构的存储平台包括用于存储海量设备数据的HBase数据库;建立基于R语言的分析平台的步骤,所述基于R语言的分析平台通过所述HBase数据库内的设备数据进行分析;建立RHadoop接口程序的步骤,所述RHadoop接口程序用于实现业务数据能按规定的格式存入Hadoop平台的HBase数据库,提供接口以使基于R语言的分析平台读取基于Hadoop架构的存储平台内的设备数据;其中,建立基于Hadoop架构的存储平台的步骤具体包括:为每一设备对应的在HBase数据库建立一个HBase表,所述HBase表的关键词Key包括至少三个参数:设备编码,部件编码,采集时间;为每一HBase表生成一个列族DeviceProperty,所述列族设有以下至少四个列以存储设备数据:基本信息、环境信息、状态信息和故障信息;其中基本信息为设备的设备描述类参数,环境信息为设备所处环境的环境参数,状态信息为设备的工作状态参数,故障信息为设备出现故障时的故障参数;其中,建立RHadoop接口程序的步骤具体包括:建立接口API库以提供对HBase数据库的配置接口、权限接口、数据接口;其中所述配置接口包含用于对HBase数据库进行环境配置的子接口、用于与HBase数据库建立连接的子接口、用于与HBase数据库断开连接的子接口;其中所述权限接口用于根据预设的不同权限提供对HBase数据库的对应访问操作;其中所述数据接口用于实现业务数据能按规定的格式存入Hadoop平台的HBase数据库,用于根据基于R语言的分析平台对基于Hadoop架构的存储平台进行访问的指令,对基于Hadoop架构的存储平台的HBase数据库的HBase表进行操作;其中,建立基于R语言的分析平台的步骤具体包括:建立线性回归算法模型以寻找属性与预测目标之间的线性关系,并采用最小二乘法来获取各属性与预测目标的线性系数;进行K-Means聚类算法模型以获取设备数据与故障类型之间的关系;具体包括:将各个聚类子集内的所有数据样本的均值作为该聚类的代表点,并将每个数据点划分到最近的类别中,使得评价聚类性能的准则函数达到最优,从而使同一个类中的对象相似度较高,而不同类之间的对象的相似度较小;建立决策树算法模型以根据设备当前的运行状态参数实时预测设备是否会引发故障;具体包括:利用对设备运行参数及故障参数作为训练样本进行学习以建立分类规则;利用分类规则对设备当前的运行状态参数进行分类;建立时间序列算法模型以预测在什么时间范围内会引发何种类型的故障;具体包括:观测变量的当前值,记录历史数据和历史上所受随机干扰因素;然后通过历史数据和历史上所受的扰动进行回归得到当前的观测变量的预测值;建立神经网络算法模型以根据设备当前的运行状态参数实时预测设备是否会引发故障;具体包括:信息的正向传递、误差的反向传播;在信息的正向传递过程中,输入信息从输入层经隐含层逐层计算传向输出层,每一层神经元的状态只影响下一层神经元的状态;如果输出层没有得到期望输出,则计算输出层的误差变化值,然后反向传播,通过网络将误差信号沿原来的连接通路反传,修改各神经元的权值,直至达到期望目标;建立预测模型以进行设备预测性维护预测,其中所述预测模型基于R语言,且所述建立预测模型的步骤包括map阶段和reduce阶段,具体包括:设置预测模型的时间范围,并加载数据;根据自变量与因变量之间的关系,计算回归系数,并最终生成预测模型。其中,建立预测模型以进行设备预测性维护预测,其中所述预测模型基于R语言,且所述建立预测模型的步骤包括map阶段和reduce阶段,具体包括:设置预测模型的时间范围,并加载数据;根据自变量与因变量之间的关系,计算回归系数,并最终生成预测模型。其中,建立预测模型以进行设备预测性维护预测,其中所述预测模型基于R语言,且所述建立预测模型的步骤包括map阶段和reduce阶段,具体包括:设出现故障Y的影响因素为X1和X2;则建立的预测模型为Y=a1X1+a2X2+β其中,a1、a2、β为回归系数;确定模型时间范围t;加载设备故障时的历史数据;根据map阶段的段mapper1函数计算XtX;根据根据map阶段的段mapper2函数计算XtY;根据reduce阶段的Sum.reduce函数,计算map阶段输出的总和;利用mapreduce()调用mapper1和Sum.reduce函数,计算XtX;运用mapreduce()调用mapper2和Sum.reduce函数,计算XtY;计算回归系数值,并生成线性回归预测模型。其中,所述方法还包括:根据建立的预测模型以及HBase数据库存储的设备数据,对故障进行预测。建立预测模型以进行设备预测性维护预测,其中所述预测模型基于R语言,且所述建立预测模型的步骤包括map阶段和reduce阶段,具体包括:设置预测模型的时间范围,并加载数据;根据自变量与因变量之间的关系,计算回归系数,并最终生成预测模型。其中,所述根据建立的预测模型以及HBase数据库存储的设备数据,对故障进行预测,具体包括:设定需要进行预测的时间范围;加载设备的运行数据;调用指定设备的预测模型,以计算阈值,并计算达到阈值需要的时间范围;输出结果文件。其中,所述基本信息包括以下的至少一个参数:设备名称、部件名称、设备操作人、数据采集时间;所述环境信息包括以下的至少一个参数:温度、湿度、粉尘;状态信息包括以下的至少一个参数:设备的冲压压力、位移、电机转速、电流、性能;所述故障信息包括以下的至少一个参数:故障类别、故障描述。其中,所述RHadoop接口程序的数据接口用于对HBase数据库的HBase表执行以下本文档来自技高网...

【技术保护点】
一种基于工业设备预测性维护的数据处理方法,其特征在于,包括:建立基于Hadoop架构的存储平台的步骤,所述基于Hadoop架构的存储平台包括用于存储海量设备数据的HBase数据库;建立基于R语言的分析平台的步骤,所述基于R语言的分析平台通过所述HBase数据库内的设备数据进行分析;建立Hadoop接口程序的步骤,所述Hadoop接口程序用于提供接口实现业务数据能按规定的格式存入Hadoop平台的HBase数据库,使基于R语言的分析平台读取基于Hadoop架构的存储平台内的设备数据;其中,建立基于Hadoop架构的存储平台的步骤具体包括:为每一设备对应的在HBase数据库建立一个HBase表,所述HBase表的关键词Key包括至少三个参数:设备编码、部件编码、采集时间;为每一HBase表生成一个列族DeviceProperty,所述列族设有以下至少四个列以存储设备数据:基本信息、环境信息、状态信息和故障信息;其中基本信息为设备的设备描述类参数,环境信息为设备所处环境的环境参数,状态信息为设备的工作状态参数,故障信息为设备出现故障时的故障参数;其中,建立Hadoop接口程序的步骤具体包括:建立接口API库以提供对HBase数据库的配置接口、权限接口、数据接口;其中所述配置接口包含用于对HBase数据库进行环境配置的子接口、用于与HBase数据库建立连接的子接口、用于与HBase数据库断开连接的子接口;其中所述权限接口用于根据预设的不同权限提供对HBase数据库的对应访问操作;其中所述数据接口用于实现业务数据能按规定的格式存入Hadoop平台的HBase数据库,用于根据基于R语言的分析平台对基于Hadoop架构的存储平台进行访问的指令,对基于Hadoop架构的存储平台的HBase数据库的HBase表进行操作;其中,建立基于R语言的分析平台的步骤具体包括:建立线性回归算法模型以寻找属性与预测目标之间的线性关系,并采用最小二乘法来获取各属性与预测目标的线性系数;建立K‑Means聚类算法模型以获取设备数据与故障类型之间的关系;具体包括:将各个聚类子集内的所有数据样本的均值作为该聚类的代表点,并将每个数据点划分到最近的类别中,使得评价聚类性能的准则函数达到最优,从而使同一个类中的对象相似度较高,而不同类之间的对象的相似度较小;建立决策树算法模型以根据设备当前的运行状态参数实时预测设备是否会引发故障;具体包括:利用对设备运行参数及故障参数作为训练样本进行学习以建立分类规则;利用分类规则对设备当前的运行状态参数进行分类;建立时间序列算法模型以预测在什么时间范围内会引发何种类型的故障;具体包括:观测变量的当前值,记录历史数据和历史上所受随机干扰因素;然后通过历史数据和历史上所受的扰动进行回归得到当前的观测变量的预测值;建立神经网络算法模型以根据设备当前的运行状态参数实时预测设备是否会引发故障;具体包括:信息的正向传递、误差的反向传播;在信息的正向传递过程中,输入信息从输入层经隐含层逐层计算传向输出层,每一层神经元的状态只影响下一层神经元的状态;如果输出层没有得到期望输出,则计算输出层的误差变化值,然后反向传播,通过网络将误差信号沿原来的连接通路反传,修改各神经元的权值,直至达到期望目标;建立预测模型以进行设备预测性维护预测,其中所述预测模型基于R语言,且所述建立预测模型的步骤包括map阶段和reduce阶段,具体包括:设置预测模型的时间范围,并加载数据;根据自变量与因变量之间的关系,计算回归系数,并最终生成预测模型。...

【技术特征摘要】
1.一种基于工业设备预测性维护的数据处理方法,其特征在于,包括:建立基于Hadoop架构的存储平台的步骤,所述基于Hadoop架构的存储平台包括用于存储海量设备数据的HBase数据库;建立基于R语言的分析平台的步骤,所述基于R语言的分析平台通过所述HBase数据库内的设备数据进行分析;建立Hadoop接口程序的步骤,所述Hadoop接口程序用于提供接口实现业务数据能按规定的格式存入Hadoop平台的HBase数据库,使基于R语言的分析平台读取基于Hadoop架构的存储平台内的设备数据;其中,建立基于Hadoop架构的存储平台的步骤具体包括:为每一设备对应的在HBase数据库建立一个HBase表,所述HBase表的关键词Key包括至少三个参数:设备编码、部件编码、采集时间;为每一HBase表生成一个列族DeviceProperty,所述列族设有以下至少四个列以存储设备数据:基本信息、环境信息、状态信息和故障信息;其中基本信息为设备的设备描述类参数,环境信息为设备所处环境的环境参数,状态信息为设备的工作状态参数,故障信息为设备出现故障时的故障参数;其中,建立Hadoop接口程序的步骤具体包括:建立接口API库以提供对HBase数据库的配置接口、权限接口、数据接口;其中所述配置接口包含用于对HBase数据库进行环境配置的子接口、用于与HBase数据库建立连接的子接口、用于与HBase数据库断开连接的子接口;其中所述权限接口用于根据预设的不同权限提供对HBase数据库的对应访问操作;其中所述数据接口用于实现业务数据能按规定的格式存入Hadoop平台的HBase数据库,用于根据基于R语言的分析平台对基于Hadoop架构的存储平台进行访问的指令,对基于Hadoop架构的存储平台的HBase数据库的HBase表进行操作;其中,建立基于R语言的分析平台的步骤具体包括:建立线性回归算法模型以寻找属性与预测目标之间的线性关系,并采用最小二乘法来获取各属性与预测目标的线性系数;建立K-Means聚类算法模型以获取设备数据与故障类型之间的关系;具体包括:将各个聚类子集内的所有数据样本的均值作为该聚类的代表点,并将每个数据点划分到最近的类别中,使得评价聚类性能的准则函数达到最优,从而使同一个类中的对象相似度较高,而不同类之间的对象的相似度较小;建立决策树算法模型以根据设备当前的运行状态参数实时预测设备是否会引发故障;具体包括:利用对设备运行参数及故障参数作为训练样本进行学习以建立分类规则;利用分类规则对设备当前的运行状态参数进行分类;建立时间序列算法模型以预测在什么时间范围内会引发何种类型的故障;具体包括:观测变量的当前值,记录历史数据和历史上所受随机干扰因素;然后通过历史数据和历史上所受的扰动进行回归得到当前的观测变量的预测值;建立神经网络算法模型以根据设备当前的运行状态参数实时预测设备是否会引发故障;具体包括:信息的正向传递、误差的反向传播;在信息的正向传递过程中,输入信息从输入层经隐含层逐层计算传向输出层,每一层神经元的状态只影响下一层神经元的状态;如果输出层没有得到期望输出,则计算输出层的误差变化值,然后反向传播,通过网络将误差信号沿原来的连接通路反传,修改各神经元的权值,直至达到期望目标;建立预测模型以进行设备预测性维护预测,其中所述预测模型基于R语言,且所述建立预测模型的步骤包括map阶段和reduce阶段,具体包括:设置预测模型的时间范围,并加载数据;根据自变量与因变量之间的关系,计算回归系数,并最终生成预测...

【专利技术属性】
技术研发人员:刘红超缪燕喻翠微陈晓娟刘浩
申请(专利权)人:北京许继电气有限公司国家电网公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1