一种基于机器学习的工业设备运行数据清洗方法、装置、设备以及计算机可读介质制造方法及图纸

技术编号:46097580 阅读:7 留言:0更新日期:2025-08-12 18:17
本发明专利技术公开了一种基于机器学习的工业设备运行数据清洗方法、装置、设备以及计算机可读介质,本申请获取工业设备运行的原始数据,对原始数据进行预处理;构建孤立森林算法模型,将预处理后的原始数据输入孤立森林算法模型进行异常检测,标记出正常数据点和异常数据点,生成包含正常数据点的正常数据集和包含异常数据点的异常数据集;基于正常数据集训练随机森林回归模型,将异常数据集输入到训练后的随机森林回归模型,得到异常数据点的预测值;对异常数据点的值进行修正,输出修正后的数据集;将修正后的数据集重新输入孤立森林算法模型,以验证修正后的数据集中是否存在新的异常数据点。

【技术实现步骤摘要】

本专利技术涉及工业设备运行数据的大数据分析与机器学习的交叉,特别是涉及一种基于机器学习的工业设备运行数据清洗方法、装置、设备以及计算机可读介质


技术介绍

1、在现代工业领域,高精度传感器和物联网技术的广泛应用使得工业设备的运行数据能够被实时、全面地采集。这些数据涵盖了设备运行的关键参数,如压力、流量、温度和能耗等,为设备状态监测、运行策略优化以及维护需求预测提供了基础支持。

2、然而在复杂工业环境中,往往会因为设备异常、通讯问题等多种原因,引发采集到数据的异常,如数据冗余、数据缺失、数据错误等。这些异常数据会严重影响后续的数据分析和系统平台决策。传统数据清洗方法在处理大规模、高维度数据时效率低下,难以适应现代工业设备产生的海量数据。因此,亟需一种运用机器学习技术对采集的数据进行智能清洗,以精准识别并自动修正异常数据,从而提高数据的准确性和可靠性,为工业设备的智能化管理提供坚实的数据基础。


技术实现思路

1、为了克服现有技术的不足,本实专利技术提供一种一种基于机器学习的工业设备运行数据清洗方法、装本文档来自技高网...

【技术保护点】

1.一种基于机器学习的工业设备运行数据清洗方法,其特征在于,包括:

2.根据权利要求1所述的一种基于机器学习的工业设备运行数据清洗方法,其特征在于,步骤S102中对所述原始数据集进行预处理包括:

3.根据权利要求1所述的一种基于机器学习的工业设备运行数据清洗方法,其特征在于,步骤S103中构建孤立森林算法模型,将预处理后的原始数据输入所述孤立森林算法模型进行异常检测,输出正常数据集和异常数据集,包括:

4.根据权利要求3所述的一种基于机器学习的工业设备运行数据清洗方法,其特征在于,步骤S1036中计算每个数据点在孤立森林中的异常分数的表达式为:

...

【技术特征摘要】

1.一种基于机器学习的工业设备运行数据清洗方法,其特征在于,包括:

2.根据权利要求1所述的一种基于机器学习的工业设备运行数据清洗方法,其特征在于,步骤s102中对所述原始数据集进行预处理包括:

3.根据权利要求1所述的一种基于机器学习的工业设备运行数据清洗方法,其特征在于,步骤s103中构建孤立森林算法模型,将预处理后的原始数据输入所述孤立森林算法模型进行异常检测,输出正常数据集和异常数据集,包括:

4.根据权利要求3所述的一种基于机器学习的工业设备运行数据清洗方法,其特征在于,步骤s1036中计算每个数据点在孤立森林中的异常分数的表达式为:

5.根据权利要求3所述的一种基于机器学习的工业设备运行数据清洗方法装置,其特征在于,步骤s1036中根据预设阈值对所述异常分数进行异常检测,包括:

6.根据权利要求1所述的一种基于机器学...

【专利技术属性】
技术研发人员:李维娜许泽锋吴谋荣
申请(专利权)人:桦熙新能源科技福建有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1