一种基于工业大数据模型的可视化分析方法及系统技术方案

技术编号：33451370 阅读：54 留言：0更新日期：2022-05-19 00:35

本发明专利技术公开了一种基于工业大数据模型的可视化分析方法及系统，所述方法包括数据获取、数据预处理、创建特征工程、划分数据集、模型选择、模型训练、模型评估、模型发布、模型维护和数据展示；所述系统包括数据管理模块、模型管理模块、模型计算模块和数据可视化模块。本发明专利技术通过工业大数据分析与机器学习相结合，实现了工业数据模型可视化分析，极大地提高了用于模型训练的数据的准确性，并且能够在数据较少的情况下有效地提高模型训练的效率，提升模型训练的准确性，节约模型训练成本。节约模型训练成本。节约模型训练成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于工业大数据模型的可视化分析方法及系统

[0001]本专利技术涉及工业大数据
，具体来说，涉及一种基于工业大数据模型的可视化分析方法及系统。

技术介绍

[0002][0003]工业大数据是指在工业领域中产生的大数据。随着信息化与工业化的深度融合，信息技术渗透到了工业企业产业链的各个环节，工业产品的全生命周期从市场规划、设计、制造、销售到维护的过程中也会产生大量的结构化和非结构化数据，从而形成了工业大数据，而目前的工业大数据仍需不断升级才能助力智能制造。
[0004]目前大多数的工业大数据具备多源异构、多尺度、不确定、高噪声等特征，且存在工业模型准确率低等问题。而针对这些问题，目前还没有有效的解决办法。

技术实现思路

[0005]针对相关技术中的上述技术问题，本专利技术提出一种基于工业大数据模型的可视化分析方法及系统，能够克服现有技术的上述不足。
[0006]为实现上述技术目的，本专利技术的技术方案是这样实现的：一种基于工业大数据模型的可视化分析方法，包括如下步骤：S1 数据获取，根...

【技术保护点】

【技术特征摘要】
1.一种基于工业大数据模型的可视化分析方法，其特征在于，包括如下步骤：S1 数据获取，根据工业模型训练需求采集数据样本；S2 数据预处理，在数据存储和使用前对数据进行数据探索和基础数据预处理，根据业务逻辑选择数据组织和数据格式；S3 创建特征工程，对预处理后的数据进行特征选择、特征提取、特征转化和特征构建；S4 划分数据集，在使用机器学习算法训练之前，按比例将数据集划分为训练集和测试集，进行交叉检验；S5 模型选择，在算法库中选择合适的算法模型或使用自定义的算法模型进行训练；S6 模型训练，平台通过Airflow进行任务调度和资源分配来实现分布式高并发的多线程机器学习，并根据算法模型的特点进行硬件和软件的性能优化；S7 模型评估，通过模型评估指标对模型进行评估；S8 模型发布，模型评估完成后，模型以离线的形式生成模型文件；S9 模型维护，模型发布后，持续进行数据反馈收集和模型迭代；S10 数据展示，通过数据可视化组件Superset的创建和Dashboard的分享，为数据分析提供可视化方案，通过预定义的可视化图表或自定义开发图表类型实现数据的展示。2.根据权利要求1所述的基于工业大数据模型的可视化分析方法，其特征在于，S2中所述数据探索通过计算基础统计量和图表分析，初步探索特征的自身属性以及特征之间的交互关系。3.根据权利要求2所述的基于工业大数据模型的可视化分析方法，其特征在于，所述基础统计量包括均值、标准差、中位数、分位数、最大值、最小值、偏度、峰度和相关系数；所述图表包括统计表和统计图，所述统计表包括频数交...

【专利技术属性】
技术研发人员：梁宏宇，刘金易，王建广，刘璐，
申请(专利权)人：北京航天云路有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人