【技术实现步骤摘要】
一种基于工业大数据模型的可视化分析方法及系统
[0001]本专利技术涉及工业大数据
,具体来说,涉及一种基于工业大数据模型的可视化分析方法及系统。
技术介绍
[0002][0003]工业大数据是指在工业领域中产生的大数据。随着信息化与工业化的深度融合,信息技术渗透到了工业企业产业链的各个环节,工业产品的全生命周期从市场规划、设计、制造、销售到维护的过程中也会产生大量的结构化和非结构化数据,从而形成了工业大数据,而目前的工业大数据仍需不断升级才能助力智能制造。
[0004]目前大多数的工业大数据具备多源异构、多尺度、不确定、高噪声等特征,且存在工业模型准确率低等问题。而针对这些问题,目前还没有有效的解决办法。
技术实现思路
[0005]针对相关技术中的上述技术问题,本专利技术提出一种基于工业大数据模型的可视化分析方法及系统,能够克服现有技术的上述不足。
[0006]为实现上述技术目的,本专利技术的技术方案是这样实现的:一种基于工业大数据模型的可视化分析方法,包括如下步骤:S1 数据获取,根 ...
【技术保护点】
【技术特征摘要】
1.一种基于工业大数据模型的可视化分析方法,其特征在于,包括如下步骤:S1 数据获取,根据工业模型训练需求采集数据样本;S2 数据预处理,在数据存储和使用前对数据进行数据探索和基础数据预处理,根据业务逻辑选择数据组织和数据格式;S3 创建特征工程,对预处理后的数据进行特征选择、特征提取、特征转化和特征构建;S4 划分数据集,在使用机器学习算法训练之前,按比例将数据集划分为训练集和测试集,进行交叉检验;S5 模型选择,在算法库中选择合适的算法模型或使用自定义的算法模型进行训练;S6 模型训练,平台通过Airflow进行任务调度和资源分配来实现分布式高并发的多线程机器学习,并根据算法模型的特点进行硬件和软件的性能优化;S7 模型评估,通过模型评估指标对模型进行评估;S8 模型发布,模型评估完成后,模型以离线的形式生成模型文件;S9 模型维护,模型发布后,持续进行数据反馈收集和模型迭代;S10 数据展示,通过数据可视化组件Superset的创建和Dashboard的分享,为数据分析提供可视化方案,通过预定义的可视化图表或自定义开发图表类型实现数据的展示。2.根据权利要求1所述的基于工业大数据模型的可视化分析方法,其特征在于,S2中所述数据探索通过计算基础统计量和图表分析,初步探索特征的自身属性以及特征之间的交互关系。3.根据权利要求2所述的基于工业大数据模型的可视化分析方法,其特征在于,所述基础统计量包括均值、标准差、中位数、分位数、最大值、最小值、偏度、峰度和相关系数;所述图表包括统计表和统计图,所述统计表包括频数交...
【专利技术属性】
技术研发人员:梁宏宇,刘金易,王建广,刘璐,
申请(专利权)人:北京航天云路有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。