一种制造业数据挖掘中的源数据配置管理方法技术

技术编号:20745350 阅读:46 留言:0更新日期:2019-04-03 10:25
本发明专利技术提供了提供一种制造业数据挖掘中的源数据配置管理方法,把制造业的数据分析任务进行了整理和分类,经过提炼和整理,将制造业的数据分析任务划分为两大类,通过建立数据模型对进行数据分析,并对各类数据定义不同的数据格式,以此完成数据配置和管理。

【技术实现步骤摘要】
一种制造业数据挖掘中的源数据配置管理方法
本专利技术涉及数据处理
,特别是涉及一种制造业数据挖掘中的源数据配置管理方法。
技术介绍
在制造业日益发展今天,制造业技术升级日新月异。机器学习等人工智能方法不断的被应用到制造业中去,为制造业的数据挖掘持续贡献力量。尽管机器学习方法在某些行业的应用已经比较成熟,但在制造业的应用方兴未艾,还有许多需要探索和研究的
本案所针对的制造业数据挖掘中的数据源管理方法就是其中之一。长久以来,制造业的数据分析基本上停留在数据的可视化和基本的统计分析的范畴内,数据的利用效率偏低。造成这一现象的原因除了数据孤岛、数据完整性不佳等数据本身的问题之外,很重要的一个因素就是数据源与数据分析方法之间的交互机制和方法缺失。无论是商用软件,还是免费开源软件,都有不少的数据分析软件,但这些软件都有一个显著的缺点:仅对被分析的数据一般结构进行要求,而不对数据在数据分析任务中的角色和配置做要求。并且,数据分析的方法是固定的,而数据是千变万化的,数据分析的角度也是千变万化的。需要探索一种机制在不改变数据的情况下,快速实现数据分析的范围、视角等切换
技术实现思路
本专利本文档来自技高网
...

【技术保护点】
1.一种制造业数据挖掘中的源数据配置管理方法,其特征在于,包括如下步骤:步骤1:把制造业的数据分析任务进行了整理和分类,经过提炼和整理,将制造业的数据分析任务划分为两大类:交叉型分析任务和非交叉型分析任务,并对两种任务分别定义代号规则;步骤2:将与分析任务对应的数据源从耽搁数据源扩展为数据集群并定义其数据名为X数据集群和Y数据集群;步骤3:对单一数据集群进行格式定义,并按照要求对数据进行配置,具体要求包括:对于X数据,需要指明数据源中的哪一个参数是索引;一个数据源中的索引是唯一的,并将其标记为“索引;”需要指明数据源中哪些参数需要参与数据分析任务,并将其标记为“参数”;未标记的数据参数不参与数...

【技术特征摘要】
1.一种制造业数据挖掘中的源数据配置管理方法,其特征在于,包括如下步骤:步骤1:把制造业的数据分析任务进行了整理和分类,经过提炼和整理,将制造业的数据分析任务划分为两大类:交叉型分析任务和非交叉型分析任务,并对两种任务分别定义代号规则;步骤2:将与分析任务对应的数据源从耽搁数据源扩展为数据集群并定义其数据名为X数据集群和Y数据集群;步骤3:对单一数据集群进行格式定义,并按照要求对数据进行配置,具体要求包括:对于X数据,需要指明数据源中的哪一个参数是索引;一个数据源中的索引是唯一的,并将其标记为“索引;”需要指明数据源中哪些参数需要参与数据分析任务,并将其标记为“参数”;未标记的数据参数不参与数据分析任务,并且被标记为“TBD”;对于Y数据,需要指明数据源中的哪一个参数是索引;一个数据源中的索引是唯一的,并将其标记为“索引”;需要指明数据源中哪些参数需要参与数据分析任务,并将其标记为“目标”;未标记的数据参数不参与数据分析任务,并且被标记为“TBD”。2.根据权利要求1所述的制造业数据挖掘中的源数据配置管理方法,其特征在于:所述交叉型分析任务目的是寻找两类数据之间的关系,并用这个模型来预测质量表现;所述非交叉型分析任务:只针对一类数据源进行的各种分析任务。3.根据权利要求1所述的制造业数据挖掘中的源数据配置管理方法,其特征在于:分类的依据是分析任务的类型,即交叉型任务和非交叉型任务,所述交叉型分析任务的一般模型遵循一下算法:已知样本组合(X,y)...

【专利技术属性】
技术研发人员:王伟旭李冉
申请(专利权)人:成都天衡智造科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1