一种批生产的时序数据特征提取方法技术

技术编号：27106154 阅读：32 留言：0更新日期：2021-01-25 18:55

本发明专利技术属于数据挖掘技术领域，尤其是涉及一种批生产的时序数据特征提取方法。一种批生产的时序数据特征提取方法，包括以下步骤：S1、数据获取，从数据源获取目标批次的过程数据X；S2、数据清洗，遍历各个变量并定位质量差的数据点，将定位到的质量差数据的变量剔除；S3、数据分割，根据目标对象的实际意义和分析需求并利用现有变量；S4、变量筛选，根据目标对象的实际意义和分析需求进行分析变量的筛选；S5、特征指标确定，根据目标对象的实际意义和分析需求确定描述单个变量特征的指标；S6、特征矩阵构建。本发明专利技术提供了一种压缩数据量、保留过程特征、可减少后续分析工作的运算压力的批生产的时序数据特征提取方法。的时序数据特征提取方法。的时序数据特征提取方法。

全部详细技术资料下载

【技术实现步骤摘要】
一种批生产的时序数据特征提取方法

[0001]本专利技术属于数据挖掘
，尤其是涉及一种批生产的时序数据特征提取方法。

技术介绍

[0002]数据挖掘(Data Mining)是指从大量含有噪声的、不完全的、模糊的数据中提取事先未知的又有潜在价值的信息的过程。工业生产数据具有大量(volume)、高速(velocity)、多样性(variety)、真实性(veracity)、可见性(visibility)和价值(value)的特征。大量(volume)即数据的规模大，高速(velocity)即数据的产生和采集非常频繁，多样性(variety)即数据的异构多样，真实性(veracity)即避免数据收集和提炼过程中发生的数据质量污染所导致的“虚假”信息，可见性(visibility)即通过分析使以往不可见的信息可见，价值(value)即分析获得的信息应被转换成价值。工业数据的产生主体是人和机器，即由人工输入的数据和通过相应传感器、仪器仪表、智能终端从设备上采集的数据，其中来自机器的数据在体量上占主要地位。这些数据中含有生产过程的宝贵信息，通过对生产数据进行挖掘，能进一步揭示生产规律，为生产优化提供助力。
[0003]当前批生产方式广泛应用于制药、食品、化工等行业。批生产数据存在以下特点：生产过程数据为时序数据，能反映生产过程随时间的变化趋势；每个批次的时间长度通常不相等，故每批次的过程变量样本数不同；生产过程数据采集频率高，变量数多，导致单批次的数据量大。针对某对象进行研究时，往往需要分析多个批次的生产数据，...

【技术保护点】

【技术特征摘要】
1.一种批生产的时序数据特征提取方法，其特征在于包括以下步骤：S1、数据获取，从数据源获取目标批次的过程数据X：其中，n为样本数，n≥1；m为变量数，m＞7；S2、数据清洗，遍历各个变量并定位质量差的数据点，将定位到的质量差数据的变量剔除；S3、数据分割，根据目标对象的实际意义和分析需求并利用现有变量，将过程数据分割为k部分，k≥2，每部分的样本数为n
i
，i＝1，2，...，k；S4、变量筛选，根据目标对象的实际意义和分析需求进行分析变量的筛选，获得：其中，筛选后变量数为d，1≤d≤n，i＝1，2，...k；S5、特征指标确定，根据目标对象的实际意义和分析需求确定描述单个变量特征的指标，该指标数计为t，1≤t≤7；S6、特征矩阵构建，基于数据矩阵A
i
计算各变量的指标，并整理为行向量R
i
，根据行向量R
i
构建目标批次的特征矩阵S
k
×
dt
，其中i＝1，2，...k。2.根据权利要求1所述的一种批生产的时序数据特征提取方法，其特征在于所述步骤S1中的...

【专利技术属性】
技术研发人员：瞿海斌，谢欣媛，张胜，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人