基于大数据的高炉铁水硅含量预报关键属性判决方法技术

技术编号：21571416 阅读：24 留言：0更新日期：2019-07-10 15:23

本发明专利技术公开了一种基于大数据的高炉铁水硅含量预报关键属性判决方法，包括以下步骤：将铁水硅含量及其相关属性数据表示为一个决策表，表中的每一行表示一个样本所有条件属性和决策属性的值，每一列表示某一条件属性或决策属性在所有样本中的取值；挑选需要识别是否为关键属性的条件属性作为候选属性，并将其在决策表中对应的列数据置于决策表倒数第二列，决策表倒数第一列为高炉铁水硅含量数据；对调整后的决策表进行整体排序；通过比较排序后的决策表中的相邻样本，判断候选属性是否为关键属性；如果存在相邻两个样本除候选属性以外的其他条件属性值都相同，而决策属性值不同，则该候选属性为关键属性。本发明专利技术计算效率高。

Key Attribute Decision Method for Silicon Content Prediction of Blast Furnace Hot Metal Based on Large Data

全部详细技术资料下载

【技术实现步骤摘要】
基于大数据的高炉铁水硅含量预报关键属性判决方法
本专利技术涉及一种基于大数据的高炉铁水硅含量预报关键属性判决方法。
技术介绍
在高炉冶炼过程中，铁水硅含量预报是表征炉内温度，评估高炉冶炼状态以及优化控制的关键因素，吸引了大量研究者的注意。然而，现有的铁水硅含量预报模型都比较依赖于良好的输入集。由于机理复杂，数据噪声严重、数据量巨大等因素影响，高炉铁水硅含量预报的关键属性判断困难重重，已有的方法多采用人为经验或相关性判断进行关键属性判断，存在着计算复杂、难以适应大数据计算、以及存在人为主观性因素等缺点。针对多属性的高炉铁水硅含量数据集，传统的关键属性判决方法常利用属性的相关性来进行辨别。通常采用多元线性回归的方法计算各属性与铁水硅含量的相关系数，设某一属性值和铁水硅含量值为x，y，采用多项式回归的方法进行变量间的相关性分析，回归方程如下：式中a0，a1，...，am为待求参数。若令上式中t1＝x，t2＝x2，...，tm＝xm，则多项式回归方程可化为多元线性回归方程：上式对应的复相关系数为Rxy：其中，是硅含量测量值的平均值。计算所有属性与铁水硅含量的相关系数，并构建一个列表，然后人为地挑选部分相关度高的属性作为关键属性。然而，这种传统的基于相关性的关键属性判决方法存在不足：1，算法效率问题。互相关性计算本身是一个较为复杂的运算，算法的时间复杂度较高。2，难以应对大规模数据集。当样本数量达到千万甚至亿级别之后，需要基于大数据平台进行处理，此时，过于复杂的传统算法性能很难得到效率层面的支撑。3，相关性分析只提供了一个重要度参考，在实际处理过程中，还需要人为判定...

【技术保护点】
1.一种基于大数据的高炉铁水硅含量预报关键属性判决方法，其特征在于，包括以下步骤：Step1、将铁水硅含量及其相关属性数据表示为一个决策表，表中的每一行表示一个样本所有条件属性和决策属性的值，每一列表示某一条件属性或决策属性在所有样本中的取值；其中条件属性为与高炉铁水硅含量相关的属性，决策属性为高炉铁水硅含量；Step2、对决策表中的数据进行预处理，包括修正不一致样本和删除重复样本；其中不一致样本是指条件属性值相同而决策属性值不同的样本；Step3、挑选需要识别是否为关键属性的条件属性作为候选属性，并将其在决策表中对应的列数据置于决策表倒数第二列，决策表倒数第一列为高炉铁水硅含量数据；Step4、对Step3调整后的决策表进行整体排序；Step5、通过比较Step4排序后的决策表中的相邻样本，判断候选属性是否为关键属性；判断的依据是，如果Step4排序后的决策表中存在相邻两个样本xi和xi+1满足：除候选属性以外的其他条件属性值都相同，而决策属性值不同，则该候选属性为关键属性。

【技术特征摘要】
1.一种基于大数据的高炉铁水硅含量预报关键属性判决方法，其特征在于，包括以下步骤：Step1、将铁水硅含量及其相关属性数据表示为一个决策表，表中的每一行表示一个样本所有条件属性和决策属性的值，每一列表示某一条件属性或决策属性在所有样本中的取值；其中条件属性为与高炉铁水硅含量相关的属性，决策属性为高炉铁水硅含量；Step2、对决策表中的数据进行预处理，包括修正不一致样本和删除重复样本；其中不一致样本是指条件属性值相同而决策属性值不同的样本；Step3、挑选需要识别是否为关键属性的条件属性作为候选属性，并将其在决策表中对应的列数据置于决策表倒数第二列，决策表倒数第一列为高炉铁水硅含量数据；Step4、对Step3调整后的决策表进行整体排序；Step5、通过比较Step4排序后的决策表中的相邻样本，判断候选属性是否为关键属性；判断的依据是，如果Step4排序后的决策表中存在相邻两个样本xi和xi+1满足：除候选属性以外的其他条件属性值都相同，而决策属性值不同，则该候选属性为关键属性。2.根据权利要求1所述的基于大数据的高炉铁水硅含量预报关键属性判决方法，其特征在于，所述Step2采用Hadoop平台的MapReduce计算框架实现，过程为：首先，在map阶段，将决策表中每个样本的所有条件属性值设置为一个key，每个样本的决策属性值设置为一个value，形成key-value对进行输出；然后，在shuffle阶段，对map阶段的输出按key值进行排序，再把key值相同的项进行连接，放在一起，生成该key值对应的value-list；最后，在r...

【专利技术属性】
技术研发人员：尹林子，李靖，蒋昭辉，许雪梅，丁家峰，
申请(专利权)人：中南大学，
类型：发明
国别省市：湖南,43

全部详细技术资料下载我是这个专利的主人