一种钢铁企业高炉副产煤气发生量预测方法技术

技术编号:11956227 阅读:64 留言:0更新日期:2015-08-27 08:05
本发明专利技术公开了一种钢铁企业高炉副产煤气发生量预测方法,包括如下步骤:从钢铁企业现场的实时数据库中读取高炉煤气的产生量数据;对所收集的原始数据序列进行预处理,检测出高炉煤气数据序列中的异常值;将经过预处理的数据序列输入建立的最小二乘支持向量机模型中进行预测,并用改进的粒子群算法优化最小二乘支持向量机的核宽度参数和惩罚因子参数,提高预测精度。本发明专利技术能够较为准确、快速的检测出高炉煤气产生量中的异常数据,并且对原始数据进行异常数据替换;建立了一种基于结构风险最小化的最小二乘支持向量预测模型,并用改进的粒子群算法对其优化,提高了模型的预测精度,预测结果可以为煤气资源的合理利用提供依据。

【技术实现步骤摘要】

本专利技术设及信息
,具体设及一种钢铁企业高炉副产煤气发生量预测方 法。
技术介绍
钢铁的生产过程可分为;焦化、炼铁、炼钢、轴钢等环节。该些生产环节所需的能量 主要是由焦炭等矿石燃料提供的,在消耗燃料的同时会生成多种可燃气体,即钢铁企业副 产煤气。生成的副产煤气将被集中收集,然后用管道输送到各生产车间,充当冶炼所需的助 燃剂。据统计,钢铁生产消耗的一次能源中有40%转化为副产煤气的形式,而在各类副产 煤气中,高炉煤气的产量约占副产煤气总量的45%,因而对高炉煤气的发生量及其特点进 行研究就有极其重大的意义。在国内的各大型钢铁企业中,除宝钢外,其他钢铁企业的高炉 煤气回收利用效率普遍较低,相当一部分的煤气资源被放散掉,既浪费了能源,又污染了环 境。因此,建立一种有效、精确的预测模型,对煤气消耗量进行准确预测,是解决煤气资源合 理调度的前提,也是降低钢铁企业综合能耗,减少煤气放散的有效途径之一。 申请号为201310566822. 1的专利提供了一种高炉煤气发生量的预测方法,该方 法在预处理输入模型的原始数据时,是通过人为地判断异常数据的点位,然后在对判断出 的异常点进行插值处理。但是,人工判断的识别率无法保障,容易发生漏检误检,对后续的 BP神经网络模型建立造成很大的影响。该专利利用BP神经网络的方法建立预测模型,但 BP神经网络模型是基于经验风险最小化原则,随着预测的进行,模型的泛化能力会降低,导 致预测精度下降。
技术实现思路
为解决上述问题,本专利技术提供了,能 够较为准确、快速的检测出高炉煤气产生量中的异常数据,并且对原始数据进行异常数据 替换;建立了一种基于结构风险最小化的最小二乘支持向量预测模型,并用改进的粒子群 算法对其优化,提高了模型的预测精度,预测结果可W为煤气资源的合理利用提供依据。 为实现上述目的,本专利技术采取的技术方案为: ,包括如下步骤: S1、从钢铁企业现场的实时数据库中读取高炉煤气的产生量数据;[000引 S2、对步骤S1所收集的原始数据序列进行预处理,检测出高炉煤气数据序列中的 异常值;减少检测样本的个数,提高检测的效率。 S21、利用五数总括法对步骤S1所收集的原始数据序列进行处理W缩小异常检测 的范围;具体的,记高炉煤气的数据序列为F,把F按照从大到小的顺序排列,确定出数据序 列的中位数Fm、上下四分位数Fu与Fi,将上下四分位数之差表示为df;数据序列的上截断点 和下截断点分别表示成Fu+1. 5df与Fu-1. 5df,在此定义上下截断点两侧的数据即为疑似的 异常数据序列; S22、将步骤S21所得的疑似异常数据利用局部异常因子法检验离群值,具体步骤 如下: a)计算要检测的煤气发生量数据P的k距离,对任意给定的正整数k,对象P的k 距离被定义为数据对象P与另一个对象0之间的欧氏距离,记为;k-distance(P);[001引b)计算对象P的k距离邻域Nk_dktan。。,对象P的k距离邻域定义为所有与煤气数 据P之间距离不大于k的对象全体,可表示为:[001 引Nk_"stance={qED\{p} |d(p,q)《k-distance(P)} c)计算煤气数据p的可达距离,相对于对象数据0,p的可达距离定义为: Reach-dist(P,0) =max{k_distance(0),d(P,0)} d)通过W下公式计算待检测数据P的局部可达密度,【主权项】1. ,其特征在于,包括如下步骤: 51、 从钢铁企业现场的实时数据库中读取高炉煤气的产生量数据; 52、 对步骤Sl所收集的原始数据序列进行预处理,检测出高炉煤气数据序列中的异常 值; 521、 利用五数总括法对步骤Sl所收集的原始数据序列进行处理以缩小异常检测的范 围;具体的,记高炉煤气的数据序列为F,把F按照从大到小的顺序排列,确定出数据序列的 中位数F m、上下四分位数?"与F1,将上下四分位数之差表示为df;数据序列的上截断点和下 截断点分别表示成F u+1. 5七与Fu-L 5df,在此定义上下截断点两侧的数据即为疑似的异常 数据序列; 522、 将步骤821所得的疑似异常数据利用局部异常因子法检验离群值,具体步骤如 下: a) 计算要检测的煤气发生量数据p的k距离,对任意给定的正整数k,对象p的k距离 被定义为数据对象P与另一个对象O之间的欧氏距离,记为:k_distance (P); b) 计算对象p的k距离邻域Nk_dista_,对象p的k距离邻域定义为所有与煤气数据p 之间距离不大于k的对象全体,可表示为: Nk-distance= e D\{p} |d(p,q)彡 k-distance(p)} c) 计算煤气数据p的可达距离,相对于对象数据〇, p的可达距离定义为: Reach-dist(p,〇) = max{k_distance(ο),d (ρ,〇)} d) 通过以下公式计算待检测数据p的局部可达密度,式中_ w1为P邻域内所有对象的可达距离之和;N(P)为可达距离对象 的个数; e) 通过以下公式计算待检测数据的局部异常因子式中,lrd(o)表示所有数据对象的局部可达密度,lrd(p)表示待检测的数据对象的局 部可达密度,N(p)为可达距离对象的个数; 53、 将经过预处理的数据序列输入建立的最小二乘支持向量机模型中进行预测,并用 改进的粒子群算法优化最小二乘支持向量机的核宽度参数和惩罚因子参数,提高预测精 度。2. 根据权利要求1所述的,其特征在于, 所述步骤S3中最小二乘支持向量机预测模型通过以下步骤建立: 531、 将煤气序列样本进行归一化处理; 532、 将煤气样本分为训练集与预测集两部分,煤气样本的训练集输入矩阵利用滚动预 测法得到:S33、利用煤气的输入输出数据训练最小二乘支持向量机预测模型。3.根据权利要求1所述的,其特征在于, 步骤S3中改进的粒子群算法优化包括如下步骤: 步骤1、初始化粒子群算法的参数,设置粒子群的种群数量、迭代次数、学习因子、惯性 权重的上下限; 步骤2、初始化粒子的位置与速度及粒子的适应度值,其中,最小二乘支持向量机的核 宽度与惩罚因子是改进的粒子群算法要优化的两个参数;适应度函数为期望值与输出值的 均方误差; 步骤3、根据上述的方法查找初始时单个粒子的适应度与整个种群的平均适应度。 步骤4、进行粒子群的迭代更新,比较种群的平均适应度与单个粒子的适应度,选择其 惯性权重;根据公式更新粒子的 速度与位置,重新计算粒子的最优适应度值;若优于个体粒子,则用其替换个体粒子的适应 度。若优于整个种群,则用其替换整个种群的适应度; 步骤5、满足终止条件或者达到迭代的次数,则退出优化程序,跳转至步骤6,否则转至 步骤3 ; 步骤6、利用优化后的LSSVM模型对煤气消耗量进行预测。【专利摘要】本专利技术公开了,包括如下步骤:从钢铁企业现场的实时数据库中读取高炉煤气的产生量数据;对所收集的原始数据序列进行预处理,检测出高炉煤气数据序列中的异常值;将经过预处理的数据序列输入建立的最小二乘支持向量机模型中进行预测,并用改进的粒子群算法优化最小二乘支持向量机的核宽度参数和惩罚因子参数,提高预测精度。本专利技术本文档来自技高网...

【技术保护点】
一种钢铁企业高炉副产煤气发生量预测方法,其特征在于,包括如下步骤:S1、从钢铁企业现场的实时数据库中读取高炉煤气的产生量数据;S2、对步骤S1所收集的原始数据序列进行预处理,检测出高炉煤气数据序列中的异常值;S21、利用五数总括法对步骤S1所收集的原始数据序列进行处理以缩小异常检测的范围;具体的,记高炉煤气的数据序列为F,把F按照从大到小的顺序排列,确定出数据序列的中位数Fm、上下四分位数Fu与Fl,将上下四分位数之差表示为df;数据序列的上截断点和下截断点分别表示成Fu+1.5df与Fu‑1.5df,在此定义上下截断点两侧的数据即为疑似的异常数据序列;S22、将步骤821所得的疑似异常数据利用局部异常因子法检验离群值,具体步骤如下:a)计算要检测的煤气发生量数据p的k距离,对任意给定的正整数k,对象p的k距离被定义为数据对象p与另一个对象o之间的欧氏距离,记为:k‑distance(p);b)计算对象p的k距离邻域Nk‑distance,对象p的k距离邻域定义为所有与煤气数据p之间距离不大于k的对象全体,可表示为:Nk‑distance={q∈D\{p}|d(p,q)≤k‑distance(p)}c)计算煤气数据p的可达距离,相对于对象数据o,p的可达距离定义为:Reach‑dist(p,o)=max{k‑distance(o),d(p,o)}d)通过以下公式计算待检测数据p的局部可达密度,lrd(p)=1/{Σo∈N(p)reach-dist(p,o)|N(p)|}]]>式中,为p邻域内所有对象的可达距离之和;N(p)为可达距离对象的个数;e)通过以下公式计算待检测数据的局部异常因子LOF(p)=Σo∈N(p)lrd(o)lrd(p)|N(p)|;]]>式中,lrd(o)表示所有数据对象的局部可达密度,lrd(p)表示待检测的数据对象的局部可达密度,N(p)为可达距离对象的个数;S3、将经过预处理的数据序列输入建立的最小二乘支持向量机模型中进行预测,并用改进的粒子群算法优化最小二乘支持向量机的核宽度参数和惩罚因子参数,提高预测精度。...

【技术特征摘要】

【专利技术属性】
技术研发人员:王红君白鹏岳有军赵辉
申请(专利权)人:天津理工大学
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1