【技术实现步骤摘要】
一种基于大数据的工业蒸汽量预测方法
本专利技术属于机器学习、大数据处理,尤其是特征工程构建、模型融合方案、工业蒸汽量预测等。
技术介绍
当今世界在城市化和工业化的道路上突飞猛进,人类将进入一个以知识经济为特征的信息时代,检测技术、计算机技术和通讯技术一起构成现代信息的三大基础。21世纪的热点必将向传感、执行与检测方向发展。锅炉自动化控制系统作为传感、执行与检测技术的一个应用方面也必将跨入数字化、网络化和智能化时代。火力发电厂在发电时,燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温高压蒸汽。如何通过锅炉的工况来反应锅炉的燃烧效率的问题也就出现了。为了更好地解决这一问题,首先要搞清影响锅炉燃烧效率的主要因素以及影响锅炉产生对蒸汽量的条件。然后对锅炉传感器反馈回来的信息进行收集和分析,利用大数据处理以及机器学习方面的知识对数据进行深度的挖掘与利用。对锅炉工况数据进行分析和整合,利用相关知识来研究锅炉产生的蒸汽量和锅炉的燃烧效率已经成为一个具有挑战 ...
【技术保护点】
1.一种基于大数据的工业蒸汽量预测方法,其特征在于,包括以下步骤:101.获取锅炉的工况数据,并对锅炉的工况数据先后进行缺失值处理、异常值处理和对非对称分布的处于偏斜状态的数据进行偏态修正三个数据预处理操作;102.采用以区间覆盖为基础的自助法,根据工况数据的采集时间划分训练集数据、验证集数据,并对锅炉工况数据进行特征工程操作;103.建立多个机器学习模型,并采用基于Filter和线性加权的瀑布融合法进行模型融合操作;104.通过步骤103建立的融合模型,根据锅炉传感器采集的工况数据对锅炉产生的蒸汽量进行预测,利用预测的蒸汽量求得锅炉的燃烧效率运用在工业生产上。
【技术特征摘要】
1.一种基于大数据的工业蒸汽量预测方法,其特征在于,包括以下步骤:101.获取锅炉的工况数据,并对锅炉的工况数据先后进行缺失值处理、异常值处理和对非对称分布的处于偏斜状态的数据进行偏态修正三个数据预处理操作;102.采用以区间覆盖为基础的自助法,根据工况数据的采集时间划分训练集数据、验证集数据,并对锅炉工况数据进行特征工程操作;103.建立多个机器学习模型,并采用基于Filter和线性加权的瀑布融合法进行模型融合操作;104.通过步骤103建立的融合模型,根据锅炉传感器采集的工况数据对锅炉产生的蒸汽量进行预测,利用预测的蒸汽量求得锅炉的燃烧效率运用在工业生产上。2.根据权利要求1所述的一种基于大数据的工业蒸汽量预测方法,其特征在于,所述步骤101对锅炉传感器每分钟采集的工况数据进行异常值处理的具体步骤为:1011.对异常值处理:基于拉依达方法,对近似正态分布的数据中的异常值进行剔除,采集数据中只含有随机误差,对其进行计算处理得到标准偏差,按概率确定区间,超过这个区间的误差已不属于随机误差而是粗大误差,含有该误差的数据应予以剔除;独立得到x1,x2,...,xn等样本值,n表示样本数,计算出算术平均值μ及剩余误差vi(i=1,2,...,n),并按贝塞尔公式计算出标准偏差σ,若某个测量值xt的剩余误差vt(1≤t≤n),满足下式:则认为xt是含有粗大误差值的坏值,应予剔除,λ表示0到1之间的任意实数,用来增大数据容忍程度。3.根据权利要求1所述的一种基于大数据的工业蒸汽量预测方法,其特征在于,所述步骤101对非对称分布的处于偏斜状态的数据进行偏态修正具体包括:偏态分布是与正态分布相对、分布曲线左右不对称的分布,对偏态分布数据转换为进行操作,使其转换为正态分布数据,这样样本均值和方差则相互独立;对于正偏态的数据进行取对数或取平方根操作,进行这样的变换将大的数据向左移动,使数据接近正态分布,负偏态数据的情况取相反数转化为右偏的情况;为了凸显方差和偏态的相似性,定义偏度系数计算公式如下:其中,μ为偏态数据的算术平均值,σ为偏态数据的标准差。当偏度系数大于0时,则为正偏态,这时对数据进行取对数操作;当偏度系数小于0时,则为负偏态,这时对数据取相反数后再取对数。4.根据权利要求1所述的一种基于大数据的工业蒸汽量预测方法,其特征在于,所述步骤101缺失值处理是基于时间加权的缺失值处理:对于存在缺失值的属性列,使用如下公式对其值进行填充:x(0)=0.2x(10)+0.3x(5)+0.5x(1)公式(3)其中,x(0)表示属性列缺失值,x(10)表示十分钟前的属性列值,x(5)表示五分钟前的属性列值,x(1)表示一分钟前的属性列值。5.根据权利要求1-4之一所述的一种基于大数据的工业蒸汽量预测方法,其特征在于,所述步骤102根据锅炉传感器对工况数据的采集时间划分训练集数据、验证集数据具体步骤为:采用以区间覆盖为基础的自助法划分训练集数据和验证集数据,在锅炉传感器以每分钟为单位采集的7天的工况数据中,将每两个小时作为一个小区间,这样7天168个小时可以划分为84个小区间,在这些小区间Di中进行采样产生Di′:Di′...
【专利技术属性】
技术研发人员:王进,张睿,陈重元,邓欣,孙开伟,刘彬,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。