【技术实现步骤摘要】
一种热力站历史能耗数据异常值处理方法及装置
[0001]本专利技术涉及热力站数据处理领域,特别涉及一种热力站历史能耗数据异常值处理方法、装置、电子设备、计算机可读存储介质。
技术介绍
[0002]数据异常值处理是在开展数据分析、挖掘、建模之前必须要经历的步骤,这些异常数据往往会影响整体数据的分布,在对热力站进行数据挖掘、建模时,其中包含的异常值往往对最终结果有较强的影响。
[0003]针对这类问题,传统方法是基于经验值或基于统计学去筛选,但是筛选后的结果依然会存在少量的异常值无法被筛除,使得最终的模型效果较差。
技术实现思路
[0004]鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的热力站历史能耗数据异常值处理方法、装置、电子设备、计算机可读存储介质。
[0005]本专利技术的一个实施例提供一种热力站历史能耗数据异常值处理方法,该方法包括:
[0006]获取热力站历史能耗数据,所述历史能耗数据包括一定时间段内历史能耗与平均温度的对应关系;
[ ...
【技术保护点】
【技术特征摘要】
1.一种热力站历史能耗数据异常值处理方法,其特征在于,包括:获取热力站历史能耗数据,所述历史能耗数据包括一定时间段内历史能耗与平均温度的对应关系;基于经验值去除所述历史能耗数据中热力站未开启和热力站异常开启的异常数据;基于数据统计确定历史能耗数据的正常数据分布范围,去除所述正常数据分布范围之外的异常数据;基于聚类算法对上述处理之后的历史能耗数据进行聚类分析,去除经聚类分析获得的异常数据。2.根据权利要求1所述的方法,其特征在于,所述基于经验值去除所述历史能耗数据中热力站未开启和热力站异常开启的异常数据,包括:去除历史能耗数据中日能耗小于第一预设阈值的异常数据;去除历史能耗数据中日能耗大于第一预设阈值且平均温度大于第二预设阈值的异常数据。3.根据权利要求2所述的方法,其特征在于,所述第一预设阈值为300千瓦时,所述第二预设阈值为12摄氏度。4.根据权利要求1所述的方法,其特征在于,所述基于数据统计确定历史能耗数据的正常数据分布范围,去除所述正常数据分布范围之外的异常数据,包括:对基于经验值去除数据异常值的历史能耗数据计算均值和标准差;根据所述历史能耗数据的均值和标准差确定历史能耗数据的正常数据分布范围,去除所述正常数据分布范围之外的异常数据。5.根据权利要求4所述的方法,其特征在于,所述根据所述历史能耗数据的均值和标准差确定历史能耗数据的正常数据分布范围,去除所述正常数据分布范围之外的异常数据,包括:针对所述历史能耗数据的各个平均温度对应的历史能耗,确定各个平均温度对应的历史能耗的均值+预设个数的历史能耗的标准差以及历史能耗的均值
‑
预设个数的历史能耗的标准差为历史能耗数据的正常数据分布...
【专利技术属性】
技术研发人员:李昕,
申请(专利权)人:博锐尚格科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。