一种基于随机森林和支持向量机的能源数据异常原因分析方法技术

技术编号:31570171 阅读:19 留言:0更新日期:2021-12-25 11:09
一种基于随机森林和支持向量机的能源数据异常原因分析方法,包括:步骤1:采用模型训练模块进行数据清洗处理、数据标签化及模型参数调优;步骤2:采用异常数据接收模块支持从MySQL、Oracle、Postgre中读取相关电力负控异常数据;步骤3:数据处理,采用大数据技术对异常数据进行关键信息筛选、冗余数据删除及时间窗口计算;其中Python通过JDBC方式从Oracle及Postgre中取出电力负控异常数据;步骤4:采用异常原因分析模块,对异常数据进行原因分析,并反馈异常原因分析结果。该方法基于随机森林和支持向量机模型,根据电力系统反馈的异常电力负控数据,对所属不同客户及不同时间段的异常数据进行原因分析。常数据进行原因分析。常数据进行原因分析。

【技术实现步骤摘要】
一种基于随机森林和支持向量机的能源数据异常原因分析方法


[0001]本专利技术涉及电力数据分析
,具体为一种基于随机森林和支持向量机的能源数据异常原因分析方法。

技术介绍

[0002]随着电力行业的飞速发展,新型能源在电力应用环节的参与程度越大越大。而以往的传统发电模式因能源消耗比重大、环境污染程度严重等原因,电力生产和管理的难度也在增加。在企业用电的过程中,因企业用能变化、偷电漏电、企业突发情况等原因导致电力负控数据异常的情况时有发生。
[0003]在现有的电力系统中,针对于上述电力负控数据的异常情况,采用监察人员人工复查的方式进行异常原因分析,在人工复查的过程中,存在着复查效率低、复查出错率高、资源占用率高等问题。在很多要求数据及时性的场合,采用人工复查的方式往往不能满足业务需求。如果可以自动化的对企业异常用电数据进行异常原因分析,则可以在智能用电策略上为企业提供更好的方案支撑,也可以为企业提供更佳的用电服务。
[0004]现有的电力系统在异常数据收集分析方面存在以下不足:
[0005](1)异常数据原因分析采用传统人工复查的方式,存在着复查效率低、出错率高等问题。不利于企业制定成熟的用电策略。
[0006](2)以某地市电网运行数据为例,负控数据月增30万条。面对海量数据,人工复查方式并不适用于当下异常数据原因分析工作。

技术实现思路

[0007]本专利技术的目的在于克服现有技术的不足之处,提供一种基于随机森林和支持向量机的能源数据异常原因分析方法,该方法基于随机森林和支持向量机模型,根据电力系统反馈的异常电力负控数据,对所属不同客户及不同时间段的异常数据进行原因分析。
[0008]一种基于随机森林和支持向量机的能源数据异常原因分析方法,包括以下步骤:
[0009]步骤1:采用模型训练模块进行数据清洗处理、数据标签化及模型参数调优;
[0010]步骤2:采用异常数据接收模块支持从MySQL、Oracle、Postgre中读取相关电力负控异常数据;
[0011]步骤3:对步骤二中得到的异常数据进行数据处理,采用大数据技术对异常数据进行关键信息筛选、冗余数据删除及时间窗口计算工作;其中Python通过JDBC方式从Oracle及Postgre中取出电力负控异常数据;
[0012]步骤4:采用异常原因分析模块,对异常数据进行原因分析,并反馈异常原因分析结果;该异常原因分析模型主要包括工作日原因分析模型及非工作日原因分析模型。
[0013]而且,步骤三中还包括以下子步骤:
[0014]步骤3.1:根据异常发生时间,计算时间所属范围,分成工作日及非工作日两类;
[0015]步骤3.2:对多个点位的电力负控数据进行标幺化操作,设P_户为负荷数据,P_户标为P_户的归一化数据,C_run为运行容量,则第N点P_户标归一化数据通过以下公式求得:
[0016]P_户标
n
=P_户
n
/C_run
n
[0017]步骤3.3:对标幺化后的电力负控数据进行关键信息筛选,保留户号、异常时间、时间窗口标识及标幺化值信息。
[0018]本专利技术的优点和技术效果是:
[0019]本专利技术的一种基于随机森林和支持向量机的能源数据异常原因分析方法,可自动化的对异常数据产生的原因进行分析整合,之后推送给电力服务部门,可对企业智能输配电提供更高效的决策意见。依据异常数据分析原因,可更加便捷的解决企业用电过程中存在的用电问题,节约电力能源,节省人力物力,降低用电成本。
[0020]本专利技术的一种基于随机森林和支持向量机的能源数据异常原因分析方法,还具备以下优势:
[0021](1)面对海量电力数据,自动化的异常原因分析效率要高于人工复查。
[0022](2)针对不同时间范围的异常数据,自动化的处理方式可提高异常原因分析正确率。
[0023](3)定时计算,每天可针对异常数据进行定时处理,可保证异常数据分析结果的时效性。
附图说明
[0024]图1为本专利技术数据流的结构示意图。
具体实施方式
[0025]为能进一步了解本专利技术的内容、特点及功效,兹例举以下实施例,并配合附图详细说明如下。需要说明的是,本实施例是描述性的,不是限定性的,不能由此限定本专利技术的保护范围。
[0026]一种基于随机森林和支持向量机的能源数据异常原因分析方法,包括以下步骤:
[0027]步骤1:采用模型训练模块进行数据清洗处理、数据标签化及模型参数调优;
[0028]步骤2:采用异常数据接收模块支持从MySQL、Oracle、Postgre中读取相关电力负控异常数据;
[0029]步骤3:对步骤二中得到的异常数据进行数据处理,采用大数据技术对异常数据进行关键信息筛选、冗余数据删除及时间窗口计算工作;其中Python通过JDBC方式从Oracle及Postgre中取出电力负控异常数据;
[0030]步骤4:采用异常原因分析模块,对异常数据进行原因分析,并反馈异常原因分析结果;该异常原因分析模型主要包括工作日原因分析模型及非工作日原因分析模型。
[0031]而且,步骤三中还包括以下子步骤:
[0032]步骤3.1:根据异常发生时间,计算时间所属范围,分成工作日及非工作日两类;
[0033]步骤3.2:对多个点位的电力负控数据进行标幺化操作,设P_户为负荷数据,P_户标为P_户的归一化数据,C_run为运行容量,则第N点P_户标归一化数据通过以下公式求得:
[0034]P_户标
n
=P_户
n
/C_run
n
[0035]步骤3.3:对标幺化后的电力负控数据进行关键信息筛选,保留户号、异常时间、时间窗口标识及标幺化值信息。
[0036]另外,本专利技术优选的,还包括有定时任务模块,用于定期收集筛选并处理分析电力异常数据的形成原因,该有定时任务模块、模型训练模块,异常数据接收模块,以及异常数据原因分析模块均搭载在现有技术中的软件内实施。
[0037]为了更清楚地说明本专利技术的具体实施方式,下面提供一种实施例:
[0038]本专利技术数据流图如图1所示,具体步骤如下:
[0039](1)Python首先读取存放于固定路径下的配置文件中数据库连接信息,包括ip、userName、password、database,然后接收传入参数,包括数据类型,日期类型,预测天数.根据参数生成查询语句列表list。
[0040](2)通过python第三方依赖库将查询语句列表list以sqlalchemy的方式建立JDBC连接,读取数据历史数据,企业用电信息、企业用电异常信息等。
[0041](3)读取到的数据基于dataframe进行数据清洗转换,并进行标幺化。
[0042](4)通过dataframe把清洗后的数据进行时间序列排序,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于随机森林和支持向量机的能源数据异常原因分析方法,其特征在于,包括以下步骤:步骤1:采用模型训练模块进行数据清洗处理、数据标签化及模型参数调优;步骤2:采用异常数据接收模块支持从MySQL、Oracle、Postgre中读取相关电力负控异常数据;步骤3:对步骤二中得到的异常数据进行数据处理,采用大数据技术对异常数据进行关键信息筛选、冗余数据删除及时间窗口计算工作;其中Python通过JDBC方式从Oracle及Postgre中取出电力负控异常数据;步骤4:采用异常原因分析模块,对异常数据进行原因分析,并反馈异常原因分析结果;该异常原因分析模型主要包括工作日原因分析模型及非工作日原因分析...

【专利技术属性】
技术研发人员:胡浩瀚郭正雄张立李鹏程张海涛朱传晶胡晓楠徐骏章名尚
申请(专利权)人:国网信息通信产业集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1