一种电能替代方案预测中的特征关联与分簇方法及装置制造方法及图纸

技术编号:22296123 阅读:19 留言:0更新日期:2019-10-15 05:10
本发明专利技术公开了一种电能替代方案预测中的特征关联与分簇方法及装置,采集电力企业数据库中各类企业能源替代前后相关数据,并进行预处理,作为能源代替数据进行存储;根据能源代替数据筛选实施能源替代转换的各行业高能耗企业,并将其能源代替数据作为标杆企业样本;对标杆企业样本进行聚类,得到同类能源替代标杆企业样本集;识别同类能源替代标杆企业样本集的能源替代相关频繁项集,得到同类能源替代方案频繁项集;挖掘同类能源替代方案频繁项集中的关联规则;根据关联规则进行电能替代方案预测中的特征关联和分簇。

A Method and Device for Characteristic Association and Clustering in Electric Power Substitution Scheme Prediction

【技术实现步骤摘要】
一种电能替代方案预测中的特征关联与分簇方法及装置
本公开属于能源替代的
,涉及一种电能替代方案预测中的特征关联与分簇方法及装置。
技术介绍
本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息,不必然构成在先技术。随着我国工业经济的快速发展,环境污染、资源耗散、气候变化等问题日益突出,为实现国民经济持续健康发展,需加快能耗转型,大力发展清洁能源。然而,能源待转型企业在进行设备安装、改造、升级等过程中,存在工程量大、盈利慢、改换成本高等问题,进行能源替代方案的推行,存在较大的阻力,因此需要根据能源市场各类动态信息、激励机制以及用户对能耗替代的需求作出各类能源替代方案的动态成本预测,并基于概率统计的理念,通过能源等价成本的对比,获取相对竞争优势的最高边界电价,从而为电力企业制定电价标准提供数据支撑,实现以电能消费为主体的电能替代方案预测。然而,专利技术人在研发过程中发现,以往的电能替代方案预测方案采用的预测规则及属性存在混乱且复杂的缺陷,导致预测结果不够精确,因此,如何在电能替代方案预测过程中进行特征关联与分簇是当前急需研究的一个课题。
技术实现思路
针对现有技术中存在的不足,本公开的一个或多个实施例提供了一种电能替代方案预测中的特征关联与分簇方法及装置,采用特征关联与分簇研究方法有效地梳理与分析在电能替代方案预测中的属性因素,提高了电能预测方案中的精确度,能够快速有效地对电能替代方案预测中的特征关联与分簇进行提取,为电能替代方案预测提供了有效的数据支持。根据本公开的一个或多个实施例的一个方面,提供一种电能替代方案预测中的特征关联与分簇方法。一种电能替代方案预测中的特征关联与分簇方法,该方法包括:采集电力企业数据库中各类企业能源替代前后相关数据,并进行预处理,作为能源代替数据进行存储;根据能源代替数据筛选实施能源替代转换的各行业高能耗企业,并将其能源代替数据作为标杆企业样本;对标杆企业样本进行聚类,得到同类能源替代标杆企业样本集;识别同类能源替代标杆企业样本集的能源替代相关频繁项集,得到同类能源替代方案频繁项集;挖掘同类能源替代方案频繁项集中的关联规则;根据关联规则进行电能替代方案预测中的特征关联和分簇。进一步地,在该方法中,采用K均值聚类方法对标杆企业样本进行聚类,得到同类能源替代标杆企业样本集。进一步地,在该方法中,所述采用K均值聚类方法对标杆企业样本进行聚类的具体步骤包括:随机选取k个标杆企业样本作为初始聚类中心;分别计算剩余标杆企业样本数据到初始聚类中心的距离;根据距离最小原则,对标杆企业样本数据进行分类,所述分类规则为将每个企业分配给距离它最近的聚类中心;依据类内平均距离最小原则,计算每个聚类中的新的聚类中心;返回计算剩余标杆企业样本数据到初始聚类中心的距离,直到聚类中心不发生变化。进一步地,在该方法中,识别同类能源替代标杆企业样本集的能源替代相关频繁项集的具体步骤包括:接收同类能源替代标杆企业样本集的属性集合;根据属性集合中的不同属性,生成单项属性集的集合;根据单项属性集的集合寻找频繁单项属性集;执行频繁项集连接,将两个k-1项频繁项集连接生成新的k项集;将新生成的k项集执行频繁项集剪枝,删除一定不是频繁的k项集;扫描样本数据库;判断所有的频繁k项集是否为空,若为空,输出当前找到的所有频繁项集,若不为空,则返回寻找频繁单项属性集;进一步地,在该方法中,所述同类能源替代标杆企业样本集的属性集合包括标杆企业能源替代前后的相关用能因素、用能产出效益和环保效益。进一步地,在该方法中,所述根据单项属性集的集合寻找频繁单项属性集的具体步骤包括:接收设定的最小支持度计数阈值;统计同类能源替代标杆企业样本集的单项属性集的集合中所有元素出现的次数,得到支持度计数,将支持度计数小于最小支持度计数阈值的项集筛除,得到频繁单项属性集。进一步地,在该方法中,所述执行频繁项集连接的具体步骤包括:判断两个k-1项频繁项集是否可连接;如果两个k-1项频繁项集可连接,则二者生成一个新的k项集。进一步地,在该方法中,所述挖掘同类能源替代方案频繁项集中的关联规则的具体步骤包括:提取规则后件只含一个项的所有高置信度规则;使用在频繁项集产生时计算的支持度计数确定每个规则的置信度;使用当前的高置信度规则来产生新的候选规则,得到关联规则。根据本公开的一个或多个实施例的一个方面,提供一种计算机可读存储介质。一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行所述的一种电能替代方案预测中的特征关联与分簇方法。根据本公开的一个或多个实施例的一个方面,提供一种终端设备。一种终端设备,其包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行所述的一种电能替代方案预测中的特征关联与分簇方法。根据本公开的一个或多个实施例的一个方面,提供一种电能替代方案预测中的特征关联与分簇装置。一种电能替代方案预测中的特征关联与分簇装置,基于所述的一种电能替代方案预测中的特征关联与分簇方法,包括:数据采集模块,被配置为采集电力企业数据库中各类企业能源替代前后相关数据,并进行预处理,作为能源代替数据进行存储;样本选取模块,被配置为根据能源代替数据筛选实施能源替代转换的各行业高能耗企业,并将其能源代替数据作为标杆企业样本;聚类模块,被配置为对标杆企业样本进行聚类,得到同类能源替代标杆企业样本集;频繁项集识别模块,被配置为识别同类能源替代标杆企业样本集的能源替代相关频繁项集,得到同类能源替代方案频繁项集;特征关联和分簇模块,被配置为挖掘同类能源替代方案频繁项集中的关联规则;根据关联规则进行电能替代方案预测中的特征关联和分簇。本公开的有益效果:本公开提供的一种电能替代方案预测中的特征关联与分簇方法及装置,通过特征关联与分簇研究方法有效地梳理与分析在电能替代方案预测中的属性因素,解决了电能替代方案预测中,预测规则及属性存在混乱且复杂的缺陷,提高了预测精度,为能源替换提供了数据依据,响应了国家政策号召,改善了生态环境。附图说明构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图1是根据一个或多个实施例的一种电能替代方案预测中的特征关联与分簇方法流程图;图2是根据一个或多个实施例的识别频繁项集流程流程图。具体实施方式:下面将结合本公开的一个或多个实施例中的附图,对本公开的一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本公开的一个或多个实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本实施例使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或本文档来自技高网
...

【技术保护点】
1.一种电能替代方案预测中的特征关联与分簇方法,其特征在于,该方法包括:采集电力企业数据库中各类企业能源替代前后相关数据,并进行预处理,作为能源代替数据进行存储;根据能源代替数据筛选实施能源替代转换的各行业高能耗企业,并将其能源代替数据作为标杆企业样本;对标杆企业样本进行聚类,得到同类能源替代标杆企业样本集;识别同类能源替代标杆企业样本集的能源替代相关频繁项集,得到同类能源替代方案频繁项集;挖掘同类能源替代方案频繁项集中的关联规则;根据关联规则进行电能替代方案预测中的特征关联和分簇。

【技术特征摘要】
1.一种电能替代方案预测中的特征关联与分簇方法,其特征在于,该方法包括:采集电力企业数据库中各类企业能源替代前后相关数据,并进行预处理,作为能源代替数据进行存储;根据能源代替数据筛选实施能源替代转换的各行业高能耗企业,并将其能源代替数据作为标杆企业样本;对标杆企业样本进行聚类,得到同类能源替代标杆企业样本集;识别同类能源替代标杆企业样本集的能源替代相关频繁项集,得到同类能源替代方案频繁项集;挖掘同类能源替代方案频繁项集中的关联规则;根据关联规则进行电能替代方案预测中的特征关联和分簇。2.如权利要求1所述的一种电能替代方案预测中的特征关联与分簇方法,其特征在于,在该方法中,采用K均值聚类方法对标杆企业样本进行聚类,得到同类能源替代标杆企业样本集;所述采用K均值聚类方法对标杆企业样本进行聚类的具体步骤包括:随机选取k个标杆企业样本作为初始聚类中心;分别计算剩余标杆企业样本数据到初始聚类中心的距离;根据距离最小原则,对标杆企业样本数据进行分类,所述分类规则为将每个企业分配给距离它最近的聚类中心;依据类内平均距离最小原则,计算每个聚类中的新的聚类中心;返回计算剩余标杆企业样本数据到初始聚类中心的距离,直到聚类中心不发生变化。3.如权利要求1所述的一种电能替代方案预测中的特征关联与分簇方法,其特征在于,在该方法中,识别同类能源替代标杆企业样本集的能源替代相关频繁项集的具体步骤包括:接收同类能源替代标杆企业样本集的属性集合;根据属性集合中的不同属性,生成单项属性集的集合;根据单项属性集的集合寻找频繁单项属性集;执行频繁项集连接,将两个k-1项频繁项集连接生成新的k项集;将新生成的k项集执行频繁项集剪枝,删除一定不是频繁的k项集;扫描样本数据库;判断所有的频繁k项集是否为空,若为空,输出当前找到的所有频繁项集,若不为空,则返回寻找频繁单项属性集。4.如权利要求3所述的一种电能替代方案预测中的特征关联与分簇方法,其特征在于,在该方法中,所述同类能源替代标杆企业样本集的属性集合包括标杆企业能源替代前后的相关用能因素、用能产出效益和环保效益。5.如权利要求3所述的一种电能替代方案预测中的特征关联与分簇方法,其特征在于,在该方法中...

【专利技术属性】
技术研发人员:缪庆庆林涛张善刚刘宗杰孙海彬周翔宇范先慎李静孔德营宋益瑞张冠军刘伟王文君孔庆迎
申请(专利权)人:国网山东省电力公司济宁供电公司国家电网有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1