一种基于电力调度数据的数据挖掘方法技术

技术编号:11854680 阅读:48 留言:0更新日期:2015-08-11 00:25
本发明专利技术涉及智能电网电力调度领域,尤其涉及一种基于电力调度数据的数据挖掘方法,包括:(1)对电力调度数据根据关联规则进行数据挖掘,挖掘得到规则集R,S为满足支持度阈值的项目的集合,并设该集合的X2检验的显著水平为T;(2)对规则集R进行CS测试,把所有规则分为有用规则和无用规则;(3)删除无用规则,并对有用规则进行分类测试,得到代表规则r;(4)按照规则级别从高到低将代表规则r进行排列,形成代表规则集Rd;(5)把原始规则集R中除去代表规则集Rd的规则形成非代表规则集Rnd。本发明专利技术综合考虑了对关联规则集进行概括、保持关联规则集的完整性、删除用户不感兴趣的规则和删除冗余规则四个方面。

【技术实现步骤摘要】

本专利技术涉及智能电网电力调度领域,尤其涉及一种基于电力调度数据的数据挖掘 方法。
技术介绍
电力系统是我国重要的能源部门,它直接影响和控制人民的生活用电以及其他行 业的生产,在国民经济生产过程当中占有非常重要的地位与作用,因此,确保其正常、安全 运行是第一要务。为了确保电力系统的安全运作,需要实时对其的运行状态进行监管,在监 管的过程当中还需要对其运行的性能进行评估,从大量数据中找出规律和模式,以帮助人 们更好地利用数据进行决策和研究。数据挖掘是从大量已有的数据中发现未知的、具有潜 在应用价值的信息。在电力调度系统中,经过长年累月积聚下来的数据量是相当惊人的,在 这些海量数据中同时蕴藏着大量未知的、潜在的和有价值的信息。然而,如此庞大的数据对 人工处理来说是非常困难的。因此,在电力调度系统中应用数据挖掘技术,具有非常重要的 意义。 现有的数据挖掘一般通过关联规则来挖掘数据,关联规则是数据依赖关系的有效 描述方法,是数据挖掘研究的重要内容。然而数据集的庞大,往往导致所生成的关联规则的 数量也很庞大,对用户来说,大量而无组织的规则使得分析和使用起来十分困难。同时,在 生成的规则中有相当一部分是冗余的。这些冗余的部分对于数据挖掘并没有多大的信息价 值,保留其不利于数据挖掘的准确性和易用性。
技术实现思路
本专利技术为克服上述的不足之处,目的在于提出了一种基于电力调度数据的数据挖 掘方法,该方法消除了由传统数据挖掘方法所生成的大量冗余关联规则,并且使用户可以 从整体上把握整个规则集,提高了关联规则挖掘的准确性和易用性。本专利技术是通过以下技术方案达到上述目的:一种基于电力调度数据的数据挖掘方 法,包括步骤: (1)对电力调度数据根据关联规则进行数据挖掘,挖掘得到规则集R,S为满足支 持度阈值的项目的集合,并设该集合的X2检验的显著水平为T; (2)对规则集R进行CS测试,根据测试结果把所有规则分为有用规则和无用规 则; (3)删除无用规则,并对有用规则进行分类测试,得到代表规则r; (4)按照规则级别从高到低将代表规则r进行排列,形成代表规则集Rd; (5)把原始规则集R中除去代表规则集Rd的规则形成非代表规则集Rnd。 作为优选,所述步骤(2)中的CS测试步骤包括: (1)按照规则级别从高到低分别对规则集R中的规则r计算可信度; (2)比较规则r的可信度与其祖先规则可信度大小,选取所有可信度大于其祖先 规则的规则组成新的规则集Rt ; (3)对Rt中的所有规则进行X2测试; (4)若规则的X2值大于T,则标记为有用规则;反之,则标记为无用规则。 作为优选,所述规则集R包括所有满足支持度与可信度的规则。 本专利技术的有益效果在于:(1)提高了关联规则挖掘的准确性和易用性;(2)保持关 联规则集的完整性,对关键规则集进行囊括;(3)删除了用户不感兴趣的规则冗余的规则。【附图说明】 图1是本专利技术方法的方法步骤流程图。【具体实施方式】 下面结合具体实施例对本专利技术进行进一步描述,但本专利技术的保护范围并不仅限于 此: 实施例:如图1所示,一种基于电力调度数据的数据挖掘算法,具体包括以下步 骤: (1)对电力调度数据根据关联规则进行数据挖掘,挖掘得到规则集R,S为满足支 持度阈值的项目的集合,并设该集合的X2检验的显著水平为T; (2)对规则集R进行CS测试,根据测试结果把所有规则分为有用规则和无用规 则; (3)删除无用规则,并对有用规则进行分类测试,得到代表规则r; (4)按照规则级别从高到低将代表规则r进行排列,形成代表规则集Rd; (5)把原始规则集R中除去代表规则集Rd的规则形成非代表规则集Rnd。 输入:使用关联规则算法挖掘所得的规则集R,满足支持度阈值的项目的集合 S(480项),对应一定显著水平T的X2值(记为T)。 输出:代表规则集Rd,非代表规则集Rnd。 步骤 1:fori= 1tondo 步骤 2:foreachr(X-yGR)oflevel_ido 步骤 3 :chi_squ_test(r,R,S,T)步骤 4 :if(r.prune=0)and(r.dele_ance=NIL)thenRtemp -RtempU{r}endif 步骤 5 :end_for 步骤 6 :if(Rtemp 尹NIL)then步骤7Classification(Rtemp,R)步骤 8:Rd -RdURtemp 步骤 9:end_if 步骤 10 :end_for 步骤 11 :Rnd ={rGR-Rd|r.prune= 0} 规则集R包括所有满足支持度与可信度阈值的规则,S中包括所有满足最小支持 度限制的项目,代表规则集Rd与非代表规则集Rnd的初值为空。步骤1-10步,对1级到n 级的规则执行修剪与分类操作,n为规则级别的最大值。步骤的第3步执行过程chi_SqU_ test对当前规则r的意义进行测试。若r被删除,则chi_squ_test将r.prune设为1 ;否 则设为0。第4步判断如果r.prune为0且r的dele_ance域(即r的最近满足规则的集 合)为空,则r即为代表规则,将r加入临时代表规则集(RtMP)。算法的第6步判断RtMP是 否为空,如果不为空,则算法第7步执行过程Classification对级别为i的代表规则进行分 类。算法第8步将经过分类的第i级代表规则加入代表规则集Rd。算法的第11步形成非 代表规则集Rnd。 以下是chi_squ_test(r,R,S,T)的具体步骤如下:步骤 12:fori=level_r_lto0do步骤 13:foreach(ra |raGRUS)and(C'价 你)and(ra.cons=r.cons) and(ra.prune= 0)oflevel」do步骤 14 :if(r.conf>ra.conf)then步骤 15 :test_count++步骤 16 :if(X2 (r,ra) >T)then步骤 17 :r.prune= 0步骤 18 :if((茫S)thenr.dele_ance=r.dele_anceUra;endif步骤 19 :endif步骤 20 :endif步骤 21 :endfor步骤 22 :iftest_count>0thenexit_for;endif步骤 23 :endfor 步骤的第12-23步对r的祖先规则由高级别向低级别测试。第12-22步对r的第 i级祖先规则进行测试,第13步中r.ante是规则r的前提,r.cons是规则r的结论;第14 步判断r的可信度是大于此祖先规则;若成立,第15步进行将测试计数加1 (test_count初 值为〇);第16步进行X2测试,如果结果大于T,则第17步将r标记为不可删除,即r.prune =0(r.prune初值为1);第18步判断ra是否是无前提规则,如果不是,则将ra放入r的 dele_anCe集(r的最近满足规则的集合);第22步判断r是否已被测试,若是,可结束测 试;否则,继续对下一级别祖先规则进行测试。 以下是Classification(Rtemp,R)的具体步骤如下: 步骤24 :While(rGRtemp,且r未被用户分类本文档来自技高网...

【技术保护点】
一种基于电力调度数据的数据挖掘方法,其特征在于包括步骤:(1)对电力调度数据根据关联规则进行数据挖掘,挖掘得到规则集R,S为满足支持度阈值的项目的集合,并设该集合的X2检验的显著水平为T;(2)对规则集R进行CS测试,根据测试结果把所有规则分为有用规则和无用规则;(3)删除无用规则,并对有用规则进行分类测试,得到代表规则r;(4)按照规则级别从高到低将代表规则r进行排列,形成代表规则集Rd;(5)把原始规则集R中除去代表规则集Rd的规则形成非代表规则集Rnd。

【技术特征摘要】

【专利技术属性】
技术研发人员:周天和卢晓飞张元元
申请(专利权)人:杭州天宽科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1