一种基于决策树的电网故障信息分类方法技术

技术编号:26172875 阅读:22 留言:0更新日期:2020-10-31 13:52
本发明专利技术涉及一种基于决策树的电网故障信息分类方法,将由电网设备参数得到的所有有可能的故障信息类别作为特征属性形成数据集并将数据集放在根节点上,然后遍历数据集内每一种特征属性的所有分割方式,最终选择出最优的特征属性及该特征属性的最优分割方式,实现决策树的构建,并进行剪枝操作找到最接近的电网故障信息类别。本发明专利技术给出了构建电网故障信息分类决策树的具体方法,详细的阐述了该决策树的构建过程,基于标准的以数学方法构建的决策树,能够对电网故障信息进行分类,找到最接近的电网故障信息类别,比人工分析更加科学客观,判断的更加准确,精度更高。

【技术实现步骤摘要】
一种基于决策树的电网故障信息分类方法
本专利技术属于电网故障信息处理
,具体涉及一种基于决策树的电网故障信息分类方法。
技术介绍
决策树是一种直观应用概率分析的一种图解法,在已知各种情况发生概率的基础上,能通过构建决策树来进行分析,它是一种预测模型,代表的是对象属性与对象值之间的映射关系。决策树是一种树形结构,其中每个内部节点表示一个属性的测试,每个分支表示一个测试输出,每个叶节点代表一种类别,是一种非常常用的有监督的分类算法。决策树的决策过程就是从根节点开始,测试待分类项中对应的特征属性,并按照其值选择输出分支,直到叶子节点,然后将叶子节点的存放类别作为决策结果。电力的安全、可靠、有效供应,是现代社会正常运转的重要物质基础,保证电力安全可靠供应、强化电网运行风险管控是电力调度部门的重要任务,因此,如何对电网运行风险科学、客观地评估及采取全面、有效的组织、技术管控措施,也成为了电力调度运行工作研究的重要课题。目前,电网运行风险评估及管控措施是通过调度、运维、安质、营销等相关专业人员进行人工分析,但是由于分析人员的主观因素比较大,可能存在电网故障信息考虑不准确或不全面的情况,影响电网运行风险的科学性、客观性和管控措施的有效性。因此,提出一种精确度高的、科学的基于决策树的电网故障信息分类方法是很有必要的。
技术实现思路
本专利技术的目的是为了克服现有技术的不足,而提供一种基于决策树的电网故障信息分类方法,能够通过构建决策树对电网故障信息进行分类,找到最接近的电网故障信息类别,基于标准的以数学方法构建的决策树,比人工分析更加科学客观,判断的更加准确,精度更高。本专利技术采用的技术方案为:一种基于决策树的电网故障信息分类方法,包括如下步骤:A.采集所需要的各个电网设备参数,作为数据集,并将数据集放在根节点上;B.根据数据集内各个电网设备参数,找到所有有可能的故障信息类别作为特征属性,并将其分别看作一个一个的节点分支;C.遍历每一种特征属性的所有分割方式,分别找到这些特征属性最好的分割点,然后选择出最优的特征属性及该特征属性的最优分割方式,得到子节点N1、N2、……、Nm。D.对得到的子节点分别继续执行遍历当前特征属性的每一种分割方式和遍历所有特征属性的分割方式的操作,直到子节点的记录数小于给定阈值同时迭代次数达到给定阈值时,停止决策树的构建。E.对构建好的决策树进行剪枝操作,直到每个子节点中数据都属于同一类为止,得到更精确的电网故障信息类别。具体地,在所述步骤B中,找到数据集内的所有特征属性,并将其分别看作一个一个的节点分支具体为:B1.根据不同类型的电网设备,当电网设备的参数是离散值,且不需要生成二叉决策树时,此时一个特征属性就是一个节点分支;B2.根据不同类型的电网设备,当电网设备的参数是离散值,且需要生成二叉决策树时,此时使用特征属性划分的子集进行测试,按照属于此子集和不属于此子集,分成两个节点分支;B3.根据不同类型的电网设备,当电网设备的参数是连续值时,根据具体要求确定一个分裂点,按照大于此分裂点和小于此分裂点形成两个节点分支。具体地,在所述步骤C中,分别找到这些特征属性最好的分割点,具体为:对所有特征属性的每一种分割方式进行分割后的结果集的纯度进行比较,选择结果集纯度高的分割方式作为特征属性最好的分割点进行分割操作具体地,所述结果集的纯度能通过熵值进行计算,计算出各个特征属性的量化纯度值之后,使用信息增益度来选择出当前数据集的分割特征属性,如果信息增益度的值越大,表示在该特征属性上会损失的纯度越大,那么该特征属性就应该在决策树的上层;所述信息增益度的计算公式为:Gain=D=H(D)-H(D|A)式中,Gain表示A为特征属性时对数据集D的信息增益,H(D)为数据集D的经验熵,H(D|A)为特征A在给定条件下D的经验条件熵。具体地,在所述步骤D中,指定阈值由熵系数最小的那个节点决定。具体地,所述步骤E中,对构建好的决策树进行剪枝操作具体为:E1.对于构建好的决策树T0,计算所有内部非叶子节点的剪枝系数;E2.查找最小剪枝系数的节点,对其子节点进行删除操作,进行剪枝得到决策树,如果存在多个最小剪枝系数的节点,选择包含数据项最多的节点进行剪枝操作;E3.重复步骤E1和E2,直到产生的剪枝决策树Tk只有一个节点,最终得到T0、T1、T2、……、Tk;E4.用验证集选择最优子树,得到的最优子树即为更精确的电网故障信息类别。本专利技术的有益效果:本专利技术将由电网设备参数得到的所有有可能的故障信息类别作为数据集放在根节点上,然后遍历数据集内每一种特征属性的所有分割方式,最终选择出最优的特征属性及该特征属性的最优分割方式,实现决策树的构建,并进行剪枝操作找到最接近的电网故障信息类别,基于标准的以数学方法构建的决策树,比人工分析更加科学客观,判断的更加准确,精度更高。附图说明图1为本专利技术的流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围,以下结合实施例进行详细说明。实施例1如图1所示,本专利技术包括如下步骤:A.采集所需要的各个电网设备参数,作为数据集,并将数据集放在根节点上;B.根据数据集内各个电网设备参数,找到所有有可能的故障信息类别作为特征属性,并将其分别看作一个一个的节点分支;C.遍历每一种特征属性的所有分割方式,分别找到这些特征属性最好的分割点,然后选择出最优的特征属性及该特征属性的最优分割方式,得到子节点N1、N2、……、Nm。D.对得到的子节点分别继续执行遍历当前特征属性的每一种分割方式和遍历所有特征属性的分割方式的操作,直到子节点的记录数小于给定阈值同时迭代次数达到给定阈值时,停止决策树的构建。E.对构建好的决策树进行剪枝操作,直到每个子节点中数据都属于同一类为止,得到更精确的电网故障信息类别。本专利技术将由电网设备参数得到的所有有可能的故障信息类别作为特征属性形成数据集并将数据集放在根节点上,然后遍历数据集内每一种特征属性的所有分割方式,最终选择出最优的特征属性及该特征属性的最优分割方式,实现决策树的构建,并进行剪枝操作找到最接近的电网故障信息类别,本专利技术给出了构建电网故障信息分类决策树的具体方法,详细的阐述了该决策树的构建过程,基于标准的以数学方法构建的决策树,能够对电网故障信息进行分类,找到最接近的电网故障信息类别,比人工分析更加科学客观,判断的更加准确,精度更高。实施例2如图1所示,本专利技术包括如下步骤:A.采集所需要的各个电网设备参数,作为数据集,并将数据集放在根节点上;B.根据数据集内各个电网设备参数,找到所有有可能的故障信息类别作为特本文档来自技高网...

【技术保护点】
1.一种基于决策树的电网故障信息分类方法,其特征在于,包括如下步骤:/nA.采集所需要的各个电网设备参数,作为数据集,并将数据集放在根节点上;/nB.根据数据集内各个电网设备参数,找到所有有可能的故障信息类别作为特征属性,并将其分别看作一个一个的节点分支;/nC.遍历每一种特征属性的所有分割方式,分别找到这些特征属性最好的分割点,然后选择出最优的特征属性及该特征属性的最优分割方式,得到子节点N1、N2、……、Nm。/nD.对得到的子节点分别继续执行遍历当前特征属性的每一种分割方式和遍历所有特征属性的分割方式的操作,直到子节点的记录数小于给定阈值同时迭代次数达到给定阈值时,停止决策树的构建。/nE.对构建好的决策树进行剪枝操作,直到每个子节点中数据都属于同一类为止,得到更精确的电网故障信息类别。/n

【技术特征摘要】
1.一种基于决策树的电网故障信息分类方法,其特征在于,包括如下步骤:
A.采集所需要的各个电网设备参数,作为数据集,并将数据集放在根节点上;
B.根据数据集内各个电网设备参数,找到所有有可能的故障信息类别作为特征属性,并将其分别看作一个一个的节点分支;
C.遍历每一种特征属性的所有分割方式,分别找到这些特征属性最好的分割点,然后选择出最优的特征属性及该特征属性的最优分割方式,得到子节点N1、N2、……、Nm。
D.对得到的子节点分别继续执行遍历当前特征属性的每一种分割方式和遍历所有特征属性的分割方式的操作,直到子节点的记录数小于给定阈值同时迭代次数达到给定阈值时,停止决策树的构建。
E.对构建好的决策树进行剪枝操作,直到每个子节点中数据都属于同一类为止,得到更精确的电网故障信息类别。


2.根据权利要求1所述的基于决策树的电网故障信息分类方法,其特征在于,在所述步骤B中,找到数据集内的所有特征属性,并将其分别看作一个一个的节点分支具体为:
B1.根据不同类型的电网设备,当电网设备的参数是离散值,且不需要生成二叉决策树时,此时一个特征属性就是一个节点分支;
B2.根据不同类型的电网设备,当电网设备的参数是离散值,且需要生成二叉决策树时,此时使用特征属性划分的子集进行测试,按照属于此子集和不属于此子集,分成两个节点分支;
B3.根据不同类型的电网设备,当电网设备的参数是连续值时,根据具体要求确定一个分裂点,按照大于此分裂点和小于此分裂点形成两个节点分支。


3.根据权利要求1所述的基于决策树的电网故障信息分类方法,其特...

【专利技术属性】
技术研发人员:李忠良丁东坡荣家鹏范不井刘颖谢文娟宋晓谢冬冬
申请(专利权)人:国网河南省电力公司焦作供电公司
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1