一种基于数据挖掘的电网设备运行状态智能校验方法技术

技术编号:13392750 阅读:78 留言:0更新日期:2016-07-22 18:26
本发明专利技术提出一种基于数据挖掘的电网设备运行状态智能校验方法,利用电网监控系统中的告警文本,采用对比文本空间特征向量的方法确定设备的运行状态。同时结合数据挖掘方法对历史存档的操作指令票挖掘设备运行状态的关联规则。以设备实际运行状态与关联规则为基础校核设备运行状态是否合理。有效解决了电网调度操作、方式变换时,因人为原因导致的电网一次、二次设备运行状态不对应的问题。辅助电网调度人员及时发现电网设备运行状态不合理的地方,可有效防止停电事故的扩大,保持电网的安全稳定运行。

【技术实现步骤摘要】
一种基于数据挖掘的电网设备运行状态智能校验方法
本专利技术涉及电网调度的人工智能
,更具体的说,涉及一种基于数据挖掘的电网设备运行状态智能校验方法。
技术介绍
我国电力企业实际生产中,在进行电网方式倒换时采取的模式是,调度部门下令、设备运维人员执行的模式。在该种模式下调度人员通过设备运维人员反映的设备运行状态来掌控电网的运行状态,若运维人员在汇报设备运行状态或执行操作指令时存在偏差则会给电网或电气设备造成损害。随着变电和输电设备的自动化改造不断深入,以往变电站值守的运维模式逐渐在向无人值守的模式进行转化,大幅提高了电网的智能化水平、节省了人力支出。但是,相对于传统的变电站值守模式,无人值守模式下的变电运维人员对于电网设备运行状态的熟悉程度下降。调度人员掌握的电网运行情况可能与实际设备的运行状态存在偏差,从而可能导致人为的电网事故发生。目前电网企业普遍采用的“五防”设备可以避免电网一次设备(断路器、刀闸)的恶性误操作,保障关于电网一次设备的调度指令准确执行。但是电网二次设备(即保护装置、自动化装置)需要与一次设备的运行状态相配合,此类设备的人为操作疏漏目前却无法有效防范。二次设备的人为疏漏往往具有隐蔽性,当电网正常运行时无任何异常,但当电网出现故障时会“放大”故障的影响后果。例如:重合闸未投会导致瞬时故障引发负荷丢失,使得原本不该丢失的负荷丢失;备自投装置未加用会导致变电站失压;联切装置未投可能导致系统解列。因此,结合电网企业生产的实际情况,研究对应的补足方法,提高电网可靠性成为目前亟需解决的问题。>目前全国绝大部分110kV及以上电压等级的变电站都采用集中监控的模式进行管理,现场电力设备的状态信号都通过通信设施直接传输到调控中心以文本的形式展示给电网监控人员。当电网设备运行状态变更时都会发出大量的电气量信号、物理信号,若能够找到反映电网设备运行状态的信号特征量则能够有效辨识电网设备的运行状态,为电网调度部门建立一套独立于“运维人员上报”的电网设备运行状态反馈通道,降低调度指令传达或执行中的偏差。同时,电网调度中长期历史存档的电网调度操作指令票可以反映电网设备运行状态之间的关联规则。若能够提出一套合理的挖掘算法则可以建立设备运行状态的关联规则库,辅助电网设备运行状态的校验。
技术实现思路
本专利技术的目的在于提出一种基于数据挖掘的电网设备运行状态智能校验方法。以调度监控收到的信号为样本,通过聚类分析的方法形成典型的设备运行状态特征向量,实现对设备运行状态信号的自动核对和辨识;采用规则挖掘的方法分析历史存档的电网调度操作指令票,建立电网设备运行状态的规则库。从而实现智能校验电网设备运行状态,预防电网设备运行状态异常导致的电网事故,最终达到提高电网运行可靠性,保障电网安全稳定运行的目的。一种基于数据挖掘的电网设备运行状态智能校验方法,依次包括以下步骤:采用聚类分析的方法,辨识电网设备的实时运行状态;采用数据挖掘的方法分析电网调度操作指令票,得出电网关联设备运行状态之间的关联规则;根据电网设备运行状态的关联规则和实时的电网设备运行状态,自动校验电网设备运行状态是否合理。所述采用聚类分析的方法,辨识电网设备的实时运行状态,包括以下步骤:步骤一:建立不同设备运行状态变位信息文本,根据电网企业生产实际情况划分不同类型的运行状态,当电网设备运行状态转换时发送至调度监控平台的信息是典型的触发式告警信息,即当有设备状态改变时发出对应信息;根据电网设备状态转换时调度监控平台实际接收的告警信息,建立不同设备在不同运行状态下的典型告警信息模板,并记作K(t,z,c),其中t为设备类型、z为设备状态转换的标的运行状态,c为对应的告警信息模板,即t设备转换到z状态时发出的信息;步骤二:根据互现系数M(X,Y)初步提取文本关键词汇,由于电网设备运行状态的告警信息是由电网设备发出的标准化调度术语,信息文本中对同一事物的描述方式都相对固定,因此可以采用基于统计的分词方法对文本进行分词处理和统计。按照式(1)统计两个汉字的互现信息系数:其中M(X,Y)为汉字X和Y的互现信息系数,P(X,Y)为X、Y相邻出现在文本中的几率,P(X)、P(Y)分别为汉字X、Y在文本中出现的几率,相邻的两个字同时出现的次数越多,其可信度越高,由汉字X、Y组成的词组也越有可能成为关键词,将互现系数M(X,Y)>0的词条计入文本特征项集合;然后去除平凡词,电网监控信息中会存在大量含有“的”、“了”等平凡词,上述平凡词对于文本描述的内容无贡献,因此将这类词排除在外,最终形成典型信息文本的特征项集合:θ={δ1,δ2,δ3…δn},其中δi(i=1,2,…,n)为筛选后得到的关键词;步骤三:采用TF-IDF特异性计算公式计算关键词的权重,其公式如下式(2)所示:其中,f(δi,d)为词条δi在文档中出现频率,N为所有文档的个数,ni为含有词条δi的文档个数,由TF-IDF公式计算得到的权重系数表征了词条的特异性,若wi越大则表明词条δi的特异性越高,在不同文档中出现的比率越低,但在单个文档中出现的频次越高,那么词条δi用于表征文档d的可信度越高;步骤四:建立不同设备运行状态转换时所发出文本信息的空间特征向量,通过步骤三可以计算得到不同词条在文档中的权重,经过归一化处理后的权重为:因此任意文档可以表征为一个二维向量,其形式如下式(4)所示:{[δ1,W1],[δ2,W2],…[δn,Wn]}(4)如果将不同的词条看作一个坐标轴,那么该二维向量则可以看作是该空间中的一个向量;由以上步骤则可以建立电网中每个设备在不同状态下的空间特征向量记做式(5):ψ(i,t)={[δ1,W1],[δ2,W2],…[δn,Wn]}(5)ψ(i,t)为设备i转换到状态t时电网监控平台收到文本的空间特征向量,i为设备名称,t为设备转换的标的状态,δi(i=1,2,…n)为关键词,Wi(i=1,2,…n)为关键词对应权重;步骤五:根据关键词汇库建立实时文本信息的空间特征向量,采集调度监控系统实时信息,建立不同设备的信息状态文本列向量,列向量维度为m,根据接收时间将收到的设备运行状态信息加入列向量,即一个列向量对应一个具体电网设备,每个列向量只保留最新的m条电网状态信息文本;通过处理可以将全电网最近时段的设备运行状态表示为m×n的矩阵,其形式如下式(6)所示:其中Q为近段时间内调度监控信息平台接收到的所有信息报文集合,m为列向量维数,令m=20,即保留设备最近的20条状态信息文本,n为电网中设备的总数,Ci为对应设备i最近收到20条状态信息文本集合,cij为对应设备的运行状态信息报文;步骤六:采用夹角余弦公式对比实时信息文本和典型文本,初步辨识设备运行状态,采用式(1)~(4)对Ci进行处理可以建立设备i最近时段的空间特征向量,记做ω(i)={[δ1,W1],[δ2,W2],…[δn,Wn]},采用夹角余玄公式计算计算本文档来自技高网...

【技术保护点】
一种基于数据挖掘的电网设备运行状态智能校验方法,其特征在于,依次包括以下步骤:采用类聚分析的方法,辨识电网设备的实时运行状态;采用数据挖掘的方法分析电网调度操作指令票,得出电网关联设备运行状态之间的关联规则;根据电网设备运行状态的关联规则和实时的电网设备运行状态,自动校验电网设备运行状态是否合理。

【技术特征摘要】
1.一种基于数据挖掘的电网设备运行状态智能校验方法,其特征在于,依次包括以下步骤:
采用聚类分析的方法,辨识电网设备的实时运行状态;
采用数据挖掘的方法分析电网调度操作指令票,得出电网关联设备运行状态之间的关联规则;
根据电网设备运行状态的关联规则和实时的电网设备运行状态,自动校验电网设备运行状态是否合理;
所述采用聚类分析的方法,辨识电网设备的实时运行状态,包括以下步骤:
步骤一:建立不同设备运行状态变位信息文本,根据电网企业生产实际情况划分不同类型的运行状态,当电网设备运行状态转换时发送至调度监控平台的信息是典型的触发式告警信息,即当有设备状态改变时发出对应信息;根据电网设备状态转换时调度监控平台实际接收的告警信息,建立不同设备在不同运行状态下的典型告警信息模板,并记作K(t,z,c),其中t为设备类型、z为设备状态转换的标的运行状态,c为对应的告警信息模板,即t设备转换到z状态时发出的信息;
步骤二:根据互现系数M(X,Y)初步提取文本关键词汇,由于电网设备运行状态的告警信息是由电网设备发出的标准化调度术语,信息文本中对同一事物的描述方式都相对固定,因此可以采用基于统计的分词方法对文本进行分词处理和统计;按照式(1)统计两个汉字的互现信息系数:



其中M(X,Y)为汉字X和Y的互现信息系数,P(X,Y)为X、Y相邻出现在文本中的几率,P(X)、P(Y)分别为汉字X、Y在文本中出现的几率,相邻的两个字同时出现的次数越多,其可信度越高,由汉字X、Y组成的词组也越有可能成为关键词,将互现系数M(X,Y)>0的词条计入文本特征项集合;然后去除平凡词,最终形成典型信息文本的特征项集合:θ={δ1,δ2,δ3…δn},其中δi(i=1,2,…,n)为筛选后得到的关键词,
步骤三:采用TF-IDF特异性计算公式计算关键词的权重,其公式如下式(2)所示:



其中,f(δi,d)为词条δi在文档中出现频率,N为所有文档的个数,ni为含有词条δi的文档个数,由TF-IDF公式计算得到的权重系数表征了词条的特异性,若wi越大则表明词条δi的特异性越高,在不同文档中出现的比率越低,但在单个文档中出现的频次越高,那么词条δi用于表征文档d的可信度越高;
步骤四:建立不同设备运行状态转换时所发出文本信息的空间特征向量,通过步骤三可以计算得到不同词条在文档中的权重,经过归一化处理后的权重为:



因此任意文档可以表征为一个二维向量,其形式如下式(4)所示:
{[δ1,W1],[δ2,W2],…[δn,Wn]}(4)
如果将不同的词条看作一个坐标轴,那么该二维向量则可以看作是该空间中的一个向量;
由以上步骤则可以建立电网中每个设备在不同状态下的空间特征向量记做式(5):
ψ(i,t)={[δ1,W1],[δ2,W2],…[δn,Wn]}(5)
ψ(i,t)为设备i转换到状态t时电网监控平台收到文本的空间特征向量,i为设备名称,t为设备转换的标的状态,δi(i=1,2,…n)为关键词,Wi(i=1,2,…n)为关键词对应权重;
步骤五:根据关键词汇库建立实时文本信息的空间特征向量,采集调度监控系统实时信息,建立不同设备的信息状态文本列向量,列向量维度为m,根据接收时间将收到的设备运行状态信息加入列向量,即一个列向量对应一个具体电网设备,每个列向量只保留最新的m条电网状态信息文本;通过处理可以将全电网最近时段的设备运行状态表示为m×n的矩阵,其形式如下式(6)所示:



其中Q为近段时间内调度监控信息平台接收到的所有信息报文集合,m为列向量维数,令m=20,即保留设备最近的20条状态信息文本,n为电网中设备的总数,Ci为对应设备i最近收到20条状态信息文本集合,cij为对应设备的运行状态信息报文;
步骤六:采用夹角余弦公式对比实时信息文本和典型文本,初步辨识设备运行状态,采用式(1)~(4)对Ci进行处理可以建立设备i最近时段的空间特征向量,记做ω(i)={[δ1,W1],[δ2,W2],…[δn,Wn]},采用夹角余玄公式计算计算ω(i)与ψ(i,t)的相似度,其计算公式如下式(7)所示:



其中为告警信息文档ω(i)、ψ(i,t)在空间{δ1,δ2,…δn}中的特征向量:[W1,W2…Wn]和[Wt,1,Wt,2…Wt,n],由此可以计算得出设备在不同运行状态的相似度,在此基础上逐个删除Ci中的状态信息报文cij,再次计算删除后文本集合与典型文本的相似度,若相似度增加则继续筛选删除,若减小则删除其他报文,如此反复直至相似度达到最高;可以计算得出电网设备i与不同运行状态相比较的相似度,确定相似度最大的状态为电网设备的运行状态。


2.根据权利要求1所述一种基于数据挖掘的电网设备运行状态智能校验方法,其特征在于,所述采用数据挖掘的方法分析电网调度操作指令票,得出电网关联设备运行状态之间的关联规则,包括以下步骤:
步骤一:分析操作票指令,提取操作执行后的设备运行状态,首先建立电力网络状态模型,将母线、断路器、变压器作为节点,将输电线路等效为网络拓扑模型中的边,增加断路器和母线、线路之间的虚拟连接并简化为网络拓扑模型中的边,增加母线和变压器之间的虚拟连接并简化为网络拓扑模型中的边;由此可以得到表征电网中电气设备连接关系的连接矩阵A0:






式中G0为电力系统的将电力网络抽象得到的简单图,eij为节点i到节点j的边,n为电网中母线...

【专利技术属性】
技术研发人员:舒征宇刘庆国胡为民余振华张伟奇陈珣向昆
申请(专利权)人:国家电网公司国网湖北省电力公司宜昌供电公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1