一种远动信息源的自动审核方法及系统技术方案

技术编号:29760229 阅读:17 留言:0更新日期:2021-08-20 21:13
本发明专利技术公开了一种远动信息源的自动审核方法及系统,包括以下步骤:步骤S1、对远动信息源进行远动信息特征的提取,并对远动信息特征进行融合优化生成构建远动信息源快速且精准的自动审核的最优信息特征组合;步骤S2、利用所述最优信息特征组合将所述远动信息源进行同属性划分获得多组远动信息源集群;步骤S3、对所述远动信息源集群进行内相似性分析判别远动信息源的工况状态以实现远动信息源的自动审核。本发明专利技术采用层次聚类算法将台账参数、工况数据相似的远动信息源划分进同一远动信息源集群,能迅速判断哪台远动信息源处于异常状态,且异常检测准确率高。

【技术实现步骤摘要】
一种远动信息源的自动审核方法及系统
本专利技术涉及电力自动化
,具体涉及一种远动信息源的自动审核方法及系统。
技术介绍
电力系统远动为电力系统调度服务的远距离监测、控制技术,即管理和监控分布甚广的众多厂、所、站和设备、元器件的运行工况的一种技术手段。为了方便对每个电子系统的查询审核,通常采用统一标准、统一信号点命名规范、且不出现缺点漏点重复等人为差错作为远动信息标准化点表,只需要填入相关的电压等级和间隔名称即可直接导入远动系统的信息点表,针对不同的列表规则对比每个远动系统的信息电表即可发现每个远动系统的不足之处。但是在现有的技术中,利用远动信息点表进行远动信息源的人工审核判别远动信息源的工况状态,由于远动信息点表来自多个源头且侧重方向不同,会出现标准、规则不一的情况,人工审核无法将标准和规则整合且容易出现人为错漏、重复等现象,实际执行的效率低下,准确度低。
技术实现思路
本专利技术的目的在于提供一种远动信息源的自动审核方法及系统,以解决现有技术中实际执行的效率低下,准确度低的技术问题。为解决上述技术问题,本专利技术具体提供下述技术方案:一种远动信息源的自动审核方法,包括以下步骤:步骤S1、对远动信息源进行远动信息特征的提取,并对远动信息特征进行融合优化生成构建远动信息源快速且精准的自动审核的最优信息特征组合;步骤S2、利用所述最优信息特征组合将所述远动信息源进行同属性划分获得多组远动信息源集群;步骤S3、对所述远动信息源集群进行内相似性分析判别远动信息源的工况状态以实现远动信息源的自动审核。作为本专利技术的一种优选方案,所述步骤S1中,对远动信息源进行远动信息特征的提取的具体方法包括:步骤S101、收集远动信息源的台账日志,并在所述台账日志中随机抽取相同数量的正样本和负样本混合构成远动样本集,其中,所述正样本为处于同类工况状态的远动信息源的工况数据,所述负样本为处于他类工况状态的远动信息源的工况数据;步骤S102、对远动样本集中进行特征提取获得第一单阶特征,并将第一单阶特征利用相关性分析实现特征降维获得第二单阶特征;步骤S103、基于远动样本集获取所述第二单阶特征的特征值,并将第二单阶特征的特征值与第二单阶特征建立新映射获得第一远动信息源集群样本集。作为本专利技术的一种优选方案,所述步骤S102中,相关性分析实现特征降维的具体方法包括:依次将第一单阶特征中所有特征进行两两配对组合获得双特征对并将双特征对的特征值带入相关性计算公式获得双特征对的相关性系数,相关性系数计算公式为:其中,I为相关性系数,X为第一单阶特征,,为第一单阶特征中的第i,j个特征的特征值,是和的联合概率分布函数,而和分别是和的边缘概率分布函数;遍历选取相关性系数高于相关性阈值的第一双特征对,并在第一双特征对中随机选取第一特征,并对应删除所有双特征对中的第一特征,直至第一双特征对遍历完成;将所有双特征对进行配对拆分获得的第一单阶特征汇总构成第二单阶特征。作为本专利技术的一种优选方案,所述步骤S1中,对远动信息特征进行融合优化的具体方法包括:利用笛卡尔积将所述第二单阶特征进行编码融合获得第一多阶特征,并基于所述第一多阶特征对所述第一远动信息源集群样本集进行第一映射更新生成过渡远动信息源集群样本集;基于所述过渡远动信息源集群样本集利用多目标搜索策略筛选第一多阶特征获得最优多阶特征,并基于最优多阶特征对所述过渡远动信息源集群样本集进行第二映射更新获得第二远动信息源集群样本集。作为本专利技术的一种优选方案,所述多目标搜索策略筛选第一多阶特征获得最优多阶特征的具体方法包括:利用第一多阶特征在过渡远动信息源集群样本集中的正负样本的聚类准确度和第一多阶特征的使用数目构建多目标搜索策略的目标函数,所述目标函数为:;其中,;;其中,minf为目标函数值,和为权重常数,,MNI为聚类准确度,t为第一多阶特征的使用数目,,M为第一多阶特征的总数目,H为混合矩阵,表征为过渡远动信息源集群样本集中的所述正负样本的聚类集群结构中正负样本集群k内的样本同时处于所述正负样本的真实聚类集群结构中正负样本集群l内的数目,np1和np2分别是和划分结果中的集群个数,Hk和Hl分别为混合矩阵H中第k行和第l列的元素之和,N为过渡远动信息源集群样本集的样本数目;线性标定所述目标函数构建适应度函数,并利用多目标搜索算法求解所述目标函数获得一组由第一多阶特征组成的最优多阶特征的Pareto解集;选取所述最优多阶特征的Pareto解集中适应度值最高的解作为将远动信息源划分至多组远动信息源集群的最优多阶特征,所述适应度函数的计算公式为:;其中,F为适应度值,为目标函数值,为扰动常数。作为本专利技术的一种优选方案,所述步骤S2中,利用所述最优信息特征组合将所述远动信息源进行同属性划分获得多组远动信息源集群的具体方法包括:步骤一:基于所述最优多阶特征将所有远动信息源分别量化为单个远动信息源集群,其中表示第y台远动信息源的最优多阶特征的集合,表示第y台远动信息源的第个最优多阶特征,,,m为最优多阶特征的总数目,n为远动信息源的总数目;步骤二:依次计算两远动信息源集群的外相似性,并基于最大相似性进行集群融合归一,所述集群的相似性为两集群中相似性最大的一对远动信息源之间的相似性,所述相似性用果瓦系数进行度量:;其中,为远动信息源和远动信息源的果瓦系数,为远动信息源和远动信息源在和上的取值,和分别表示第y1、y2台远动信息源的第个最优多阶特征,为加权变量,,,m为最优多阶特征的总数目,n为远动信息源的总数目;步骤三:重复步骤二直至当前远动信息源集群总数目是最初远动信息源集群总数目的6%完成聚类。作为本专利技术的一种优选方案,所述步骤S3中,判别远动信息源的工况状态的具体方法包括:对各远动信息源集群中的所有远动信息源运行监测数据分别进行归一化处理为消除不同指标量纲带来的差异,所述归一化公式为:;其中,表示第台远动信息源的运行监测数据,表示第y台远动信息源的第类运行监测数据,n2表示集群中远动信息源的台数,表示归一化处理后第y台远动信息源的第类运行监测数据,p为运行监测数据的种类总数目,;量化同一集群中的远动信息源两两之间的距离,所述距离用欧式距离度量,所述欧式距离的计算公式为:;为远动信息源和远动信息源的欧式距离,、分别表示为第y1、y2台远动信息源的第类运行监测数据,,n2表示集群中远动信息源的总数目,,p为运行监测数据的种类总数目;设置距离阈值,基于所述距离阈值判定所述集群中远动信息源的运行状况。作为本专利技术的一种优选方案,所述基于所述距离阈值判定所述集群中远动信息源的运行状况的方法包括:若各远动信息源集群中与远动信息源y的距离大于距离阈值的远动信息源数量超过集群远动信息源总数目n2的85%本文档来自技高网...

【技术保护点】
1.一种远动信息源的自动审核方法,其特征在于,包括以下步骤:/n步骤S1、对远动信息源进行远动信息特征的提取,并对所述远动信息特征进行融合优化,生成用于最优信息特征组合;/n步骤S2、利用所述最优信息特征组合对所述远动信息源进行同属性划分,获得多组远动信息源集群;/n步骤S3、对所述远动信息源集群进行内相似性分析,判别远动信息源的工况状态,以实现远动信息源的自动审核。/n

【技术特征摘要】
1.一种远动信息源的自动审核方法,其特征在于,包括以下步骤:
步骤S1、对远动信息源进行远动信息特征的提取,并对所述远动信息特征进行融合优化,生成用于最优信息特征组合;
步骤S2、利用所述最优信息特征组合对所述远动信息源进行同属性划分,获得多组远动信息源集群;
步骤S3、对所述远动信息源集群进行内相似性分析,判别远动信息源的工况状态,以实现远动信息源的自动审核。


2.根据权利要求1所述的一种远动信息源的自动审核方法,其特征在于,所述步骤S1中,所述对远动信息源进行远动信息特征的提取,包括:
步骤S101、收集远动信息源的台账日志,并在所述台账日志中随机抽取相同数量的正样本和负样本混合构成远动样本集;其中,所述正样本为处于同类工况状态的远动信息源的工况数据,所述负样本为处于他类工况状态的远动信息源的工况数据;
步骤S102、对所述远动样本集进行特征提取获得第一单阶特征,将所述第一单阶特征利用相关性分析实现特征降维,获得第二单阶特征;
步骤S103、基于所述远动样本集获取所述第二单阶特征的特征值,基于第二单阶特征的特征值与所述第二单阶特征建立新映射,获得第一远动信息源集群样本集。


3.根据权利要求2所述的一种远动信息源的自动审核方法,其特征在于,所述步骤S102包括:
依次将第一单阶特征中所有特征进行两两配对组合获得双特征对,将所述双特征对的特征值带入相关性计算公式,获得双特征对的相关性系数;
相关性系数计算公式为:



其中,I为相关性系数,X为第一单阶特征,,为第一单阶特征中的第i,j个特征的特征值,是和的联合概率分布函数,而和分别是和的边缘概率分布函数;
遍历选取相关性系数高于相关性阈值的第一双特征对,在第一双特征对中随机选取第一特征,并对应删除所有双特征对中的第一特征,直至第一双特征对遍历完成;
将所有双特征对进行配对拆分所获得的第一单阶特征汇总构成第二单阶特征。


4.根据权利要求3所述的一种远动信息源的自动审核方法,其特征在于,所述步骤S1中,所述对所述远动信息特征进行融合优化,包括:
利用笛卡尔积将所述第二单阶特征进行编码融合获得第一多阶特征,基于所述第一多阶特征对所述第一远动信息源集群样本集进行第一映射更新生成过渡远动信息源集群样本集;
基于所述过渡远动信息源集群样本集,利用多目标搜索策略筛选第一多阶特征获得最优多阶特征,并基于最优多阶特征对所述过渡远动信息源集群样本集进行第二映射更新获得第二远动信息源集群样本集。


5.根据权利要求4所述的一种远动信息源的自动审核方法,其特征在于,所述基于所述过渡远动信息源集群样本集,利用多目标搜索策略筛选第一多阶特征获得最优多阶特征,包括:
利用第一多阶特征在过渡远动信息源集群样本集中的正负样本的聚类准确度和第一多阶特征的使用数目构建多目标搜索策略的目标函数,所述目标函数为:


其中,;


其中,minf为目标函数值,和为权重常数,,MNI为聚类准确度,t为第一多阶特征的使用数目,,M为第一多阶特征的总数目,H为混合矩阵,表征为过渡远动信息源集群样本集中的所述正负样本的聚类集群结构中正负样本集群k内的样本同时处于所述正负样本的真实聚类集群结构中正负样本集群l内的数目,np1和np2分别是和划分结果中的集群个数,Hk和Hl分别为混合矩阵H中第k行和第l列的元素之和,N为过渡远动信息源集群样本集的样本数目;
线性标定所述目标函数构建适应度函数,并利用多目标搜索算...

【专利技术属性】
技术研发人员:段孟雍钟志明汪杰苏俊妮李波武天龙刘沛林
申请(专利权)人:广东电网有限责任公司东莞供电局
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1