一种电力物联网设备数据标签生成方法及系统技术方案

技术编号:36220163 阅读:34 留言:0更新日期:2023-01-04 12:18
本发明专利技术公开了一种电力物联网设备数据标签生成方法及系统,所述方法包括以下步骤:获取选定类型电力设备的数据模型、数据表和文档类数据,构建设备统一ID并进行数据质量处理;按照数据内容增加数据类型字段,字段值包括属性数据、运行数据和状态数据,形成原始数据集;定义标签信息格式和类型,采用单句形式构建标签业务规则库和规则转换库,采用机器学习构建分析标签模型库;调用标签任务调度引擎,基于标签业务规则库和规则转换库处理原始数据集,生成基础标签;调用标签任务调度引擎和分析标签模型库,利用模型分析结果生成分析标签。本发明专利技术可解决电力物联网设备故障诊断的技术瓶颈,提升电网设备的监控运维智能化水平。提升电网设备的监控运维智能化水平。提升电网设备的监控运维智能化水平。

【技术实现步骤摘要】
一种电力物联网设备数据标签生成方法及系统


[0001]本专利技术属于电力数据智能处理
,特别涉及一种电力物联网设备数据标签生成方法及系统。

技术介绍

[0002]随着电力物联网规模的快速发展,各类智能设备的不断接入使得电网的结构日益复杂,设备数据量也随之急剧增长。当电网运行发生异常或故障时,海量的设备上报事件会大量涌入监控系统并随着时间快速变化,给设备运维人员准确定位故障原因和全面评估运行状态带来沉重的工作负担。另外,电力设备涉及到多个业务领域,包括调控云、PMS、OMS、保信子站、D5000、输变电在线监测等多个系统,不同系统采集设备数据的侧重点不尽相同;例如,调度领域重点采集设备运行状态数据,输变配电领域重点采集设备台账、量测和缺陷故障数据等,不同的设备数据在结构上差异很大。
[0003]近年来,电力企业围绕设备数据贯通、故障智能诊断构建了一系列应用、模型和方法,但随着电力设备智能监控需求日趋增强,仍面临着以下问题:
[0004]1)设备数据融合不彻底:电网各专业针对重点关注的设备数据,围绕自身业务开展设计了专用的数据本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种电力物联网设备数据标签生成方法,其特征在于,包括以下步骤:获取选定类型电力设备的数据模型、数据表和文档类数据,构建设备统一ID并进行数据质量处理;按照数据内容增加数据类型字段,字段值包括属性数据、运行数据和状态数据,形成原始数据集;定义标签信息格式和类型,采用单句形式构建标签业务规则库和规则转换库,采用机器学习构建分析标签模型库;调用标签任务调度引擎,基于所述标签业务规则库和规则转换库处理原始数据集,生成基础标签;调用标签任务调度引擎和所述分析标签模型库,利用模型分析结果生成分析标签。2.根据权利要求1所述的一种电力物联网设备数据标签生成方法,其特征在于,所述获取选定类型电力设备的数据模型、数据表和文档类数据,构建设备统一ID并进行数据质量处理的过程中,数据表数据处理,包括:(1)根据各系统已定义的数据模型,获取不同系统设备的数据表主键、外键以及关键属性信息;通过SQL进行主外键关联匹配,对于成功匹配的设备,将设备ID设置为生成该ID的源系统主键;对于未匹配的设备,采用层次聚类算法进行关键属性匹配,并结合主键出现的次数确定设备ID;最后,将具有相同ID的数据行进行去重合并;(2)对于数据表中的数值类数据,采用孤立森林算法对异常值进行清洗,利用线性插值填补缺失值;文档类数据处理,包括:将具有结构的文档类数据转换成结构化数据,然后采用所述数据表数据处理中的步骤(1)进行操作;将不具备结构的文档类数据,统一按所属设备分别转换成仅包含文字、字母、标点符号的文本格式,在首行增加所属设备ID;将文档转换后的结构化数据进行正则化过滤,然后获取数据表中标准的设备、异常和缺陷名称信息,基于名称的相似度进行分组,通过文本相似特征、基本特征和互斥特征共同进行相似度计算,将相似度计算结果符合要求的名称替换成数据表中对应的设备或缺陷名称。3.根据权利要求1所述的一种电力物联网设备数据标签生成方法,其特征在于,所述定义标签信息格式和类型,采用单句形式构建标签业务规则库和规则转换库,采用机器学习构建分析标签模型库的步骤包括:根据标签的加工程度,将设备标签分为基础标签和分析标签两类;其中,所述基础标签是在处理后的设备数据上,利用单句业务规则生成的标签;所述分析标签则是基于多个数据表或利用基础标签通过一系列单句业务规则或机器学习算法模型生成的包含隐藏价值的深度标签;其中,针对基础标签任务,构建过程为:根据设备分类从业务规则库中获取业务规则描述信息;其中,所述设备分类是指设备大类、设备专业和设备分类;基于业务规则描述信息,判断业务规则是否满足要求;若满足,则设置为选定;若不满足,则新增业务规则并选定,然后将规则推送至规则转换库;其中,所述规则转换库用于将
业务规则描述信息转换成计算机可执行的通用判定规则;若业务规则信息已存在,则通过规则信息编号获取转换规则,设置为待执行状态;若业务规则信息为新增,则解析转换;其中,针对分析标签任务,构建过程为:根据任务使用的数据源确定任务细类;其中,所述细类包括基于多数据表的复杂规则分析标签生成任务和基于基础标签的自动化机器学习标签生成任务;针对复杂规则分析标签生成任务,由业务知识规则引擎分解成一系列单句业务规则,并从业务规则库里面获取对应转换规则;若业务规则不存在,则跳转执行规则新增;将所有转换规则加载到复杂规则文件,设置为待执行状态;针对自动化机器学习标签生成任务,分为聚类标签、加权预测标签和模型标签;调用基于密度的聚类算法进行分组处理,获得聚类分组;对于聚类效果达到预设要求的聚类分组,归纳生成新标签;对于聚类效果未达到预设要求的聚类分组,标签种类及标签量较小时,则从设备寿命、异常、故障、检修周期方面分别获取基础标签里的特征参量并计算关联概率,对特征参量设置权重并通过特征参量归一化和加权求和得到预测概率值,归纳生成新标签;对于聚类效果未达到预设要求的聚类分组,标签种类及标签量较大时,将标签生成过程等价为有监督学习过程,对预设比例的基础标签进行标注,导入AutoML工具自动标注和选取最优分类器,进行模型训练与测试,将测试符合要求的模型设置为待执行状态;采用QuartZ Cron表达式,设置标签生成任务执行周期。4.根据权利要求3所述的一种电力物联网设备数据标签生成方法,其特征在于,所述设备标签T表示为T=<t,K,N,S,D,L>的六元组;其中,t为标签生成时间;K为标签所属设备ID;N为标签名;S为标签变化趋势,取

1,0,1三个值,

1表示变差,0表示不变,1表示变好;D为标签出现累计数;L为行为状态,取

1,1两个值,

1表示不可用,1表示可用。5.根据权利要求4所述的一种电力物联网设备数据标签生成方法,其特征在于,所述调用标签任务调度引擎,基于所述标签业务规则库和规则转换库处理原始数据集,生成基础标签的步骤包括:根据业务转换规则获取原始数据,若为属性标签,则获取数据类型为属性数据的数据集;若为运行标签,则获取数据类型为属性数据和运行数据的数据集;若为状态标签,则获取数据类型为属性数据和状态数据的数据集;标签任务调度引擎获取待执行转换规则和标签生成任务周期,封装成可执行程序处理数据集,生成新的标签名;根据设备统一ID、标签主键获取已存最新标签信息,对比标签名变化,设置标签变化趋势值、标签累计数和行为状态,标签日期为当前时间,形成标签信息为<当前时间,设备统一ID,标签名,标签变化趋势值,标签累计数+1,行为状态>,写入标签库;若生成标签为新增标签,则标签信息设置<当前时间,设备统一ID,标签名,0,1,1>,写入标签库。6.根据权利要求5所述的一种电力物联网设备数据标签生成方法,其特征在于,所述调用标签任务调度引擎和所述分析标签模型库,利用模型分析结果生成分析标签的步骤具体包括:1)标签任务调度引擎获取基础标签集,标签生成任务类型和标签生成任务周期,编排聚类标签任务、加权预测标签和模型标签任务;若标签种类和数量符合聚类任务,则将基础
标签集加载到基于密度的聚类算法模型处理,聚类结果如果大于标签种类的预设比例,则跳转执行步骤2);若标签种类和数量符合模型标签任务,则跳转执行步骤3);将聚类结果以文件形式存入标签库,经归纳建立新的标签信息,触发新标签生成任务,写入标签库,将生成规则写入规则转换库;2)计算基础标签集所有标签的发生概率、关联概率,获取标签权重,则预期分析标签发生概率计算表达式为,P
l
表示预期分析标签的发生概率,P
i
表示基础标签i的发生概率,P
j
表示基础标签i发生时,标签j发生的概率,w
ij
表示标签j关联的基础标签i的权重;在P
l
计算结束后,采用极大似然估计算法和朴素贝叶斯公式对各概率进行分组,将聚类结果以文件形式存入标签库,经归纳建立新的标签信息,触发新标签生成任务,写入标签库,将生成规则写入规则转换库;3)将待处理基础标签随机分成多个子数据集,调用待执行的标签模型处理各子数据集,生成标签分组,对比各数据集运算结果;若生成分组数相同,且相同组内基础标签数量差不超...

【专利技术属性】
技术研发人员:肖凯李道兴王晓辉郭鹏天王岩嵬王选
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1