基于数据统一语义表征的设备健康档案库构建方法及系统技术方案

技术编号:35291699 阅读:11 留言:0更新日期:2022-10-22 12:38
本发明专利技术公开了一种基于数据统一语义表征的设备健康档案库构建方法及系统,本发明专利技术包括分别输入不同来源的设备状态数据;从设备状态数据中抽取出健康特征,分别建立各个变电站设备的设备状态健康子档案;对各个设备状态健康子档案进行统一语义表征并融合为完整的设备状态健康档案;将完整的设备状态健康档案中健康特征进行向量化表示为特征向量;构建基于特征向量的分类模型以实现变电站设备状态的分类和评估。本发明专利技术能解决现有技术中由于没有充分融合和统一表征多源异构数据,导致变电站设备健康档案库构建复杂、准确度不高的问题,对专家和经验数据的依赖较少,以数据驱动的形式结合自然语言处理方法自动构建档案库,更容易与设备分析方法对接。与设备分析方法对接。与设备分析方法对接。

【技术实现步骤摘要】
基于数据统一语义表征的设备健康档案库构建方法及系统


[0001]本专利技术涉及电网设备评估技术,具体涉及一种基于数据统一语义表征的设备健康档案库构建方法及系统。

技术介绍

[0002]随着国内电网的迅速发展,电网设备数量成倍增加,传统的定期计划检修模式没有根据各设备的状态安排设备的检修周期,导致状态较好的设备过度检修,状态较差的设备则可能处于检修不足的状态;对电网设备运行维护采用精细化、规范化和更为科学的检修策略,在确保电网连续、稳定、安全、可靠运行的前提下实现电网设备运行维护资源消耗的最小化,已成为电网企业设备管理发展的必然趋势。当前设备变现站设备积累了红外监测数据,在线监测数据,缺陷数据等大量设备数据,目前这些数据分散在各个系统、基层单位线下表格中,专业之间数据交流、共享、及时更新难度大,不利于对设备状态进行全面评价。利用现有设备历史缺陷、修试记录、状态评价、线下一次设备历史红外测温图、台账数据、在线监测等数据多维度联动立体设备健康档案,与检修计划智能关联,实现设备差异化运检,提升运检质效。变电站异常信息存在多种不同结构的数据类型,对设备的直接状态分类提出了挑战,传统一般采用文本分类的方法,将不同的状态描述文本作为输入训练分类模型,缺点是设备的不同数据表之间容易存在数据的冗余和矛盾,往往需要人工凭借经验融合不同的数据库,对健康档案的生成和分析产生很大的障碍,效率不高。因此,如何融合多源异构数据并进行统一语义表征来实现电网变量站设备健康档案的构建已经成为一个急需解决的技术问题。

技术实现思路

[0003]本专利技术要解决的技术问题:针对现有技术的上述问题,提供一种基于数据统一语义表征的设备健康档案库构建方法及系统,本专利技术旨在解决现有技术中由于没有充分融合和统一表征多源异构数据,导致变电站设备健康档案库构建复杂、准确度不高的问题,本专利技术对专家和经验数据的依赖较少,主要以数据驱动的形式结合自然语言处理方法自动构建档案库,生产的健康档案库也更容易与设备分析方法对接。
[0004]为了解决上述技术问题,本专利技术采用的技术方案为:
[0005]一种基于数据统一语义表征的设备健康档案库构建方法,包括:
[0006]S1,分别输入不同来源的设备状态数据;
[0007]S2,从设备状态数据中抽取出健康特征;
[0008]S3,基于健康特征分别建立各个变电站设备的设备状态健康子档案;
[0009]S4,对各个设备状态健康子档案进行统一语义表征并融合为完整的设备状态健康档案;
[0010]S5,将完整的设备状态健康档案中健康特征进行向量化表示为特征向量;
[0011]S6,构建基于特征向量的分类模型以实现变电站设备状态的分类和评估。
[0012]可选地,步骤S1中的来源包括变电站生产管理系统、变电站在线监测系统以及变电站设备台账,不同来源的设备状态数据包括主变设备数据、主变评价数据、主变告警数据、主变修试数据、主变缺陷数据和变电站数据。
[0013]可选地,步骤S2中的健康特征包括直接特征和间接特征,其中直接特征是指变电站设备的静态数据特征,所述静态数据特征是指不随时间发生变化的数据特征;所述间接特征是指变电站设备对应的时序监测数据,所述时序监测数据随时间发生变化。
[0014]可选地,所述直接特征包括设备ID、设备名称、设备类型、电压等级、设备型号、生产厂家、投运日期、出厂日期、变电站ID、变电站名称、变电站电压等级、所属城市、所属区县、变电站类型及生产管理系统评价;所述间接特征包括缺陷频率、缺陷趋势、缺陷性质、消缺状态、验收评价、隐患状态、扣分值、告警频率、告警趋势、告警等级、告警类型及试验结论。
[0015]可选地,步骤S4包括:
[0016]S4.1,提取各个设备状态健康子档案的语义信息;
[0017]S4.2,将各个设备状态健康子档案的语义信息进行设备状态实体的对齐和链接,形成面向设备状态分析的统一语义表示体系;
[0018]S4.3,将所有面向设备状态分析的统一语义表示体系的设备状态健康子档案融合建立完整的设备状态健康档案以用于实现对变电站设备健康状态的分类和评估。
[0019]可选地,步骤S4.2中进行设备状态实体的对齐是指采用匹配函数将不同设备状态子档案库的实体在向量空间层面映射对齐,所述匹配函数为多层神经网络,其输入为标注的设备状态实体和待判断的设备状态实体、输出为在向量空间中的向量,且利用人工标注的实体对齐数据集S设计和训练匹配函数以保证不同来源数据的语义一致性和映射损失最小,且语义一致性和映射损失的计算函数表达式为:
[0020]L=L
merge
(CD1,CD2)+L
base
(ρ,S),
[0021]上式中,L表示语义一致性和映射损失,L
merge
(CD1,CD2)表示根据分布式向量表示V1和V2每一项差的绝对值和,其中分布式向量表示V1为根据设备状态健康子档案CD1为人工标注的实体对齐数据集S的分布式向量表示,分布式向量表示V2为根据设备状态健康子档案CD2为人工标注的实体对齐数据集S的分布式向量表示,L
base
(ρ,S)表示匹配函数ρ基于人工标注的实体对齐数据集S将设备状态健康子档案CD1和设备状态健康子档案CD2的特征映射到正确的设备状态实体的概率。
[0022]可选地,步骤S5中将完整的设备状态健康档案中健康特征进行向量化表示为特征向量时,针对间接特征为采用归一化映射函数将其归一化到[0,1]区间;针对直接特征为采用多头序列编码:首先针对该直接特征的特征值进行排序并构建唯一队列,将唯一队列中的每一个特征值映射到不同的序列号;然后将唯一队列中的每一个特征值采用将其对应的序列号除以序列号总和的方式作为该特征值的多头序列编码结果。
[0023]可选地,步骤S6中构建基于特征向量的分类模型为多层感知器分类网络,所述多层感知器分类网络包括依次相连的输入层、隐藏层以及输出层;在训练多层感知器分类网络时,将特征向量作为多层感知器分类网络的输入,并将多层感知器分类网络的输出与已知标签进行比较,并相应地调整多层感知器分类网络中网络参数的权重,直至达到允许迭代的最大数量或多层感知器分类网络的准确度大于设定值。
[0024]此外,本专利技术还提供一种基于数据统一语义表征的设备健康档案库构建系统,包括相互连接的微处理器和存储器,所述微处理器被编程或配置以执行所述基于数据统一语义表征的设备健康档案库构建方法的步骤。
[0025]此外,本专利技术还提供一种计算机可读存储介质,其中存储有计算机程序,所述计算机程序用于被微处理器编程或配置以执行所述基于数据统一语义表征的设备健康档案库构建方法的步骤。
[0026]和现有技术相比,本专利技术主要具有下述优点:本专利技术包括分别输入不同来源的设备状态数据;从设备状态数据中抽取出健康特征;基于健康特征分别建立各个变电站设备的设备状态健康子档案;对各个设备状态健康子档案进行统一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据统一语义表征的设备健康档案库构建方法,其特征在于,包括:S1,分别输入不同来源的设备状态数据;S2,从设备状态数据中抽取出健康特征;S3,基于健康特征分别建立各个变电站设备的设备状态健康子档案;S4,对各个设备状态健康子档案进行统一语义表征并融合为完整的设备状态健康档案;S5,将完整的设备状态健康档案中健康特征进行向量化表示为特征向量;S6,构建基于特征向量的分类模型以实现变电站设备状态的分类和评估。2.根据权利要求1所述的基于数据统一语义表征的设备健康档案库构建方法,其特征在于,步骤S1中的来源包括变电站生产管理系统、变电站在线监测系统以及变电站设备台账,不同来源的设备状态数据包括主变设备数据、主变评价数据、主变告警数据、主变修试数据、主变缺陷数据和变电站数据。3.根据权利要求1所述的基于数据统一语义表征的设备健康档案库构建方法,其特征在于,步骤S2中的健康特征包括直接特征和间接特征,其中直接特征是指变电站设备的静态数据特征,所述静态数据特征是指不随时间发生变化的数据特征;所述间接特征是指变电站设备对应的时序监测数据,所述时序监测数据随时间发生变化。4.根据权利要求3所述的基于数据统一语义表征的设备健康档案库构建方法,其特征在于,所述直接特征包括设备ID、设备名称、设备类型、电压等级、设备型号、生产厂家、投运日期、出厂日期、变电站ID、变电站名称、变电站电压等级、所属城市、所属区县、变电站类型及生产管理系统评价;所述间接特征包括缺陷频率、缺陷趋势、缺陷性质、消缺状态、验收评价、隐患状态、扣分值、告警频率、告警趋势、告警等级、告警类型及试验结论。5.根据权利要求1所述的基于数据统一语义表征的设备健康档案库构建方法,其特征在于,步骤S4包括:S4.1,提取各个设备状态健康子档案的语义信息;S4.2,将各个设备状态健康子档案的语义信息进行设备状态实体的对齐和链接,形成面向设备状态分析的统一语义表示体系;S4.3,将所有面向设备状态分析的统一语义表示体系的设备状态健康子档案融合建立完整的设备状态健康档案以用于实现对变电站设备健康状态的分类和评估。6.根据权利要求5所述的基于数据统一语义表征的设备健康档案库构建方法,其特征在于,步骤S4.2中进行设备状态实体的对齐是指采用匹配函数将不同设备状态子档案库的实体在向量空间层面映射对齐,所述匹配函数为多层神经网络,其输入为标注的设备状态实体和待判断的设备状态实体、输出为在向量空间中的向量...

【专利技术属性】
技术研发人员:瞿旭伍艺佳谭庆科刘卫东章健军毛文奇于艺盛夏建勋李国栋杨帅雄李斌范琪颜碧炎
申请(专利权)人:国网湖南省电力有限公司超高压变电公司国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1