一种基于机器学习的输变电工程知识图谱构建方法技术

技术编号:34633579 阅读:8 留言:0更新日期:2022-08-24 15:06
本发明专利技术公开了一种基于机器学习的输变电工程知识图谱构建方法,包括:采集原始数据,并对所述原始数据进行预处理;对预处理后的原始数据的概念进行消歧并构建历史数据模型;采用基于概念漂移检测的增量学习更新所述历史数据模型;对原始数据中的非结构化数据进行反向验证的迁移学习,并构建覆盖全局数据的知识图谱。本发明专利技术提出了一种基于机器学习的输变电工程知识图谱进行构建方法,能够有效管理输变电工程领域的海量异构数据,帮助工程人员更轻松地理解海量信息,极大提高管理效率。极大提高管理效率。极大提高管理效率。

【技术实现步骤摘要】
一种基于机器学习的输变电工程知识图谱构建方法


[0001]本专利技术涉及输变电工程知识图谱构建
,尤其涉及一种基于机器学习的输变电工程知识图谱构建方法。

技术介绍

[0002]在输变电工程领域,所涉及到的每个电气设备以及地理结构都有其独特的名称、功能、属性、位置等,大量的电气设备可以通过串并联关系形成复杂的电网知识结构,海量的地理结构也汇集成繁杂的知识网络,很难找到梳理、理解和应用这些海量异构数据的正确方法。
[0003]知识图谱是建立在语义网络之上的庞大知识系统,知识图谱本身是指大数据时代大规模知识管理和智能服务的新兴技术,它能够捕捉并呈现领域概念之间错综复杂的关系,并将碎片化的知识连接起来,将其应用于输变电工程领域,可在高效信息检索、数据可视化中起到至关重要的作用。

技术实现思路

[0004]本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能用于限制本专利技术的范围。
[0005]鉴于上述现有存在的问题,提出了本专利技术。
[0006]因此,本专利技术解决的技术问题是:数据信息错综复杂,难于梳理,管理效率低的问题。
[0007]为解决上述技术问题,本专利技术提供如下技术方案:采集原始数据,并对所述原始数据进行预处理;对预处理后的原始数据的概念进行消歧并构建历史数据模型;采用基于概念漂移检测的增量学习更新所述历史数据模型;对原始数据中的非结构化数据进行反向验证的迁移学习,并构建覆盖全局数据的知识图谱。
[0008]作为本专利技术所述的基于机器学习的输变电工程知识图谱构建方法的一种优选方案,其中:所述原始数据包括本地数据和外地数据。
[0009]作为本专利技术所述的基于机器学习的输变电工程知识图谱构建方法的一种优选方案,其中:所述本地数据包括设备状态参数,所述设备状态参数的数据为结构化数据,从SCADA量测系统或生产管理系统中获取。
[0010]作为本专利技术所述的基于机器学习的输变电工程知识图谱构建方法的一种优选方案,其中:所述外地数据包括地理信息数据和三维结构数据,地理信息数据均为非结构化数据,从GIS系统中获取;三维结构数据大多数为非结构化数据,从专用工程管理信息数据库中获取。
[0011]作为本专利技术所述的基于机器学习的输变电工程知识图谱构建方法的一种优选方案,其中:所述原始数据的预处理包括数据清理、数据整合以及数据削减;
[0012]所述数据清理包括遗漏填充、异常消除、噪声平滑以及校正不一致数据;
[0013]所述数据整合包括数据集成对来自多个系统的数据进行模式集成、数据实体识别、拼接处理,对数据进行汇总、聚合、泛化、规范化;
[0014]所述数据削减包括降维、压缩、数据块缩减。
[0015]作为本专利技术所述的基于机器学习的输变电工程知识图谱构建方法的一种优选方案,其中:对含义相似但表达方式不同的概念进行消歧,采用本体模型对本地数据库中的数据进行建模,
[0016]O=(E,R,A)
[0017]其中,O表示本体,E表示实体,R表示关系,A表示属性。
[0018]作为本专利技术所述的基于机器学习的输变电工程知识图谱构建方法的一种优选方案,其中:设定O

为本体数据库中的另一本体,E

为本体O

所对应的实体,R

为本体O

所对应的关系,A

为本体O

所对应的属性,对于本体模型而言,每个数据库中任意两个本体之间的相关性由R(O,O

)衡量,
[0019]R(O,O

)=ω
·
S(E,E

)+(1

ω)
·
S(A,A

)
·
S(R

A,R
′←
A

)
[0020]其中,R(O,O

)表示本体O和本体O

的相关性,S表示相似度,ω表示权重系数,A表示被比较的实体之间具有最大相似性的属性。
[0021]作为本专利技术所述的基于机器学习的输变电工程知识图谱构建方法的一种优选方案,其中:在本地数据库的知识图谱中采用基于概念漂移检测的增量学习,周期性地更新历史数据模型的知识,以适应电网中各类型数据的变化;
[0022]对于本地数据库,通过实体名称和相关关系对每个数据的匹配度进行简单估计,所述匹配度M(O,O

)包括,
[0023][0024]其中,O和O

表示待匹配的数据本体,M(O,O

)表示匹配度,R
i
表示本体O的第i个关系,P(R
i
|E

)表示在实体E

下R
i
发生的概率,n表示O的关系总数,S(E,E

)表示实体E与E

的相似度,T表示相似度阈值;
[0025]各数据分别匹配并融合后的本体O0包括,
[0026][0027]其中,O
i
表示数据库中第i个本体,O
j
表示数据库中第j个本体;
[0028]更新对附加到数据库的其他新的数据本体的匹配度包括,
[0029][0030]其中,M

(O0,O
x
)表示更新之后本体O0和O
x
之间的匹配度,M(O0,O
x
)表示更新之前本体O0和O
x
之间的匹配度,O
x
表示附加的本体,n表示O0的属性个数,m O
x
的属性个数,e
oi
表示
融合本体的第i个属性,e
xj
表示附加本体的第j个属性,P(e
xj
|e
oi
)表示在e
oi
下e
xj
发生的概率,α表示权重因数,S(E0,E
x
)表示实体E0和E
x
的相似度,T表示相似度阈值。
[0031]作为本专利技术所述的基于机器学习的输变电工程知识图谱构建方法的一种优选方案,其中:采用基于自组织映射的无监督本体匹配对外部数据库中的非结构化数据进行反向验证,所述反向验证包括竞争、聚类和加权。
[0032]作为本专利技术所述的基于机器学习的输变电工程知识图谱构建方法的一种优选方案,其中:所述反向验证包括,
[0033]选择输入层的获胜神经元winner,
[0034][0035]其中,in
i
表示第i个输入神经元,ou本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的输变电工程知识图谱构建方法,其特征在于,包括:采集原始数据,并对所述原始数据进行预处理;对预处理后的原始数据的概念进行消歧并构建历史数据模型;采用基于概念漂移检测的增量学习更新所述历史数据模型;对原始数据中的非结构化数据进行反向验证的迁移学习,并构建覆盖全局数据的知识图谱。2.如权利要求1所述的基于机器学习的输变电工程知识图谱构建方法,其特征在于:所述原始数据包括本地数据和外地数据。3.如权利要求1或2所述的基于机器学习的输变电工程知识图谱构建方法,其特征在于:所述本地数据包括设备状态参数,所述设备状态参数的数据为结构化数据,从SCADA量测系统或生产管理系统中获取。4.如权利要求3所述的基于机器学习的输变电工程知识图谱构建方法,其特征在于:所述外地数据包括地理信息数据和三维结构数据,地理信息数据均为非结构化数据,从GIS系统中获取;三维结构数据大多数为非结构化数据,从专用工程管理信息数据库中获取。5.如权利要求4所述的基于机器学习的输变电工程知识图谱构建方法,其特征在于:所述原始数据的预处理包括数据清理、数据整合以及数据削减;所述数据清理包括遗漏填充、异常消除、噪声平滑以及校正不一致数据;所述数据整合包括数据集成对来自多个系统的数据进行模式集成、数据实体识别、拼接处理,对数据进行汇总、聚合、泛化、规范化;所述数据削减包括降维、压缩、数据块缩减。6.如权利要求5所述的基于机器学习的输变电工程知识图谱构建方法,其特征在于:对含义相似但表达方式不同的概念进行消歧,采用本体模型对本地数据库中的数据进行建模,O=(E,R,A)其中,O表示本体,E表示实体,R表示关系,A表示属性。7.如权利要求6所述的基于机器学习的输变电工程知识图谱构建方法,其特征在于:设定O

为本体数据库中的另一本体,E

为本体O

所对应的实体,R

为本体O

所对应的关系,A

为本体O

所对应的属性,对于本体模型而言,每个数据库中任意两个本体之间的相关性由R(O,O

)衡量,R(O,O

)=ω
·
S(E,E

)+(1

ω)
·
S(A,A

)
·
S(R

A,R
′←
A

)其中,R(O,O

)表示本体O和本体O

的相关性,S表示相似度,ω表示权重系数,A表示被比较的实体之间具有最大相似性的属性。8.如权利要求7所述的基于机器学习的输变电工程知识图谱构建方法,其特征在于:在本地数据库的知识图谱中采用基于概念漂移检测的增量学习,周期性地更新历史数据模型的知识,以适应电网中各类型数据的变化;对于本地数据库,通过实体名称和相关关系对每个数据的匹配度进行简单估计,所述匹配度M(O,O

)包括,
其中,O和O

表示待匹配的数据本体,M(O,O

【专利技术属性】
技术研发人员:王立孙斌严霞周海王琳杨杰汪黔疆张裕
申请(专利权)人:贵州电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1