【技术实现步骤摘要】
一种基于机器学习的输变电工程知识图谱构建方法
[0001]本专利技术涉及输变电工程知识图谱构建
,尤其涉及一种基于机器学习的输变电工程知识图谱构建方法。
技术介绍
[0002]在输变电工程领域,所涉及到的每个电气设备以及地理结构都有其独特的名称、功能、属性、位置等,大量的电气设备可以通过串并联关系形成复杂的电网知识结构,海量的地理结构也汇集成繁杂的知识网络,很难找到梳理、理解和应用这些海量异构数据的正确方法。
[0003]知识图谱是建立在语义网络之上的庞大知识系统,知识图谱本身是指大数据时代大规模知识管理和智能服务的新兴技术,它能够捕捉并呈现领域概念之间错综复杂的关系,并将碎片化的知识连接起来,将其应用于输变电工程领域,可在高效信息检索、数据可视化中起到至关重要的作用。
技术实现思路
[0004]本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能用于限制本专利技术的范围。
[0005]鉴于上述现有存在的问题,提出了本专利技术。
[0006]因此,本专利技术解决的技术问题是:数据信息错综复杂,难于梳理,管理效率低的问题。
[0007]为解决上述技术问题,本专利技术提供如下技术方案:采集原始数据,并对所述原始数据进行预处理;对预处理后的原始数据的概念进行消歧并构建历史数据模型;采用基于概念漂移检测的增量学习 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于机器学习的输变电工程知识图谱构建方法,其特征在于,包括:采集原始数据,并对所述原始数据进行预处理;对预处理后的原始数据的概念进行消歧并构建历史数据模型;采用基于概念漂移检测的增量学习更新所述历史数据模型;对原始数据中的非结构化数据进行反向验证的迁移学习,并构建覆盖全局数据的知识图谱。2.如权利要求1所述的基于机器学习的输变电工程知识图谱构建方法,其特征在于:所述原始数据包括本地数据和外地数据。3.如权利要求1或2所述的基于机器学习的输变电工程知识图谱构建方法,其特征在于:所述本地数据包括设备状态参数,所述设备状态参数的数据为结构化数据,从SCADA量测系统或生产管理系统中获取。4.如权利要求3所述的基于机器学习的输变电工程知识图谱构建方法,其特征在于:所述外地数据包括地理信息数据和三维结构数据,地理信息数据均为非结构化数据,从GIS系统中获取;三维结构数据大多数为非结构化数据,从专用工程管理信息数据库中获取。5.如权利要求4所述的基于机器学习的输变电工程知识图谱构建方法,其特征在于:所述原始数据的预处理包括数据清理、数据整合以及数据削减;所述数据清理包括遗漏填充、异常消除、噪声平滑以及校正不一致数据;所述数据整合包括数据集成对来自多个系统的数据进行模式集成、数据实体识别、拼接处理,对数据进行汇总、聚合、泛化、规范化;所述数据削减包括降维、压缩、数据块缩减。6.如权利要求5所述的基于机器学习的输变电工程知识图谱构建方法,其特征在于:对含义相似但表达方式不同的概念进行消歧,采用本体模型对本地数据库中的数据进行建模,O=(E,R,A)其中,O表示本体,E表示实体,R表示关系,A表示属性。7.如权利要求6所述的基于机器学习的输变电工程知识图谱构建方法,其特征在于:设定O
′
为本体数据库中的另一本体,E
′
为本体O
′
所对应的实体,R
′
为本体O
′
所对应的关系,A
′
为本体O
′
所对应的属性,对于本体模型而言,每个数据库中任意两个本体之间的相关性由R(O,O
′
)衡量,R(O,O
′
)=ω
·
S(E,E
′
)+(1
‑
ω)
·
S(A,A
′
)
·
S(R
←
A,R
′←
A
′
)其中,R(O,O
′
)表示本体O和本体O
′
的相关性,S表示相似度,ω表示权重系数,A表示被比较的实体之间具有最大相似性的属性。8.如权利要求7所述的基于机器学习的输变电工程知识图谱构建方法,其特征在于:在本地数据库的知识图谱中采用基于概念漂移检测的增量学习,周期性地更新历史数据模型的知识,以适应电网中各类型数据的变化;对于本地数据库,通过实体名称和相关关系对每个数据的匹配度进行简单估计,所述匹配度M(O,O
′
)包括,
其中,O和O
′
表示待匹配的数据本体,M(O,O
技术研发人员:王立,孙斌,严霞,周海,王琳,杨杰,汪黔疆,张裕,
申请(专利权)人:贵州电网有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。