【技术实现步骤摘要】
多源数据的双阶段融合方法及系统
[0001]本专利技术属于配电网大数据挖掘
,具体涉及一种多源数据的双阶段融合方法。
技术介绍
[0002]电网工程项目具有规模大、周期长且流程复杂等特点,因此决定了电网工程从设计、施工到验收的全流程中将产生大量来源丰富、格式复杂多样的数据,包含结构化数据,半结构化数据,如设备清册;非结构化文本数据,如设计说明书等。这些海量的文本数据中蕴含着丰富的与电网拓扑、资产、设备等相关的知识,可作为电网公司内运检、调度、财务等部门的数据源。然而,电网基建工程中产生的文本型数据主要用于工程相关人员的阅读,因此文本内容未经格式化,不利于计算机处理和理解,这极大地增加了从这些数据中获取知识的难度和成本。因此将知识图谱应用在电力行业,可以对分散的电力数据进行集中处理和分析,从而保证电网数据的通用性和规范性,保障智能电网建设的数据信息的真实性和一致性。
[0003]目前基于知识图谱的电网故障处置理论较为成熟,应用成效较为明显。而实际研究中发现仍存在如下问题:(1)调度规程等文本数据的数据量较少,传统 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种多源数据的双阶段融合方法,其特征在于,所述方法包括以下步骤:获取多源异构数据,所述多源异构数据包括通信网侧数据和电力网侧数据;提取所述多源异构数据的初始标准化重构特征;基于所述初始标准化重构特征,进行所述初始标准化重构特征内的属性级浅层融合,得到属性级浅层特征;基于所述属性级浅层特征,进行深层的特征聚合,得到用户聚合特征关系矩阵;基于传统电力网的属性特征和所述用户聚合特征关系矩阵,构建细粒度知识图谱。2.如权利要求1所述的多源数据的双阶段融合方法,其特征在于,所述通信网侧数据包括用户侧网络设备产生的异构数据,所述电力网侧数据包括PMS系统产生的异构数据和用电信息采集系统产生的异构数据。3.如权利要求1所述的多源数据的双阶段融合方法,其特征在于,在所述获取多源异构数据,所述多源异构数据包括通信网侧数据和电力网侧数据之后,所述方法还包括:对所述多源异构数据进行文本数据预处理,对所述多源异构数据进行结构化类型划分以及数据过滤,得到预处理后的多源异构数据;相应地,所述提取所述多源异构数据的初始标准化重构特征,具体包括:提取所述预处理后的多源异构数据的初始标准化重构特征。4.如权利要求1所述的多源数据的双阶段融合方法,其特征在于,所述提取所述多源异构数据的初始标准化重构特征,包括:将所述多源异构数据中置信度高于设定阈值的数据作为筛选数据,将所述筛选数据用图数据库以网络化的模式存储至知识库;利用NLP特征模型,分别对所述通信网侧数据对应的筛选数据和所述电力网侧数据对应的筛选数据进行特征提取,得到对应的第一属性特征集合和第二属性特征集合;将所述第一属性特征集合和所述第二属性特征集合进行属性层次的特征级联,得到所述初始标准化重构特征。5.如权利要求1所述的多源数据的双阶段融合方法,其特征在于,所述基于所述初始标准化重构特征,进行所述初始标准化重构特征内的属性级浅层融合,得到属性级浅层特征,包括:采用多层感知神经网络,进行所述初始标准化重构特征内的属性级浅层融合,得到属性级浅层特征,所述多层感知神经网络包括输入层、隐藏层和输出层,所述隐藏层包括h个隐藏单元,其中:所述隐藏层的输出为:H=XW
h
+b
h
所述输出层的输出为:O=HW
o
+b
o
式中:所述隐藏层的权重及偏差分别表示为W
h
∈R
n
×
h
,b
h
∈R1×
h
;所述隐藏层的输出维度为q;所述输出层的权重及偏差参数分别为W
o
∈R
n
×
q
,b
o
∈R1×
q
;初始标准化重构特征集合其中D是特征维数,N为其批量大小。6.如权利要求5所述的多源数据的双阶段融合方法,其特征在于,每个所述隐藏单元后连接有非线性的激活函数,经过激活函数的输出为:
H=σ(XW
技术研发人员:骆晨,吴凯,冯玉,吴少雷,张成龙,宫兴龙,戚振彪,徐飞,张征凯,周建军,陈振宁,
申请(专利权)人:国网安徽省电力有限公司国网安徽省电力有限公司芜湖供电公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。