【技术实现步骤摘要】
基于虚拟数据库的电力通信网络异地异构数据源整合方法
本专利技术涉及电力通信
,具体为基于虚拟数据库的电力通信网络异地异构数据源整合方法。
技术介绍
在电力通信网络中,存在大量的异地异构数据,用户通过远程调度和访问方法进行异地异构数据方位和查询。异地异构数据的数据结构复杂,导致数据调用容易出错,开发成本高,其数据源整合也因此成为该领域研究的重点内容。特征提取方法是一种采用特征提取技术抽取虚拟数据库异地异构数据的平均互信息特征量,结合关联规则挖掘方法进行虚拟数据整合。通过对异地异构数据源的采集,搭建Hive数据仓库,并对异地异构数据源进行分析与整理,最后采用Java开发语言搭建异地异构数据源整合系统,实现异地异构数据源的整合。但上述方法存在时间开销较大、查准率低等问题。
技术实现思路
本专利技术主要是提供基于虚拟数据库的电力通信网络异地异构数据源整合方法,解决现有技术中方法存在时间开销较大、查准率低等问题。为了解决上述技术问题,本专利技术采用如下技术方案:基于虚拟数据库的电力通信 ...
【技术保护点】
1.基于虚拟数据库的电力通信网络异地异构数据源整合方法,其特征在于,该方法包括以下步骤:/n步骤一,进行传输负载模型及数据存储结构的构建与重组;/n步骤二,进行异地异构数据源整合优化。/n
【技术特征摘要】 【专利技术属性】
1.基于虚拟数据库的电力通信网络异地异构数据源整合方法,其特征在于,该方法包括以下步骤:
步骤一,进行传输负载模型及数据存储结构的构建与重组;
步骤二,进行异地异构数据源整合优化。
2.根据权利要求1所述的基于虚拟数据库的电力通信网络异地异构数据源整合方法,其特征在于,其中所述步骤一包括以下子步骤:
A,构建异地异构数据的传输负载模型;
B,存储结构重组。
3.根据权利要求1所述的基于虚拟数据库的电力通信网络异地异构数据源整合方法,其特征在于,其中所述步骤二包括以下子步骤:
a,异地异构数据的稀疏性特征提取;
b,虚拟数据库异地异构数据源整合。
4.根据权利要求2所述的基于虚拟数据库的电力通信网络异地异构数据源整合方法,其特征在于,所述A步骤包括:
A01,用二元有向图G=(V,E)表示虚拟数据库异地异构数据的图模型结构,其中,V是虚拟数据库的分布节点的顶点集;E是虚拟数据库异地异构数据的有向边集合;
A02,设M1,M2...MN为虚拟数据库异地的Sink存储节点,采用多元回归分析方法提取异地异构数据的相关性统计特征量,得到虚拟数据库的分布式拓扑结构模型;
A03,结合A02中的所述虚拟数据库的分布式拓扑结构模型,获取虚拟数据库异地异构数据检测的测度信息;
A04,在存储网络结构模型中,数据组合模型的有向图向量的加权系数为Ws={w1,w2,…,wk},在虚拟数据库异地异构数据的信息覆盖区域,假设M个传输链路层,统计数据的离散分布形式为x(k-1),....,x(k-M),则虚拟数据库异地异构数据的模糊节点差分xs的估计值:
基于模糊节点差分的估计值,构建虚拟数据库异地异构数据的传输负载模型:
其中,
ω(t)为虚拟节点的数据维数;ph(t)为虚拟数据库异地异构数据Source与Sink储存节点之间的距离;bi为异地异构数据的传输负载损失量。
5.根据权利要求2所述的基于虚拟数据库的电力通信网络异地异构数据源整合方法,其特征在于,所述B步骤包括:
B01,对异地异构数据进行离散融合处理:
式(4)中,TV代表顶点集的融合系数;βV代表数据离散估计参量;adj(a,c)表示重构向量a与c的个数,经式(4)得到异地异构数据的离散融合函数Tr;
B02,利用B01中的所述Tr函数求得异地异构数据分布特征集T0的统计特征量:
T0={T1,T2,...,T0}(5)
其中,对所述特征集T0求解特征量:
根据求得的所述特征量进行特征重组:
βd=(MPDist-d+1)/MPDist,d∈[2,MPDist](7)
采用特征提取技术在所述特征重组的数据特征中抽取平均互信息特征量,得到虚拟数据库异地异构数据的存储结构重构过程为:
I(Q,S)=H(Q)-H(Q|S)(8)
其中
技术研发人员:刘晴,汤玮,刘旭,金海,姜海,董武,
申请(专利权)人:贵州电网有限责任公司,
类型:发明
国别省市:贵州;52
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。