一种多数据源的同一对象数据的融合方法技术

技术编号:13338135 阅读:143 留言:0更新日期:2016-07-13 10:20
本发明专利技术涉及一种多数据源的同一对象数据的融合方法,其步骤:收集不同数据源的同一对象的数据,即同一目标的不同业务系统采集数据;将数据单位、格式、精度进行标准化处理,统一描述字段;从经过预处理的数据中提取有代表性的特征,并设置特征向量格式表,把提取的这些特征融合成单一的特征向量;结合数据模型、数据流标准以及相关的数据采用规则对特征向量构成的特征矩阵进行校验、修正运算,得到数据的标准特征向量;以特征向量格式表为基准对标准特征向量还原,完成多数据源的同一对象数据融合。本发明专利技术降低了数据存储需求的空间和数据的冗余性,有助于电网各平台之间数据的交流与共享。

【技术实现步骤摘要】

本专利技术涉及一种城市配电网规划与优化
,特别是关于一种多数据源的同一对象数据的融合方法
技术介绍
作为信息融合技术起步最早、发展最快的国家,美国早在70年代就开始启动信息融合技术的研究。1984年成立了数据融合专家组。到1991年,美国已成功的将54个数据融合系统直接引入到军事系统中去,其中87%已有试验样机或已被应用。除美国外,其他西方国家也普遍重视信息融合技术的研究。到目前为止,美、英、法、意、日等过已经研究出上百个军用融合系统,取得了一定的成果。和国外相比,我国在信息融合领域的研究起步较晚,1991年后,一些高校和科研院所相继对信息融合的理论、系统框架和融合算法开展了大量研究,出现了一大批理论研究成果。20世纪90年代中期以来,信息融合技术在国内已发展成为多方关注的共性关键性技术,出现了许多热门研究方向。也相继出现了一批多目标跟踪系统和有初步综合能力的多源信息融合系统,但是,针对电网数据的融合技术仍旧不成熟,研究也相对较少,导致海量的电网数据不能很好的被规划系统利用。如果能够结合电网数据的特点,有针对性地对电网数据进行融合简化处理,无疑对整个电网建设的优化决策具有非常重要的意义。
技术实现思路
针对上述问题,本专利技术的目的是提供一种多数据源的同一对象数据的融合方法,降低了数据存储需求的空间和数据的冗余性,有助于电网各平台之间数据的交流与共享。为实现上述目的,本专利技术采取以下技术方案:一种多数据源的同一对象数据的融合方法,其特征在于包括以下步骤:1)不同数据源数据收集:收集不同数据源的同一对象的数据,即同一目标的不同业务系统采集数据;2)数据预处理:将数据单位、格式、精度进行标准化处理,统一描述字段;3)特征向量提取:从经过预处理的数据中提取有代表性的特征,并设置特征向量格式表,把提取的这些特征融合成单一的特征向量;4)融合判断:结合电网规划数据模型标准对特征向量构成的特征矩阵进行校验、修正运算,得到数据的标准特征向量;5)特征向量还原:以特征向量格式表为基准对标准特征向量还原,完成多数据源的同一对象数据融合。所述步骤4)中,融合判断方法具体为:定义融合符号为⊕,fa⊕fb表示对fa、fb两项数据进行融合;融合规则如下:当两个向量中有对某属性一致性的描述时,融合后的向量取其中一份数据;当两个向量中有对某属性不一致的描述时,按照数据取用优先度准则进行取舍;当一个向量有另一个向量没有的属性描述时,融合后的向量需要保留该项数据。数据取用优先度准则为:对于不同规划版本的数据,新版本的数据取用优先于旧版本的数据。三项数据间的融合时,先将两项数据融合,融合得到的结果再与第三项数据融合,以此类推。本专利技术由于采取以上技术方案,其具有以下优点:本专利技术提出多数据源的同一对象数据的融合方法,突破传统的不同业务系统之间数据无法融合的缺陷,将不同业务系统中同一对象的数据融合在一起,大大降低了数据存储需求的空间和数据的冗余性,有助于电网各平台之间数据的交流与共享,可为电网总部对配电系统的优化与规划提供更为详实的参考依据。附图说明图1是本专利技术的整体流程示意图。具体实施方式下面结合附图和实施例对本专利技术进行详细的描述。如图1所示,本专利技术提供一种多数据源的同一对象数据的融合方法,其包括以下步骤:1)不同数据源数据收集:收集不同数据源的同一对象的数据,即同一目标的不同业务系统采集数据;2)数据预处理:将数据单位、格式、精度等的进行标准化处理,统一描述字段;3)特征向量提取:从经过预处理的数据中提取有代表性的特征,并设置特征向量格式表,把提取的这些特征融合成单一的特征向量;4)融合判断:结合电网规划数据模型标准对特征向量构成的特征矩阵进行融合、校验、修正运算,得到数据的标准特征向量;5)特征向量还原:以特征向量格式表为基准对标准特征向量还原,完成多数据源的同一对象数据融合。上述步骤1)中,不同数据源同一对象数据收集的方法为:收集不同数据源的同一对象的数据,即通过数据中心使用ETL方法抽取不同业务系统所采集的同一目标的数据;本实施例中,数据中心采集某220kV变电站的PMS系统数据,数据表如下。表1某220kV变电站的PMS(生产管理系统)数据数据中心采集某220kV变电站的OMS系统数据,数据表如下。表2某220kV变电站的OMS(调度自动化系统)数据上述步骤2)中,数据预处理方法如下:步骤2.1)根据电网规划数据模型标准对描述字段进行统一;对描述字段进行统一就是根据电网规划数据模型标准对各数据的属性名称进行处理,使描述同一属性数据的属性名称一致。步骤2.2)根据电网规划数据模型标准进行数据单位、格式、精度等的标准化;表3电网规划数据模型标准的变电站部分内容根据表3的电网规划变电站部分的数据模型标准对表1、表2进行预处理,得出表4、表5。表4变电站的PMS数据(预处理后)编号 属性 内容 1 变电站名称 NX 2 最高电压等级(千伏) 220 3 现状容量(兆伏安) 360 4 终期容量(兆伏安) 540 5 容性无功配置(兆乏) 79.2 6 感性无功配置(兆乏) 10.8 7 高压侧已用进线 6 8 高压侧规划进线 9 9 中压侧出线间隔总数 4 10 中压侧已用出线间隔数 14 11 低压侧出线间隔总数 0 12 低压侧已用出线间隔数 0 13 高压侧接线方式 双母线 14 中压侧接线方式 双母线 15 低压侧接线方式 单母分段 16 投运时间 2010-1-1 17 站址所在地 XX省、XX市、XX县 表5变电站的OMS数据(预处理后)在步骤3)中,特征向量提取,融合成单一的特征向量;这种特征向量是广义的向量,可以是一维向量,也可以是多维向量。其元素数据类型包括数字、字符及其他类型,当数据的某项属性描述缺少时,在特征向量中用零表示。即设置m×n阶向量Am×n,其中任一个元素Aij均被设置为某项属性描述,在设置完特征向量的格式之后,根据基础数据得出相应的特征向量。在本实施例中,数据格式比较简单,故本文档来自技高网...

【技术保护点】
一种多数据源的同一对象数据的融合方法,其特征在于包括以下步骤:1)不同数据源数据收集:收集不同数据源的同一对象的数据,即同一目标的不同业务系统采集数据;2)数据预处理:将数据单位、格式、精度进行标准化处理,统一描述字段;3)特征向量提取:从经过预处理的数据中提取有代表性的特征,并设置特征向量格式表,把提取的这些特征融合成单一的特征向量;4)融合判断:结合电网规划数据模型标准对特征向量构成的特征矩阵进行校验、修正运算,得到数据的标准特征向量;5)特征向量还原:以特征向量格式表为基准对标准特征向量还原,完成多数据源的同一对象数据融合。

【技术特征摘要】
1.一种多数据源的同一对象数据的融合方法,其特征在于包括以下步骤:
1)不同数据源数据收集:收集不同数据源的同一对象的数据,即同一目标的不同业务
系统采集数据;
2)数据预处理:将数据单位、格式、精度进行标准化处理,统一描述字段;
3)特征向量提取:从经过预处理的数据中提取有代表性的特征,并设置特征向量格式
表,把提取的这些特征融合成单一的特征向量;
4)融合判断:结合电网规划数据模型标准对特征向量构成的特征矩阵进行校验、修正
运算,得到数据的标准特征向量;
5)特征向量还原:以特征向量格式表为基准对标准特征向量还原,完成多数据源的同
一对象数据融合。
2.如权利要求1所述的一种多数据源的同一对象数据的融合方法,其特征在于:所...

【专利技术属性】
技术研发人员:宋毅罗凤章孙充勃李敬如薛振宇靳夏宁王世举李登武吴志力闫新刚杨文涛李红军杨卫红王云飞刘艳茹王旭阳赵娟郭玥
申请(专利权)人:国家电网公司国网北京经济技术研究院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1