【技术实现步骤摘要】
配电网数据资源融合方法、装置、设备及存储介质
[0001]本专利技术涉及资源融合
,尤其涉及一种配电网数据资源融合方法、装置、设备及存储介质。
技术介绍
[0002]当前,配电网各业务系统和平台中集成了越来越多、越来越丰富的数据资源,新型配电网的加速形成加剧了这一演变趋势,数据资源的共享与融合程度决定着配电网的业务发展和管理提升高度。随着建设国际一流电网战略的提出,给数据的融合与共享工作提出了更加迫切的需求和更高的要求。
[0003]配电网的数据融合具有一定的特殊性,各个电力公司在信息化建设过程中,由于其业务系统建设和实施的阶段性、技术性以及其他经济和人为因素等影响,导致了数据资源呈现显著的“信息孤岛”特点。首先是数据异构性,各业务系统采用的数据库系统存在一定差异,信息编码、技术规范不统一,数据格式不统一,造成数据资源难以转换和融合;其次是缺乏统一的标准体系,目前电力行业尚未采用统一的标准体系进行信息化,信息系统之间集成度低、互联性差,业务不能协同开展。因此,在配电网数据资源融合过程中容易出现数据异常,导致融合 ...
【技术保护点】
【技术特征摘要】
1.一种配电网数据资源融合方法,其特征在于,包括:将至少两个待融合数据集的数据进行资源融合,获得初始的数据融合结果集;基于初始的数据融合结果集获取异常数据和所述异常数据对应的异常属性;基于初始的数据融合结果集中包含的所有属性及每个属性对应的正常数据构建样本数据集;根据所述样本数据集和所述异常属性计算所述样本数据集中的所述异常属性对应的数据和所述样本数据集之间的关联系数;根据初始的数据融合结果集和所述关联系数计算所述异常数据的第一拟合值;将初始的数据融合结果集中的异常数据替换为所述异常数据的第一拟合值,得到更新后的数据融合结果集。2.根据权利要求1所述的配电网数据资源融合方法,其特征在于,所述根据所述样本数据集和所述异常属性计算所述样本数据集中的所述异常属性对应的数据和所述样本数据集之间的关联系数,包括:将样本数据集和异常属性输入到多元线性回归模型,通过多元线性回归模型获取所述样本数据集中的所述异常属性对应的数据和所述样本数据集之间的线性相关系数,将所述线性相关系数作为关联系数。3.根据权利要求2所述的配电网数据资源融合方法,其特征在于,所述通过多元线性回归模型获取所述样本数据集中的所述异常属性对应的数据和所述样本数据集之间的线性相关系数,包括:根据预设线性系数和所述样本数据集计算样本数据集中的所述异常属性对应的数据的第二拟合值;从所述样本数据集中提取所述异常属性对应的数据的真实值;将所述样本数据集中的所述异常属性对应的数据的第二拟合值和所述真实值之间的方差之和最小时对应的所述预设线性系数作为线性相关系数。4.根据权利要求3所述的配电网数据资源融合方法,其特征在于,所述将所述样本数据集中的所述异常属性对应的数据的第二拟合值和所述真实值的方差之和最小时对应的所述预设线性系数作为线性相关系数,包括:构建所述样本数据集中的所述异常属性对应的数据的第二拟合值和所述真实值的方差之和的表达式;对所述表达式进行求导,将导数为零时对应的所述预设线性系数作为方差之和最小时对应的所述预设线性系数,并将方差之和最小时对应的所述预设线性系数作为线性相关系数。5.根据权利要求1所述的配电网数据资源融合方法,其特征在于,基于初始的数据融合结果集获取异常数据,包括:依次判断初始的数据融合结果集中的每个数据是否属于设定的异常阈值范围,若属于设定的异常阈值范围,则认为对应的数据为异常数据。6.根据权利要求1所述的配电网数据资源融合方法,其特征在于,在根据所述样本数据集和所述异常属性计算所述样本数据集中的所述异常属性对应的数据和所述样本数据集之间的关联系数之前,还包括:
判断所述样本数据集中的数据组数是否小于初始的数据融合结果集中的属性数量;若小于初始的数据融合结果集中的属性数量,则重新构建样本数据集,直至所述样本数据集中的数据组数大于或等于初始的数据融合结果集中的属性数量。7.根据权利要求1所述的配电网数据资源融合方法,其特征在于,根据初始的数据融合结果集和所述关联系数计算所述异常数据的第一拟合值,包括:将初始的数据融合结果集和所述关联系数相乘,得到所述异常数据的第一拟合值。8.一种配电网数据资源融合装置,其特征在于,包括:初始融合模块,用于将至少...
【专利技术属性】
技术研发人员:乔俊峰,周爱华,黄晨宏,彭林,潘森,顾华,徐敏,陈敬德,裘洪斌,蒋静,
申请(专利权)人:国网上海市电力公司国家电网有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。