【技术实现步骤摘要】
一种配电网多源实况勘误数据库的更新与维护方法及系统
[0001]本专利技术涉及配电网数据库更新
,尤其涉及一种配电网多源实况勘误数据库的更新与维护方法及系统
。
技术介绍
[0002]随着电力系统的快速发展,配电网作为电力系统的重要组成部分,其运营和管理也变得越来越重要,然而,随着配电网的复杂性和多样性,存在着各种异常和勘误情况,这些情况如果得不到及时有效的处理,将会对配电网数据库的可靠性造成严重影响
。
[0003]现有的多源实况勘误数据库的更新与维护方法,多源数据的整个可能导致数据质量的不准确,人工录入数据可能在录入过程中出现录入错误的情况,这些问题可能会影响到勘误数据库的准确性和可靠性
。
技术实现思路
[0004]本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例
。
在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分
、
说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.
一种配电网多源实况勘误数据库的更新与维护方法,其特征在于,包括:获取不同数据源的勘误信息数据,所述不同数据源至少包括供电公司
、
能源监管机构以及第三方监测的数据源;对获取到的勘误信息数据进行预处理;将预处理结果与现有配电网数据库进行匹配,并将预处理结果中的字段值更新到相应的数据库中;预设验证机制,对更新后的字段进行判断,根据判断结果进行不同维护操作
。2.
如权利要求1所述的配电网多源实况勘误数据库的更新与维护方法,其特征在于,所述获取不同数据源的勘误信息数据包括:在进行数据获取的同时通过数据校验算法,校验接收数据的完整性;所述数据校验算法包括以下步骤:将数据分割成若干个固定大小的数据块;对每个块的数据进行加法运算,计算出一个固定位数的值,将该值记作校验和,计算公式如下:
sum
=
(byte1+byte2+...+byten)&0xFF
其中,
byte1
,
byte2
,
...
,
byten
表示数据块中的每个字节,
0xFF
表示
16
进制数,将结果限制在一个字节的范围内,确保校验和为有效字节值;将所有块的校验和相加,得到最终的校验和值;将校验和附加到原始数据中发送给数据接收方;数据接受方按照相同的规则计算校验和,与数据发送方的校验和进行比较,两个校验和的值匹配,则表示数据未受损,对受损的数据进行清除
。3.
如权利要求2所述的配电网多源实况勘误数据库的更新与维护方法,其特征在于,所述对获取到的勘误信息数据进行预处理包括:通过共享数据池接收用户上传的数据后,对数据中的数据频率进行计算,根据数据频率进行数据种类划分,具体包括以下步骤:利用分词器分割数据,计算数据中的数据频率;将数据拆分为
n
个数据块,记为
1,2
,
…
,
n
;对输入的数据进行清理
、
去除噪音,使用停用词表消除停用词,对数据进行分词处理,抽取候选数据块,对各候选数据块打分,输出得分最高的候选数据块作为关键词,不同数据均可得到
m
个关键数据块;计算数据中的加权频率:计算每个数据中的数据频率,获得第
j
个数据中的每个数据块中的数据频率,记为
j1,j2,
…
,
j
m
,利用二值化为数据块匹配权重,将二值化的结果记为
Bin
,取值为0或1;若数据块为关键词
Bin
取1,若数据块的系数小于阈值,
Bin
取值为0,计算数据块加权数据频率满足如下公式:其中,
m
为第
j
个数据中关键数据块数量,
P
j
表示第
j
个数据中数据块加权数据频率,
j
m
表示第
j
个数据中的第
m
个关键数据块的数据频率,
a
表示权重系数,取值为0‑1,
Bin
i
表示第
j
个数据中的第
i
个关键数据块的二值化结果
。4.
如权利要求3所述的配电网多源实况勘误数据库的更新与维护方法,其特征在于,所述对获取到的勘误信息数据进行预处理还包括:所述数据种类划分包括:初始化聚类中心:随机选择
K
个聚类中心,作为每个簇的代表点;计算每个数据点与每个聚类中的距离,具体计算公式如下:
d(x,y)
=
|x1
‑
技术研发人员:郭举富,彭赤,盛兴隆,陈科羽,刘博迪,时磊,
申请(专利权)人:贵州电网有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。