当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于K-MEANS算法的配电网云平台数据校验方法技术

技术编号:27937454 阅读:23 留言:0更新日期:2021-04-02 14:18
一种基于K‑MEANS算法的配电网云平台数据校验方法,包括:根据配电网云平台数据构成配网数据集;计算配网数据集中任意两个数据对象之间的距离,根据任意两个数据对象之间的距离,获取第一、第二和第三初始聚类中心;根据第一、第二和第三初始聚类中心,确定初始聚类中心个数,并计算初始聚类中心的两两距离值,根据两两距离值确定第一阈值;对待检测的配网数据集进行聚类,计算每个数据对象到各个聚类中心的距离绝对值;采用第一规则对每个数据对象到各个聚类中心的距离绝对值进行判断,当待检测数据集中所有对象分类完成后,重新计算聚类中心;对重新计算聚类中心进行判断。本发明专利技术解决了配电网云平台多源数据不统一,难以进行清洗、剔除和校验的问题。

【技术实现步骤摘要】
一种基于K-MEANS算法的配电网云平台数据校验方法
本专利技术涉及的是数据校验领域,特别涉及一种基于K-MEANS算法的配电网云平台数据校验方法。
技术介绍
随着智能配电网建设工作的不断深入和持续推进,配电自动化作为配电网运行管理的基础平台,在提高供电可靠性、提升配网精益化管理水平方面发挥了重要作用,但随之而来的配电自动化的运维管控问题也开始逐渐显现。主要表现在配网自动化系统采集的运行监控数据种类繁多且数量巨大,跨区域、跨平台间数据交互能力弱,省级配电网运行状态管控系统服务构建不灵活、多异构系统间信息融合度低。由于电网的设备数据、运行数据以及管理数据等相关业务数据具有规模大、数据结构繁杂的特点,且数据涉及到电网公司的多个部门、多个系统,因此彼此之间的数据会出现大量冗余、不一致或缺失的情况。这些数据的来源种类繁多,包括SCADA系统、生产管理系统(PMS)、地理信息系统(GIS)、电能质量监测系统等,各个系统之间需求不同,数据类型、格式和精度等也存在较大差异,这些异构多源数据并不统一,需进行清洗、剔除和校验,否则各个数据源在实际应用场景本文档来自技高网...

【技术保护点】
1.一种基于K-MEANS算法的配电网云平台数据校验方法,其特征在于,包括:/nS100.获取配电网云平台数据中的数据对象个数,并将获取的对象构成配网数据集;/nS200.计算配网数据集中任意两个数据对象之间的距离,根据任意两个数据对象之间的距离,获取第一、第二和第三初始聚类中心;/nS300.根据第一、第二和第三初始聚类中心,确定初始聚类中心个数,并计算初始聚类中心的两两距离值,获取两两距离值中的最大值,根据两两距离值中的最大值确定第一阈值;/nS400.对待检测的配网数据集进行聚类,计算每个数据对象到各个聚类中心的距离绝对值;/nS500.采用第一规则对每个数据对象到各个聚类中心的距离绝对...

【技术特征摘要】
1.一种基于K-MEANS算法的配电网云平台数据校验方法,其特征在于,包括:
S100.获取配电网云平台数据中的数据对象个数,并将获取的对象构成配网数据集;
S200.计算配网数据集中任意两个数据对象之间的距离,根据任意两个数据对象之间的距离,获取第一、第二和第三初始聚类中心;
S300.根据第一、第二和第三初始聚类中心,确定初始聚类中心个数,并计算初始聚类中心的两两距离值,获取两两距离值中的最大值,根据两两距离值中的最大值确定第一阈值;
S400.对待检测的配网数据集进行聚类,计算每个数据对象到各个聚类中心的距离绝对值;
S500.采用第一规则对每个数据对象到各个聚类中心的距离绝对值进行判断,当待检测数据集中所有对象分类完成后,重新计算聚类中心;
S600.对重新计算聚类中心进行判断,如果聚类中心发生了改变,则重新执行S400-S600,重新对数据集进行聚类,并重新计算每个聚类这种的所有数据对象到新聚类中心的相似度;如果聚类中心未发生改变,输出所得到的聚类结果。


2.一种基于K-MEANS算法的配电网云平台数据校验方法,其特征在于,S100中,当得到配网数据集后,采用马氏距离方法识别和校验出离群点,并将离群点进行剔除,得到优化后的配网数据集。


3.一种基于K-MEANS算法的配电网云平...

【专利技术属性】
技术研发人员:郭江朱文强黄思旭章芳情刘洋李立生张林利张世栋
申请(专利权)人:武汉大学国网山东省电力公司电力科学研究院
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1