一种基于极限学习机的密度聚类离群点检测方法技术

技术编号:25441007 阅读:26 留言:0更新日期:2020-08-28 22:28
本发明专利技术提供的一种基于极限学习机的密度聚类离群点检测方法,充分结合了机器学习方法的优势与聚类算法的优势,利用极限学习机来给出聚类算法中关键的阈值,可以拓宽密度聚类算法的应用范围和提高密度聚类算法的准确度。包括以下步骤:1选取一段日志类型为3的历史数据,包含正常数据和掉线数据;2对报文数据进行预处理;3将预处理之后的且带有标签的数据导入极限学习机中;4通过极限学习机得出基于权值的局部离群因子的阈值;5设定密度聚类的阈值;6导入实时数据;7计算实时数据的基于权值的局部离群因子;8判断出掉线报文。

【技术实现步骤摘要】
一种基于极限学习机的密度聚类离群点检测方法
本专利技术涉及一种基于极限学习机的密度聚类离群点检测方法,属于机器学习领域和数据挖掘领域。
技术介绍
近年来,随着全球能源问题的日益严重,世界各国都开始大力推进智能电网的发展,智能电网建设的目标是形成一个覆盖整个电力系统成产过程的安全、绿色、节能的实时系统。而支持智能电网安全、节能、实时运行的基础是电网信息的实时采集、存储、传输以及海量多源数据的快速分析。为了实现这一目的,各种智能设备分别应用于电网信息的采集、监测、通讯等各个方面。智能电表为代表的计量自动化系统就是智能设备应用于电网的核心部分之一,通过电网中计量自动化终端,实现对发电厂、变电站、变压器和用户这些角色的“发电、供电、配电、售电”整个过程的数据采集与监控功能,在提高供电质量、改善管理、减轻运维人员负担、提高经济效益与系统稳定性方面发挥着重要的作用。但是智能计量设备在给电网运维带来便利的同时,不可避免会出现终端通讯故障、传输的报文数据异常等问题,只有能够快速、准确的发现并处理这些问题才能保证智能电网的稳定运行。智能采集终端掉线是最为普遍的一本文档来自技高网...

【技术保护点】
1.一种基于极限学习机的密度聚类离群点检测方法,其特征在于,包括以下步骤:/n步骤1,选取历史数据,包含正常数据和掉线数据;/n步骤2,对报文数据进行预处理;/n步骤3,将预处理之后的且带有标签的数据导入极限学习机中;/n步骤4,通过极限学习机得出基于权值的局部离群因子的阈值;/n步骤5,设定密度聚类的阈值;/n步骤6,导入实时数据;/n步骤7,计算实时数据的基于权值的局部离群因子;/n步骤8,判断出掉线报文。/n

【技术特征摘要】
1.一种基于极限学习机的密度聚类离群点检测方法,其特征在于,包括以下步骤:
步骤1,选取历史数据,包含正常数据和掉线数据;
步骤2,对报文数据进行预处理;
步骤3,将预处理之后的且带有标签的数据导入极限学习机中;
步骤4,通过极限学习机得出基于权值的局部离群因子的阈值;
步骤5,设定密度聚类的阈值;
步骤6,导入实时数据;
步骤7,计算实时数据的基于权值的局部离群因子;
步骤8,判断出掉线报文。


2.根据权利要求1所述的极限学习机的数学模型为:



...

【专利技术属性】
技术研发人员:乔涵哲王贺彬
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1