一种基于大数据的用户用电行为的分析方法技术

技术编号:26651441 阅读:53 留言:0更新日期:2020-12-09 00:52
本发明专利技术及电力大数据分析领域,具体涉及一种基于大数据的用户用电行为的分析方法,包括如下步骤:S1、采用数据挖掘模块基于预设的用电行为参数模型在电力大数据库内挖掘对应的用户用电行为特征参数集;S2、基于类间区分度的属性约简算法实现用户用电行为特征参数集的预处理,得目标用户用电行为特征参数集;S3、基于SparkR的并行化k‑means算法实现目标用户用电行为特征参数集的分析,输出对应的分析结果。本发明专利技术可以准确快速的实现用户用电行为的自主分析,从而将纷繁多样的电力海量数据转换成具有信息和商业价值的可用数据。

【技术实现步骤摘要】
一种基于大数据的用户用电行为的分析方法
本专利技术涉及电力大数据分析领域,具体涉及一种基于大数据的用户用电行为的分析方法。
技术介绍
随着计算机和网络技术在电力企业持续深入的应用,电力企业的数据积累越来越多,这部分数据在一定程度上反应了供电企业长久以来的运行状况。采用大数据和云计算等新技术探索大用户用电行为和特征,并为大用户提供定制的电力服务逐步成为了电力市场关注的重点问题,同时也能够对电力行业的发展与进步带来新的方向。聚类分析方法是目前常用的用户用电行为分析方法,基于k-means的聚类算法是行业内最普遍采用的聚类分析方法。k-means算法是解决聚类问题的一种经典算法,具有简单、快速的特点,对于处理电力大数据,该算法具有相对的伸缩性和高效性,但是k-means算法的聚类结构对初值比较敏感,不同的初值会导致不同的结果,一旦初值选择不当,聚类结果就会出现偏差。模糊C均值聚类算法是模糊聚类算法中应用最为广泛的一种算法,它通过优化目标函数得到每个样本点对所有类中心的隶属度,判断样本点的类属从而实现自动对样本数据的分类的目的。但是模糊C均值聚本文档来自技高网...

【技术保护点】
1.一种基于大数据的用户用电行为的分析方法,其特征在于,包括如下步骤:/nS1、采用数据挖掘模块基于预设的用电行为参数模型在电力大数据库内挖掘对应的用户用电行为特征参数集;/nS2、基于类间区分度的属性约简算法实现用户用电行为特征参数集的预处理,得目标用户用电行为特征参数集;/nS3、基于SparkR的并行化k-means算法实现目标用户用电行为特征参数集/n的分析,输出对应的分析结果。/n

【技术特征摘要】
1.一种基于大数据的用户用电行为的分析方法,其特征在于,包括如下步骤:
S1、采用数据挖掘模块基于预设的用电行为参数模型在电力大数据库内挖掘对应的用户用电行为特征参数集;
S2、基于类间区分度的属性约简算法实现用户用电行为特征参数集的预处理,得目标用户用电行为特征参数集;
S3、基于SparkR的并行化k-means算法实现目标用户用电行为特征参数集
的分析,输出对应的分析结果。


2.如权利要求1所述的一种基于大数据的用户用电行为的分析方法,其特征在于,所述步骤S1中,用电行为参数模型基于用电行为关联参数和影响因子构建,每一个用电行为参数模型对应一个或多个关联参数对应的关联规则,并包含剔除一个或多个用电行为影响因子对应的剔除规则。


3.如权利要求1所述的一种基于大数据的用户用电行为的分析方法,其特征在于,所述步骤S1中,每一个数据挖掘模块配置一个用电行为参数模型,每一个用电行为参数模型内均配置一身份标记模块,用于实现用户用电行为特征参数来源的标记,且每一个用户用电行为特征参数来源配置唯一的标记符号。

【专利技术属性】
技术研发人员:毕楠沈学强滕志军李红彪田洪亮张秋实
申请(专利权)人:东北电力大学
类型:发明
国别省市:吉林;22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1