一种面向电力多元负荷用户的精细分类方法及系统技术方案

技术编号:25804958 阅读:40 留言:0更新日期:2020-09-29 18:39
本发明专利技术公开了一种面向电力多元负荷用户的精细分类方法及系统,该方法包括以下步骤:获取电力多元负荷用户的历史用电数据,进行预处理;对预处理后的数据进行聚类分析,得到划分不同类型的负荷特征曲线;根据所述不同类型的负荷特征曲线,利用SVM分类器进行训练,生成分类预测模型;将待分类的用户历史用电数据,输入所述分类预测模型,得到输出的分类结果。本发明专利技术通过数据预处理,可提高数据的可靠性及准确性;聚类分析得到的聚类效果更准确;所生成分类预测模型,能够为电力决策提供更科学的数据参考;最终对待分类的用户,可实现准确、快速、精细的划分用户类别。

【技术实现步骤摘要】
一种面向电力多元负荷用户的精细分类方法及系统
本专利技术涉及电力大数据
,特别涉及一种面向电力多元负荷用户的精细分类方法及系统。
技术介绍
当今信息
中数据挖掘技术、机器学习等方法深入挖掘电力企业在“数字电力”建设中所累积的“数据海洋”,实现对电力企业中的问题进行智能化预判和处理。目前,用电用户分类的研究主要是为了提高电网的稳定性,提升电力资源的利用率。随着数据挖掘技术、机器学习技术等广泛应用,不断优化的用电用户分类算法会相继产生。结合深度学习和聚类方法对负荷数据进行深入挖掘,已然成为必然趋势。随着经济快速发展,人们用电方式愈来愈多元化,传统电力用户分类标准与当下用户用电模式存在较大差异。针对电力用户分类研究还存在负荷侧运行价值发现不够充分的问题,电力用户分类标准若不贴合当下情况,会影响未来电网规划和决策。传统用户负荷分类方法主要结合模式识别对用户行业进行分类,因此,常常出现同一类别中一些用户的用电行为与该类别的负荷特征存在相差较大的情况。现有技术中,公开号为CN106022976A的专利技术专利《一种面向需求侧的电力用户分类方法及系统》,公开了具体的数据获取、及聚类分析步骤。但其技术方案具有两点不足:(1)该系统的数据获取模块是直接获取用户用电功率。该方法的缺点在于一般用户负荷数据存在维度过大,在获取过程中还存在由于大规模停电、电表故障、传输过程中的数据遗漏等问题;(2)该系统的聚类分析模块基于预设聚类方法,以用电功率需求量的大小等级和用电功率需求量的变化率等级作为聚类指标,对用户进行精细化分。该方法没有考虑用户负荷本身属性与负荷用户类别间的关系;并且采用聚类方法对负荷用户进行分类,忽略了聚类过程中的误差率,难以解决负荷用户分类预测问题。因此,如何提供一种给电力企业更可靠更精细的多元负荷用户分类方法,是从业人员亟待解决的问题。
技术实现思路
鉴于上述问题,本专利技术提供一种至少解决上述部分技术问题的面向电力多元负荷用户的精细分类方法及系统,可以实现更加准确、快速、精细的划分用户类别。第一方面,本专利技术实施例提供一种面向电力多元负荷用户的精细分类方法,包括以下步骤:S10、获取电力多元负荷用户的历史用电数据,进行预处理;S20、对预处理后的数据进行聚类分析,得到划分不同类型的负荷特征曲线;S30、根据所述不同类型的负荷特征曲线,利用SVM分类器进行训练,生成分类预测模型;S40、将待分类的用户历史用电数据,输入所述分类预测模型,得到输出的分类结果。在一个实施例中,所述步骤S10,包括:S101、选取横纵异常值处理方法,对历史用电数据进行修正;S102、利用z-score数据标准化按照预设比例对修正后的历史用电数据进行缩放,落入指定区间;其中:所述z-score数据标准化转化函数为:(1)式中,xij表示原数据;sj表示第j组数据的方差;表示第j组数据的均值;x′ij表示经过zscore标准化后的数据;i表示横向采集点的个数,最大值为m;j表示纵向用户的序号,最大值为n;S103、采用PCA降维定义第i个主成分的贡献率βi,将贡献率大于预设阈值的属性保留;其中,贡献率计算公式为:(2)式中,λi表示标准化后数据的协方差矩阵的特征值;k表示1到m之间的参数,用来计算全部方差;λk表示方差。在一个实施例中,所述步骤S20,包括:利用改进K-means算法,优化初始K值以及选取最佳初始聚类中心。在一个实施例中,利用改进K-means算法,优化初始K值以及选取最佳初始聚类中心,包括:S201、确定K值:利用簇内误差平方和以及数据可视化确定K值;S202、选取初始聚类中心:从预处理后的数据集中随机选取一个样本xi作为初始聚类中心C;S203、迭代选取K个聚类中心:对于数据集中的每一个样本点xi,D(x)表示xi与当前聚类中心A的最短距离;选择D(x)较大的点B作为新的聚类中心;重复该步骤直至选出K个聚类中心;S204、循环迭代聚类:根据计算每一类得到的均值,计算每个样本与中心样本间的距离,并依照最小距离原则重新划分样本;对于有变化的聚类均值进行重新计算,循环该步骤,直至聚类不再变化;S205、负荷特征提取:对分类结果做特征提取;S206、用户类别标注:将聚类结果给原数据集加标签,形成标注的数据集;S207、精细划分:对第一次分类后的结果,做二次聚类精细划分负荷用户;提取第一次聚类后同一类别的用户,重复步骤S201至步骤S206,获取用户精细划分后的标签。在一个实施例中,所述步骤S40中,输入所述分类预测模型前,还包括:将待分类的用户历史用电数据进行预处理。第二方面,本专利技术实施例还提供一种面向电力多元负荷用户的精细分类系统,包括:预处理模块,用于获取电力多元负荷用户的历史用电数据,进行预处理;聚类分析模块,用于对预处理后的数据进行聚类分析,得到划分不同类型的负荷特征曲线;分类训练模块,用于根据所述不同类型的负荷特征曲线,利用SVM分类器进行训练,生成分类预测模型;用户分类模块,用于将待分类的用户历史用电数据,输入所述分类预测模型,得到输出的分类结果。在一个实施例中,所述预处理模块,包括:异常值处理单元,用于选取横纵异常值处理方法,对历史用电数据进行修正;数据标准化单元,利用z-score数据标准化按照预设比例对修正后的历史用电数据进行缩放,落入指定区间;其中:所述z-score数据标准化转化函数为:(1)式中,xij表示原数据;sj表示第j组数据的方差;表示第j组数据的均值;x′ij表示经过zscore标准化后的数据;i表示横向采集点的个数,最大值为m;j表示纵向用户的序号,最大值为n;PCA降维单元,采用PCA降维定义第i个主成分的贡献率βi,将贡献率大于预设阈值的属性保留;其中,贡献率计算公式为:(2)式中,λi表示标准化后数据的协方差矩阵的特征值;k表示1到m之间的参数,用来计算全部方差;λk表示方差。在一个实施例中,所述聚类分析模块,具体利用改进K-means算法,优化初始K值以及选取最佳初始聚类中心。在一个实施例中,所述聚类分析模块,具体用于:S201、确定K值:利用簇内误差平方和以及数据可视化确定K值;S202、选取初始聚类中心:从预处理后的数据集中随机选取一个样本xi作为初始聚类中心C;S203、迭代选取K个聚类中心:对于数据集中的每一个样本点xi,D(x)表示xi与当前聚类中心A的最短距离;选择D(x)较大的点B作为新的聚类中心;重复该步骤直至选出K个聚类中心;S204、循环迭代聚类:根据计算每一类得到的均值,计算每个样本与中心样本间的距离,并依照最小距离原则重新划分样本;对于有变化的聚类均值进行重新计算,循环该步骤,直至聚类不再变化;S205、负荷特征提取:本文档来自技高网
...

【技术保护点】
1.一种面向电力多元负荷用户的精细分类方法,其特征在于,包括以下步骤:/nS10、获取电力多元负荷用户的历史用电数据,进行预处理;/nS20、对预处理后的数据进行聚类分析,得到划分不同类型的负荷特征曲线;/nS30、根据所述不同类型的负荷特征曲线,利用SVM分类器进行训练,生成分类预测模型;/nS40、将待分类的用户历史用电数据,输入所述分类预测模型,得到输出的分类结果。/n

【技术特征摘要】
1.一种面向电力多元负荷用户的精细分类方法,其特征在于,包括以下步骤:
S10、获取电力多元负荷用户的历史用电数据,进行预处理;
S20、对预处理后的数据进行聚类分析,得到划分不同类型的负荷特征曲线;
S30、根据所述不同类型的负荷特征曲线,利用SVM分类器进行训练,生成分类预测模型;
S40、将待分类的用户历史用电数据,输入所述分类预测模型,得到输出的分类结果。


2.如权利要求1所述的一种面向电力多元负荷用户的精细分类方法,其特征在于,所述步骤S10,包括:
S101、选取横纵异常值处理方法,对历史用电数据进行修正;
S102、利用z-score数据标准化按照预设比例对修正后的历史用电数据进行缩放,落入指定区间;其中:所述z-score数据标准化转化函数为:



(1)式中,xij表示原数据;sj表示第j组数据的方差;表示第j组数据的均值;x′ij表示经过zscore标准化后的数据;i表示横向采集点的个数,最大值为m;j表示纵向用户的序号,最大值为n;
S103、采用PCA降维定义第i个主成分的贡献率βi,将贡献率大于预设阈值的属性保留;其中,贡献率计算公式为:



(2)式中,λi表示标准化后数据的协方差矩阵的特征值;k表示1到m之间的参数,用来计算全部方差;λk表示方差。


3.如权利要求2所述的一种面向电力多元负荷用户的精细分类方法,其特征在于,所述步骤S20,包括:利用改进K-means算法,优化初始K值以及选取最佳初始聚类中心。


4.如权利要求3所述的一种面向电力多元负荷用户的精细分类方法,其特征在于,利用改进K-means算法,优化初始K值以及选取最佳初始聚类中心,包括:
S201、确定K值:利用簇内误差平方和以及数据可视化确定K值;
S202、选取初始聚类中心:从预处理后的数据集中随机选取一个样本xi作为初始聚类中心C;
S203、迭代选取K个聚类中心:对于数据集中的每一个样本点xi,D(x)表示xi与当前聚类中心A的最短距离;选择D(x)较大的点B作为新的聚类中心;重复该步骤直至选出K个聚类中心;
S204、循环迭代聚类:根据计算每一类得到的均值,计算每个样本与中心样本间的距离,并依照最小距离原则重新划分样本;对于有变化的聚类均值进行重新计算,循环该步骤,直至聚类不再变化;
S205、负荷特征提取:对分类结果做特征提取;
S206、用户类别标注:将聚类结果给原数据集加标签,形成标注的数据集;
S207、精细划分:对第一次分类后的结果,做二次聚类精细划分负荷用户;提取第一次聚类后同一类别的用户,重复步骤S201至步骤S206,获取用户精细划分后的标签。


5.如权利要求1-4任一项所述的一种面向电力多元负荷用户的精细分类方法,其特征在于,所述步骤S40中,输入所述分类预测模型前,还包括:将待分类的用户历史用电数据进行预处理。


6.一种...

【专利技术属性】
技术研发人员:李振元孙勇李宝聚熊健李德鑫吕项羽刘畅刘姝秀张海锋王佳蕊张家郡
申请(专利权)人:国网吉林省电力有限公司国网吉林省电力有限公司电力科学研究院国家电网有限公司
类型:发明
国别省市:吉林;22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1