本申请属于电力工程技术领域,涉及电力需求侧的大数据分析方法、装置、设备及存储介质。该电力需求侧的大数据分析方法包括:对获取到的电力数据进行数据清洗,包括:偏差数据检测、缺失值处理以及噪声数据光滑处理;集合归属于同一缴费用户的且经过所述数据清洗的电力数据;将集合后的所述电力数据导入电力需求侧数据分析神经网络,所述电力需求侧数据分析神经网络包括:输入层、一层或以上的隐藏层以及输出层,所述缴费用户的一个电力数据维度的数据构成所述输入层的一个序列;基于所述电力需求侧数据分析神经网络的最终计算结果进行缴费用户标识;生成缴费用户分类表。本申请涉及的电力需求侧的大数据分析方法能够对缴费用户进行快速地分类。
Big data analysis method, device, equipment and storage medium on power demand side
【技术实现步骤摘要】
电力需求侧的大数据分析方法、装置、设备及存储介质
本申请属于电力工程
,涉及电力需求侧的大数据分析方法、装置、设备及存储介质。
技术介绍
由于电力供给侧存在垄断性,因此电力市场并非是一个完全开放的市场,具有准入门槛高、行政管制严、技术屏障多等特点。基于此种现实情况,通过电力供给侧的改革来合理地调节发电、输电、配电以及用电之间的成本与效率,始终受到较大的阻碍。为了落实好国家的绿色能源政策,有效解决电力短缺,电价过高,服务质量低下等问题,积极推动电力需求侧的改革成为主观上迫切且客观上可行的重大举措。其中一项关键措施是落实电力需求侧管理(DSM,DemandSideManagement)。DSM的主要内容包括:综合运用经济、技术、管理以及必要的行政手段,引导、激励和约束全社会优化用电方式、提高用电效率,实现科学用电、有序用电以及节约用电的总体目标。由于电力需求侧的用电终端极多、负荷特性复杂,因此通过技术手段来具体化DSM的内容,是决定DSM能否在电力工业中的逐步深入应用的关键一步。总的来说,落实DSM不仅能够有效解决电力短缺,电价过高,服务质量低下等问题,而且能够给整个电力行业带来了巨大的经济效益。电力工程的研究内容涉及到电能的生产、输配以及使用等多个环节。电力需求侧的研究主要集中在电能的使用环节,重点解决电力数据的采集、存储、分析和应用的技术问题,向电力供给侧提供准确的电力需求情况,进而帮助电力供给侧快速响应,同时给电力需求侧反馈有效的数据分析结果。现有技术中,电力数据的产生是极其分散的,电力数据的维度也是非常多的,此外电力数据的数据量也是极其惊人的,因此如何高效处理电力数据,并基于处理后的电力数据对缴费用户进行分类就成为一个亟待解决的技术问题。
技术实现思路
本申请实施例一方面公开了一种电力需求侧的大数据分析方法,旨在提高电力数据的分析处理,快速地对缴费用户进行分类。所述电力需求侧的大数据分析方法包括:对获取到的电力数据进行数据清洗,具体包括:偏差数据检测、缺失值处理以及噪声数据光滑处理;集合归属于同一缴费用户的且经过所述数据清洗的电力数据;将集合后的所述电力数据导入电力需求侧数据分析神经网络,所述电力需求侧数据分析神经网络包括:输入层、一层或以上的隐藏层以及输出层,所述缴费用户的一个电力数据维度的数据构成所述输入层的一个序列;基于所述电力需求侧数据分析神经网络的最终计算结果进行缴费用户标识;生成缴费用户分类表。在本申请的一些实施例中,所述偏差数据检测包括:构建概率分布评估模型,应用所述概率分布评估模型检测出离群点,将所述离群点对应的值作为偏差数据;所述缺失值处理包括:全局常量自动填充、中心度量自动填充、同组均值自动填充以及最有可能值自动填充;所述噪声数据光滑处理包括:将所述电力数据中有噪声的变量拟合成一条直线或曲线,用所述直线或所述曲线上的值替代所述电力数据中有噪声的所述变量。在本申请的一些实施例中,所述集合归属于同一缴费用户的且经过所述数据清洗的电力数据包括:获取经过所述数据清洗的电力数据;提取用于表征电力数据维度的特征值;根据所述特征值选择集合计算方式;对集合结果进行评估;所述集合计算方式包括基于n维电力数据对象的计算方式,所述基于n维电力数据对象的计算方式为或者为或者为CD=max(|xk-yk|)k;或者为其中,ED为欧几里得距离,MD为曼哈顿距离,CD为切比雪夫距离,MKD为闵可夫斯基距离,xk为一个n维电力数据对象X=(x1,x2,...,xn)的取值,yk为另一个n维电力数据对象Y=(y1,y2,...,yn)的取值,p为特定值的闵可夫斯基距离对应的欧几里得距离或曼哈顿距离或切比雪夫距离;所述对集合结果进行评估包括:用已知的归属于同一缴费用户的集合的类别标签为标准;将所述集合结果得出的集合与所述标准进行比对,进而判断出所述集合结果的质量。在本申请的一些实施例中,所述输入层的每一个神经元用于输入一个所述电力数据维度的取值;所述输入层的激活函数为exp(-xi)为对某一电力数据维度的取值xi的相反数的指数;所述隐藏层将所述输入层的输出特征抽象到另一个维度空间,并对抽象后的特征进行线性规划;若电力需求侧数据分析神经网络包含多层所述隐藏层,则由多层所述隐藏层对输出特征进行多层次抽象,最终获得更好的线性规划结果;在所述隐藏层的输出满足迭代终止条件后,由所述输出层输出最终计算结果。本申请实施例另一方面公开了一种电力需求侧的大数据分析装置。所述电力需求侧的大数据分析装置包括:数据清洗模块10,用于对获取到的电力数据进行数据清洗;集合模块20,用于集合归属于同一缴费用户的且经过所述数据清洗的电力数据;数据分析神经网络模块30,用于将集合后的所述电力数据导入电力需求侧数据分析神经网络;缴费用户标识模块40,用于基于所述电力需求侧数据分析神经网络的最终计算结果进行缴费用户标识;用户分类表生成模块50,用于生成缴费用户分类表。在本申请的一些实施例中,所述数据清洗模块10包括:偏差数据检测子模块11,用于构建概率分布评估模型,应用所述概率分布评估模型检测出离群点,将所述离群点对应的值作为偏差数据;缺失值处理子模块12,用于进行全局常量自动填充、中心度量自动填充、同组均值自动填充以及最有可能值自动填充;噪声数据光滑处理子模块13,用于将所述电力数据中有噪声的变量拟合成一条直线或曲线,用所述直线或所述曲线上的值替代所述电力数据中有噪声的所述变量。在本申请的一些实施例中,所述集合模块20包括:获取子模块21,用于获取经过所述数据清洗的电力数据;提取子模块22,用于提取用于表征电力数据维度的特征值;计算方式选择模块23,用于根据所述特征值选择集合计算方式;评估子模块24,用于对集合结果进行评估。在本申请的一些实施例中,所述数据分析神经网络模块30的输入层的每一个神经元用于输入一个所述电力数据维度的取值;所述数据分析神经网络模块30的隐藏层将所述输入层的输出特征抽象到另一个维度空间,并对抽象后的特征进行线性规划;若电力需求侧数据分析神经网络包含多层所述隐藏层,则由多层所述隐藏层对输出特征进行多层次抽象,最终获得更好的线性规划结果;在所述隐藏层的输出满足迭代终止条件后,由所述数据分析神经网络模块30的输出层输出最终计算结果。本申请实施例另一方面还公开了一种电力需求侧的大数据分析设备。所述电力需求侧的大数据分析设备包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任意一种所述的电力需求侧的大数据分析方法。本申请实施例另一方面还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一种所述的电力需求侧的大数据分析方法。与现有技术相比,本申请公开的技术方案主要有以下有益效果:在本申请的实施例中,所述电力需求侧的大数据分析方法包括:对获取到的电力数据进行数据清洗,具体包括:偏差数据检测、缺失值处理以及噪声数据光滑处理;集合归本文档来自技高网...
【技术保护点】
1.一种电力需求侧的大数据分析方法,其特征在于,包括:/n对获取到的电力数据进行数据清洗,包括:偏差数据检测、缺失值处理以及噪声数据光滑处理;/n集合归属于同一缴费用户的且经过所述数据清洗的电力数据;/n将集合后的所述电力数据导入电力需求侧数据分析神经网络,所述电力需求侧数据分析神经网络包括:输入层、一层或以上的隐藏层以及输出层,所述缴费用户的一个电力数据维度的数据构成所述输入层的一个序列;/n基于所述电力需求侧数据分析神经网络的最终计算结果进行缴费用户标识;/n生成缴费用户分类表。/n
【技术特征摘要】
1.一种电力需求侧的大数据分析方法,其特征在于,包括:
对获取到的电力数据进行数据清洗,包括:偏差数据检测、缺失值处理以及噪声数据光滑处理;
集合归属于同一缴费用户的且经过所述数据清洗的电力数据;
将集合后的所述电力数据导入电力需求侧数据分析神经网络,所述电力需求侧数据分析神经网络包括:输入层、一层或以上的隐藏层以及输出层,所述缴费用户的一个电力数据维度的数据构成所述输入层的一个序列;
基于所述电力需求侧数据分析神经网络的最终计算结果进行缴费用户标识;
生成缴费用户分类表。
2.根据权利要求1所述的电力需求侧的大数据分析方法,其特征在于:
所述偏差数据检测包括:构建概率分布评估模型,应用所述概率分布评估模型检测出离群点,将所述离群点对应的值作为偏差数据;
所述缺失值处理包括:全局常量自动填充、中心度量自动填充、同组均值自动填充以及最有可能值自动填充;
所述噪声数据光滑处理包括:将所述电力数据中有噪声的变量拟合成一条直线或曲线,用所述直线或所述曲线上的值替代所述电力数据中有噪声的所述变量。
3.根据权利要求1所述的电力需求侧的大数据分析方法,其特征在于,所述集合归属于同一缴费用户的且经过所述数据清洗的电力数据包括:获取经过所述数据清洗的电力数据;提取用于表征电力数据维度的特征值;根据所述特征值选择集合计算方式;对集合结果进行评估;
所述集合计算方式包括基于n维电力数据对象的计算方式,所述基于n维电力数据对象的计算方式为或者为或者为CD=max(|xk-yk|)k;或者为其中,ED为欧几里得距离,MD为曼哈顿距离,CD为切比雪夫距离,MKD为闵可夫斯基距离,xk为一个n维电力数据对象X=(x1,x2,...,xn)的取值,yk为另一个n维电力数据对象Y=(y1,y2,...,yn)的取值,p为特定值的闵可夫斯基距离对应的欧几里得距离或曼哈顿距离或切比雪夫距离;
所述对集合结果进行评估包括:用已知的归属于同一缴费用户的集合的类别标签为标准;将所述集合结果得出的集合与所述标准进行比对,进而判断出所述集合结果的质量。
4.根据权利要求1所述的电力需求侧的大数据分析方法,其特征在于,所述输入层的每一个神经元用于输入一个所述电力数据维度的取值;所述输入层的激活函数为exp(-xi)为对某一电力数据维度的取值xi的相反数的指数;所述隐藏层将所述输入层的输出特征抽象到另一个维度空间,并对抽象后的特征进行线性规划;若电力需求侧数据分析神经网络包含多层所述隐藏层,则由多层所述隐藏层对输出特征进行多层次抽象,最终获得更好的线性规划结果;在所述隐藏层的输出满足迭代终止条件后,由所述输...
【专利技术属性】
技术研发人员:罗磊,朱祥明,杜岱弼,
申请(专利权)人:深圳市恒泰能源科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。