本申请涉及一种用户日用电量数据清洗方法、装置、设备和介质,所述方法包括:获取预设地区内的用电用户的历史日用电量数据;获取所述历史日用电量数据中常住居民用户日用电量数据;根据所述常住居民用户日用电量数据获取各常住居民用户的清洗阈值范围;确定所述地区内各常住居民用户清洗后用户日用电量数据,所述清洗后用户日用电量数据为所述常住居民用户日用电量数据中属于所述清洗阈值范围的数据。本申请通过对所述常住居民用户日用电量数据进行异常值清洗,获取所述地区内各常住居民用户清洗后用户日用电量数据,使得获取的用户日电量数据与用户的真实用电量情况一致,且能够反应用户真实用电规律,提高数据获取的真实性与有效性。
Cleaning method, device, equipment and medium of user's daily electricity consumption data
【技术实现步骤摘要】
用户日用电量数据清洗方法、装置、设备和介质
本申请涉及电力系统
,特别是涉及一种用户日用电量数据清洗方法、装置、设备和介质。
技术介绍
随着国民经济的快速发展和各种耗电设备在日常生活中的普及,用电数据、负荷数据、客户档案数据呈几何倍数增长,国民日益增长的用电需求对电力系统用电量分析、预测及调度提出了更高的要求。如何基于海量的用电数据挖掘用户潜在的用电规律,提高电力系统服务的智能化水平,跟上国民经济快速发展的步伐,成为电力系统服务部门亟待解决的技术难题之一。然而传统的电力系统中,缺乏有效地对用户日用电数据的处理分析技术,不能确保电力监控系统中获取及保存的用户日用电数据和用户实际使用的电量数据一致,更不能有效地从海量的用户日用电量数据中滤出异常用电数据,以获取能够反应用户真实用电规律的用户日用电量数据。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够对用户日电量数据进行智能清洗以获取能够反应用户真实用电规律的用户日用电量数据清洗方法、装置、设备和介质。本申请的一方面提供一种用户日用电量数据清洗方法,包括:获取预设地区内的用电用户的历史日用电量数据;获取所述历史日用电量数据中常住居民用户日用电量数据;根据所述常住居民用户日用电量数据确定各常住居民用户的清洗阈值范围;确定所述地区内各常住居民用户清洗后用户日用电量数据,所述清洗后用户日用电量数据为所述常住居民用户日用电量数据中属于所述清洗阈值范围的数据。于上述实施例中的用户日用电量数据清洗方法中,可以获取预设地区内的用电用户的历史日用电量数据,清洗掉选定区域内所有用电用户的历史日用电量数据中的非常住居民的日电量数据,获取所述历史日用电量数据中常住居民用户日用电量数据。由于常住居民的日用电量数据会呈现出一定的规律,正常情况下,常住居民的日用电量数据会在一定的范围区间内上下波动,即使可能出现偶尔的异常情况,导致该用户的日用电量数据可能偏离所述范围区间,但这样的偶然异常值数据属于该用户正常用电规律范围之外,不具有规律性,因此,通过对所述常住居民用户日用电量数据进行异常值清洗,并根据所述常住居民用户日用电量数据的波动情况获取该常住居民用户的清洗阈值范围,获取所述地区内各常住居民用户清洗后用户日用电量数据,使得获取的用户日电量数据与用户的真实用电量情况一致,且能够反应用户真实用电规律,提高数据获取的真实性与有效性。在其中一个实施例中,所述获取所述历史日用电量数据中常住居民用户日用电量数据包括:去除所述历史日用电量数据中的非常住居民用户日用电量数据,所述非常住居民用户日用电量数据为用户的日电量数据缺失总和占比超过预设的第一阈值的用户。于上述实施例中的用户日用电量数据清洗方法中,由于用电用户的历史数据中包含了很多非常住居民用电量数据。用户的日用电量数据与用户住房的使用情况高度相关,可以通过获取日电量数据缺失总和占比,若用户的所述日电量数据缺失总和占比超过预设的第一阈值,说明所述用户的日电量数据处于高度缺失状态,可以推断该用户不经常在该住房内居住。通过将用户日电量数据缺失总和占比与预设的第一阈值比较,去除所述历史日用电量数据中的非常住居民用户日用电量数据,获取日用电量更加规律的常住居民日用电量数据,进一步提高了获取的用户日电量数据与用户的真实用电量情况的一致性,提高了数据获取的有效性。在其中一个实施例中,所述获取所述历史日用电量数据中常住居民用户日用电量数据还包括:获取所述常住居民用户日用电量数据中的正值数据,所述正值数据为所述常住居民用户日用电量数据中大于零的数据。于上述实施例中的用户日用电量数据清洗方法中,由于在获取用电用户的日电量数据的过程中,可能因信号采集传感器故障、外界噪声信号干扰或者人为误差等因素导致获取的用户日电量数据中的某些数据与真实数据的偏差较大,甚至获取错误的数据。由于常住居民用户的日用电量数据正常情况下应该大于零,通过获取常住居民用户日用电量数据中大于零的数据,可以有效地排除用户日用电量数据中的错误数据,提高获取的用电用户日用电量数据的真实性与客观性。在其中一个实施例中,所述根据所述常住居民用户日用电量数据获取各常住居民用户的清洗阈值范围包括:将各所述常住居民用户的所述正值数据按照时间维度降序排序;获取各所述常住居民用户的所述正值数据的时间序列级比数;获取各所述常住居民用户的所述正值数据中的正常值数据,基于所述正常值数据计算的时间序列级比数属于预设的级比阈值范围。于上述实施例中的用户日用电量数据清洗方法中,常住居民用户在相邻的两天中的日用电量的差别一般较小,即常住居民的日电量数据曲线应该非常平滑,常住居民的日用电量数据中相邻的两个数据的差值应该较小。通过将各所述常住居民用户的所述正值数据按照时间维度降序排序,获取各所述常住居民用户的所述正值数据的时间序列级比数,通过将所述时间序列级比数分别与预设的级比阈值范围相比较,获取属于预设的级比阈值范围内的时间序列级比数对应的用户日电量数据,以排除常住居民用户日电量数据中偏离该用户日电量曲线较远的数据点,进一步提高了获取的用电用户日用电量数据的真实性。在其中一个实施例中,所述根据所述常住居民用户日用电量数据获取各常住居民用户的清洗阈值范围还包括:获取各所述常住居民用户所述正常值数据的均值及方差;基于所述均值和所述方差计算各常住居民用户的所述清洗阈值范围。在其中一个实施例中,于所述用户日用电量数据清洗方法,根据以下公式计算各常住居民用户的所述清洗阈值范围[a,b]:其中,为其中一所述常住居民用户的所述正常值数据的均值,std为所述常住居民用户所述正常值数据的方差。于上述实施例中的用户日用电量数据清洗方法中,通过获取各所述常住居民用户所述正常值数据的均值及方差,基于所述均值和所述方差计算各常住居民用户的所述清洗阈值范围,进一步排除了常住居民用户日电量数据中偏离该用户日电量曲线较远的数据点,进一步提高了获取的用电用户日用电量数据的真实性。在其中一个实施例中,所述用户日用电量数据清洗方法包括:保存各所述常住居民用户的所述清洗后用户日用电量数据;生成各所述常住居民用户的清洗后日用电量数据索引标签,所述索引标签用于获取所述常住居民用户的所述清洗后用户日用电量数据。于上述实施例中的用户日用电量数据清洗方法中,于上述实施例中的用户日用电量数据清洗方法中,保存各所述常住居民用户的所述清洗后用户日用电量数据,并生成用于获取所述常住居民用户的清洗后用户日用电量数据的索引标签,便于用户通过该索引标签获取该所述常住居民用户的所述清洗后用户日用电量数据,提高了数据获取的便利性与高效性。本申请的一方面提供一种用户日用电量数据清洗装置,包括:历史日用电量数据获取模块,用于获取预设地区内的用电用户的历史日用电量数据;常住居民用户日用电量数据,用于获取所述历史日用电量数据中常住居民用户日用电量数据;<本文档来自技高网...
【技术保护点】
1.一种用户日用电量数据清洗方法,其特征在于,包括:/n获取预设地区内的用电用户的历史日用电量数据;/n获取所述历史日用电量数据中常住居民用户日用电量数据;/n根据所述常住居民用户日用电量数据确定各常住居民用户的清洗阈值范围;/n确定所述地区内各常住居民用户清洗后用户日用电量数据,所述清洗后用户日用电量数据为所述常住居民用户日用电量数据中属于所述清洗阈值范围的数据。/n
【技术特征摘要】
1.一种用户日用电量数据清洗方法,其特征在于,包括:
获取预设地区内的用电用户的历史日用电量数据;
获取所述历史日用电量数据中常住居民用户日用电量数据;
根据所述常住居民用户日用电量数据确定各常住居民用户的清洗阈值范围;
确定所述地区内各常住居民用户清洗后用户日用电量数据,所述清洗后用户日用电量数据为所述常住居民用户日用电量数据中属于所述清洗阈值范围的数据。
2.根据权利要求1所述的方法,其特征在于,所述获取所述历史日用电量数据中常住居民用户日用电量数据之前包括:
去除所述历史日用电量数据中的非常住居民用户日用电量数据,所述非常住居民用户日用电量数据为用户的日电量数据缺失总和占比超过预设的第一阈值的用户。
3.根据权利要求2所述的方法,其特征在于,所述获取所述历史日用电量数据中常住居民用户日用电量数据还包括:
获取所述常住居民用户日用电量数据中的正值数据,所述正值数据为所述常住居民用户日用电量数据中大于零的数据。
4.根据权利要求3所述的方法,其特征在于,所述根据所述常住居民用户日用电量数据获取各常住居民用户的清洗阈值范围包括:
将各所述常住居民用户的所述正值数据按照时间维度降序排序;
获取各所述常住居民用户的所述正值数据的时间序列级比数;
获取各所述常住居民用户的所述正值数据中的正常值数据,基于所述正常值数据计算的时间序列级比数属于预设的级比阈值范围。
5.根据权利要求4中所述的方法,其特征在于,所述根据所述常住居民用户日用电量数据获取各常住居民用户的清洗阈值范围还包括:
获取各所述常住居民用户所述正常值数据的均值及...
【专利技术属性】
技术研发人员:符晓洪,柳羿,何宽政,张升平,曾麒杰,
申请(专利权)人:深圳供电局有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。