System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于离线强化学习的充换电电费定价寻优方法技术_技高网

一种基于离线强化学习的充换电电费定价寻优方法技术

技术编号:41211148 阅读:3 留言:0更新日期:2024-05-09 23:33
一种基于离线强化学习的充换电电费定价寻优方法,包括以下步骤,S1、数据采集;S2、数据预处理;S3、基于TCN模型的场站充电量预测;S4、基于BCQ的多目标优化模型。本发明专利技术所要解决的技术问题是提供一种基于离线强化学习的充换电电费定价寻优方法,通过利用离线收集的经验数据进行训练,减少对真实环境的依赖性,以及提高算法的采样效率。

【技术实现步骤摘要】

本专利技术涉及电动汽车充电服务,特别是一种基于离线强化学习的充换电电费定价寻优方法


技术介绍

1、传统的定价策略无法充分考虑到电网负荷、用户需求和电动车充换电行为的复杂性。电动车充换电电费定价领域存在一些已有的技术和方法,例如固定费率和时间段费率。

2、固定费率:这是最简单和常见的电费定价方式,即将固定的费率应用于所有充换电操作。无论充电桩的使用情况、电网负荷变化还是用户需求如何,电费都保持不变。这种方法的优点是简单易行,但缺乏灵活性和个性化,无法根据实时需求和电网状态进行调整。

3、时间段费率:这种定价方式根据时间段的不同设定不同的费率。通常将电网的高峰时段和低负荷时段划分出来,高峰时段的电费较高,低负荷时段的电费较低。时间段费率考虑了电网负荷的变化,可以鼓励用户在低负荷时段充换电,以平衡电网负荷。然而,时间段费率未能充分利用用户行为和电网状态的信息,无法满足个性化需求。

4、另外,由于充换电过程中存在多种因素的影响,如电池状态、充电速率、充电桩利用率等,如何将这些因素纳入定价模型并进行优化是一个技术上的挑战。

5、尽管已有技术在一定程度上满足了充换电电费定价的需求,但仍存在以下问题和缺陷:

6、1、缺乏个性化定价:固定费率和时间段费率无法根据用户个体的需求和行为进行个性化定价。不同用户可能有不同的充换电习惯和需求,而已有技术无法灵活地适应个体差异。

7、2、忽视电网负荷变化:已有技术中的时间段费率虽然考虑了电网负荷的变化,但仅仅基于时间因素进行定价。它没有充分利用实时的电网负荷信息来调整电费,导致电费定价不够精确和灵活。

8、3、无法应对复杂环境:电动车充换电过程中涉及的因素众多,如电池状态、充电速率、充电桩利用率等。已有技术未能将这些因素纳入定价模型并进行优化,无法充分考虑充换电过程的复杂性。

9、4、缺乏实时性:已有技术中的定价策略通常是静态的,无法实时响应充换电场景和电网状况的变化。这导致定价策略无法及时调整,不能最大程度地适应实时需求和电网负荷波动。

10、综上所述,已有技术在充换电电费定价方面存在个性化、灵活性、精确性和实时性等方面的问题和缺陷。针对这些问题,需要一种具备创新性的方法来实现充换电过程中电费定价的寻优。


技术实现思路

1、本专利技术所要解决的技术问题是提供一种基于离线强化学习的充换电电费定价寻优方法,通过利用离线收集的经验数据进行训练,减少对真实环境的依赖性,以及提高算法的采样效率。

2、为解决上述技术问题,本专利技术所采用的技术方案是:一种基于离线强化学习的充换电电费定价寻优方法,其特征在于,包括以下步骤,

3、s1、数据采集;

4、s2、数据预处理;

5、s3、基于tcn模型的场站充电量预测;

6、s4、基于bcq的多目标优化模型。

7、优选的,步骤s1中采集的数据包括充电场站因素、价格特征、时间特征及气象特征。

8、充电场站因素:充电场站的容量是指场站可以同时为多少辆电动车提供充电服务。容量较大的场站能够同时满足更多用户的充电需求,因此通常具有更高的充电量。如果场站容量不足,可能会导致用户排队等待充电或无法充电,从而限制了充电量。充电桩的充电速度也会影响充电场站的充电量。高速充电桩可以更快地完成充电过程,因此可以为更多的电动车提供服务,从而提高充电量。此外,充电速度还将影响用户满意度及高峰时间段的充电桩周转率,从而影响充电场站整体的充电量。

9、时间因素:影响充电行为的日期因素主要分为工作日、周六、周日以及节假日等,电动汽车车主在不同日期的充电规律是不一样的。车主在工作日主要往返工作单位,电量消耗、充电的时间选择和时长相对固定。而周末的出行时间和地点具有不确定性,电量消耗和充电时间也相对分散。如果碰到节假日,车主可能选择长途出行等,那么充电行为更加具有随机性。

10、气象因素:影响充电行为的气象因素主要包括温度和天气两个方面,冬天温度低,电动汽车蓄电池容量较低,可行驶里程会相对缩短;夏天温度高,电动汽车的行驶里程相对而言更长一点。电动汽车空调的使用也会导致耗电量增多,充电时长、充电量会响应增加。

11、价格因素:充电场站的充电费率也会影响充电量。较低的充电服务费率可能会吸引更多的用户前来充电,增加充电量。反之,较高的充电服务费率可能会限制充电量,尤其是对于频繁充电的用户。服务费、分时成本电价以及充电场站的优惠活动力度都在一定程度上影响着用户的充电行为。分时电价是电力公司根据不同的时间段设置不同的电价,是充电电价中的固定成本。通常高峰时段电价较高,而谷时段电价较低。这可以引导用户在低电价时充电,从而平衡电网负荷。用户可能会根据电价的不同选择在何时充电。折扣活动主要由运营平台举办,具有折扣活动的充电场站可以吸引更多用户使用该充电场站进行充电,特别是在特定时间或条件下享受折扣。这种促销可以在一定程度上影响用户的充电决策,促使他们选择参与活动。

12、优选的,所述步骤s2包括以下步骤:

13、s21、数据归并;

14、s22、异常值、缺失值处理;

15、s23、星期、节假日特征编码;

16、s24、数据归一化。

17、在数据预处理中,异常值和缺失值处理是常见的任务,用于清洗和准备数据以便后续分析。

18、模型的预测目标,即充电场站的充电量,主要由充电场站内的充电桩功率曲线积分求和得到。由于天气预报、充电场站充电功率、充电场站实时电价、充电场站剩余充电时间的数据采集频率可能不一致,如中国天气网数据最高频率为5分钟,而充电场站充电功率、充电场站实时电价、充电场站剩余充电时间数据则可达到30秒。针对不同频率的数据,需要按照统一的频率进行数据聚合,以达到数据对齐的目的。

19、数据归并的目的是将来自不同数据源或数据集的数据整合成一个统一的数据集,以便进行后续的数据分析和建模。通过数据归并,可以获取更加全面和准确的数据,提高数据分析的可信度和效果。

20、优选的,所述步骤s21将来自不同来源或多个数据集的数据合并成一个整体,以便进行后续分析和处理。该方法主要用于解决数据集成和数据集合并的问题,使得数据分析更加全面和准确。

21、异常值,outliers,是指在数据集中与其他观测值明显不同的数据点。异常值可能是由错误、测量误差、异常情况或其他原因引起的。处理异常值的目的是消除异常值对数据分析和模型建立的不良影响。

22、优选的,所述步骤s22中异常值处理包括以下方法:

23、(a) 可视化方法:通过绘制数据的直方图、散点图、箱线图,直观地识别和检测异常值,异常值通常位于数据分布的尾部或远离其他数据点;

24、(b) 统计方法:统计方法可以基于数据的统计特性来检测异常值。常用的统计方法包括基于均值和标准差的z-score方法、基于本文档来自技高网...

【技术保护点】

1.一种基于离线强化学习的充换电电费定价寻优方法,其特征在于,包括以下步骤,

2.根据权利要求1所述一种基于离线强化学习的充换电电费定价寻优方法,其特征在于,所述步骤S2包括以下步骤:

3.根据权利要求2所述一种基于离线强化学习的充换电电费定价寻优方法,其特征在于,所述步骤S21将来自不同来源或多个数据集的数据合并成一个整体,以便进行后续分析和处理。

4.根据权利要求2所述一种基于离线强化学习的充换电电费定价寻优方法,其特征在于,所述步骤S22中异常值处理包括以下方法:

5.根据权利要求2所述一种基于离线强化学习的充换电电费定价寻优方法,其特征在于,所述步骤S23中,周一到周日的标识采用one-hot编码,用一个二维向量对节假日特征进行编码。

6.根据权利要求2所述一种基于离线强化学习的充换电电费定价寻优方法,其特征在于,所述步骤S24,进行min-max归一化,

7.根据权利要求1所述一种基于离线强化学习的充换电电费定价寻优方法,其特征在于,所述步骤S3中,TCN由多个卷积层组成,每个卷积层都有多个卷积核,每个卷积核的宽度与TCN输入的时间序列长度相同,在每个卷积层之后,都会添加一个非线性激活函数和一个残差连接,以保留输入和输出之间的信息;此外,TCN还可以使用池化层来减少特征维度,最后,通过全局平均池化或全局最大池化操作,将最后一个卷积层的输出转换为固定长度的向量表示,用于后续的任务;

...

【技术特征摘要】

1.一种基于离线强化学习的充换电电费定价寻优方法,其特征在于,包括以下步骤,

2.根据权利要求1所述一种基于离线强化学习的充换电电费定价寻优方法,其特征在于,所述步骤s2包括以下步骤:

3.根据权利要求2所述一种基于离线强化学习的充换电电费定价寻优方法,其特征在于,所述步骤s21将来自不同来源或多个数据集的数据合并成一个整体,以便进行后续分析和处理。

4.根据权利要求2所述一种基于离线强化学习的充换电电费定价寻优方法,其特征在于,所述步骤s22中异常值处理包括以下方法:

5.根据权利要求2所述一种基于离线强化学习的充换电电费定价寻优方法,其特征在于,所述步骤s23中,周一到周日的标识采...

【专利技术属性】
技术研发人员:韩涛张豫李娟董洪伟曹晏莱华瑞雷奕迅
申请(专利权)人:三峡电能有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1