一种能量路由器异常智能检测方法技术

技术编号:31323197 阅读:33 留言:0更新日期:2021-12-13 00:11
本发明专利技术涉及一种基于强化学习的能量路由器异常检测方法,包括通过能量路由器的通信端口获取电气参数数据,并对电气参数数据进行处理;搭建强化学习模型的框架,并基于电气参数数据确定强化学习模型的动作集、状态集以及奖赏值;采用Q

【技术实现步骤摘要】
一种能量路由器异常智能检测方法


[0001]本专利技术涉及信息处理
,尤其涉及一种基于强化学习的能量路由器异常检测方法、装置和设备。

技术介绍

[0002]在能源互联网的时代,能量路由器的安全性要远远高于通信设备的安全性要求,能量路由器关系着整个能源互联网的能源传输问题,首先要对能量路由器的参数进行检测,只有在确保能源设备的运行参数安全无误的情况下,才能进行能源传输,但是目前参数异常检测的智能化程度不高,亟需解决。

技术实现思路

[0003]本专利技术所要解决的技术问题是针对现有技术的不足,提供一种基于强化学习的能量路由器异常检测方法、装置和设备。
[0004]本专利技术解决上述技术问题的技术方案如下:一种基于强化学习的能量路由器异常检测方法,所述方法包括:通过能量路由器的通信端口获取电气参数数据,并对所述电气参数数据进行处理;搭建强化学习模型的框架,并基于所述电气参数数据确定所述强化学习模型的动作集、状态集以及奖赏值;采用Q

Learning算法对所述强化学习模型的框架进行细化;根据具体问题确本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的能量路由器异常检测方法,其特征在于,所述方法包括:通过能量路由器的通信端口获取电气参数数据,并对所述电气参数数据进行处理;搭建强化学习模型的框架,并基于所述电气参数数据确定所述强化学习模型的动作集、状态集以及奖赏值;采用Q

Learning算法对所述强化学习模型的框架进行细化;根据具体问题确定Q

Learning算法中的超参数,并利用所述动作集、所述状态集以及所述奖赏值对所述强化学习模型进行迭代循环的训练;根据训练结果对所述强化学习模型进行调整后,利用所述强化学习模型对所述能量路由器进行异常检测。2.如权利要求1所述的基于强化学习的能量路由器异常检测方法,其特征在于,所述对所述电气参数数据进行处理,具体包括:对获取到的所述电气参数数据进行数据清洗及预处理。3.如权利要求2所述的基于强化学习的能量路由器异常检测方法,其特征在于,所述搭建强化学习模型的框架,并基于所述电气参数数据确定所述强化学习模型的动作集、状态集以及奖赏值,具体包括:将所述能量路由器的电气参数数据为所述强化学习模型中的状态集;将对所述能量路由器的异常检测数据为所述强化学习模型中的动作集;对所述能量路由器进行异常检测,若检测结果为正确,则获得所述奖赏值。4.如权利要求3所述的基于强化学习的能量路由器异常检测方法,其特征在于,所述采用Q

Learning算法对所述强化学习模型的框架进行细化,具体包括:初始化Q神经网络Q(),其中为所述Q神经网络的权重;对于每组所述电气参数数据,确定所述Q神经网络的奖励值;确定所述强化学习模型的学习速率α,并确定最大迭代次数K,对所述强化学习模型进行迭代。5.如权利要求4所述的基于强化学习的能量路由器异常检测方法,其特征在于,所述根据具体问题确定Q

Learning算法中的超参数,并利用所述动作集、所述状态集以及所述奖赏值所述对所述强化学习模型进行迭代循环的训练,具体包括:根据动作选择策略π(s,a),得到各动作的概率值;依据所述概率值,通过所述...

【专利技术属性】
技术研发人员:王浩沈俊李振兴徐少山徐田园高新强汪萌刘学亮
申请(专利权)人:中国科学院理化技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1