一种基于深度强化学习的异构网络节能路由方法技术

技术编号：35189836 阅读：23 留言：0更新日期：2022-10-12 18:06

本发明专利技术属于无线传感器网络技术领域，具体涉及一种基于深度强化学习的异构网络节能路由方法，传感器节点根据自身传感器的预定义计划感知环境，收集观测数据并存入对应的缓存队列；并在等待时间内，接收邻居节点传送的聚合数据并存入对应的缓存队列；传感器节点将同一缓存队列中的数据聚合，得到多种类型的聚合数据；根据Q学习自适应算法选择每种类型的聚合数据的下一跳传感器节点并转发；传感器节点根据下一跳传感器节点的响应更新对应传感器的Q表，本发明专利技术基于机器学习的自适应路由实现对网络动态变化的实时捕获，用较小的开销实现对整个网络的动态掌控，具有较好的节能性能，有效的延长了网络生命周期。的延长了网络生命周期。的延长了网络生命周期。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度强化学习的异构网络节能路由方法

[0001]本专利技术属于无线传感器网络
，具体涉及一种基于深度强化学习的异构网络节能路由方法。

技术介绍

[0002]在无线传感器网络中，许多传感器节点部署在广域上，以收集观测数据并将其发送到接收器(或服务器)。因此，需要多跳传输来将收集的数据成功地传送到位于源传感器节点传输范围之外的接收器。这需要一个收集传感器节点来计算到接收器的最佳路由。能源效率是无线传感器网络成功应用的主要挑战，但是节点能量有限，部署后无法轻松充电。此外，由于能量主要由无线电设备消耗，因此通信路由算法的节能设计至关重要。
[0003]路由协议的能量消耗会影响无线传感器网络(WSN)的生命周期，因为部署后微小的传感器节点通常很难充电。通常，为了节约能源，数据聚合用于最小化和/或消除每个节点上的数据冗余，并减少无线传感器网络中传输的总体数据量。此外，节能路由被广泛用于确定从源到目的地的最佳路径，同时避免能量不足的节点，以节省中继感测数据的能量。在大多数传统方法中，数据聚合和路由路径选择是分开考虑的。各种机器学习技术被用来有效地捕捉节点拓扑变化、受限能量条件、事件检测和通信成本等动态特征，以实现无线传感器网络的节能运行。其中，强化学习(RL)特别适用于包括长期与短期奖励权衡的问题。它为系统提供了一个框架，使其能够从以前与环境的交互中学习，并在将来有效地选择其操作。基于RL的路由协议可以确定最佳路径，作为复杂网络条件和服务质量要求的自适应方法。

技术实现思路

[0004]为解决...

【技术保护点】

【技术特征摘要】
1.一种基于深度强化学习的异构网络节能路由方法，其特征在于，构建传感器网络，所述传感器网络包括一个sink节点、M个传感器节点、K种不同类型的传感器；传感器设置预定义计划感知环境并采集数据，每种传感器采集的数据类型不同，传感器网络中共有K种数据类型；每个传感器节点都有与K种数据类型一一对应的缓存队列；基于深度强化学习的异构网络节能路由方法，包括以下步骤：S1.任一传感器节点中的传感器根据自身的预定义计划感知环境，在自身的预定义计划内收集观测数据并存入对应的缓存队列；S2.该传感器节点接收来自邻居节点的数据并将其存入对应的缓存队列；S3.该传感器节点将存储在同一缓存队列的数据聚合，K种缓存队列对应K种聚合数据；S4.构建基于深度强化学习的Q学习自适应算法，该传感器节点通过Q学习自适应算法为每种聚合数据选择下一跳传感器节点。2.根据权利要求1所述的一种基于深度强化学习的异构网络节能路由方法，其特征在于，任一种聚合数据通过Q学习自适应算法选择下一跳传感器节点进行转发的过程为：S11.传感器节点s确定该聚合数据的数据类型，在Q路由表中选择该数据类型的转发优先级最大的传感器节点s
′
；S12.传感器节点s将该聚合数据转发给传感器节点s
′
，传感器节点s
′
接收并返回响应数据包，响应数据包包括奖励信息和确认接收信息；S13.传感器节点s接收响应数据包并更新自身的Q路由表。3.根据权利要求2所述的一种基于深度强化学习的异构网络节能路由方法，其特征在于，传感器节点s
′
接收聚合数据并计算奖励信息反馈给传感器节点s，奖励信息的计算公式为：为：为：R
L
＝l
s
(s,s
′
)其中，R为数据传输奖励；R
DA
为数据聚合奖励；R
E
为剩余能量水平奖励；R
L
为链路强度奖励；E
s
′
为下一跳传感器节点s
′
的剩余能量水平；为下一跳传感器节点s
′
的当前剩余能量；为下一跳传感器节点s
′
...

【专利技术属性】
技术研发人员：付蔚，胡灿炜，刘庆，李明，彭钦，吕贝哲，洪承镐，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人