一种水声传感器网络合作探索强化学习路由方法技术

技术编号：20395784 阅读：23 留言：0更新日期：2019-02-20 05:21

本发明专利技术涉及水声传感器网络、水声路由协议技术领域，特别涉及一种水声传感器网络合作探索强化学习路由方法。本发明专利技术包括以下步骤：(1)初始化各节点Q值及V值；(2)判断

全部详细技术资料下载

【技术实现步骤摘要】
一种水声传感器网络合作探索强化学习路由方法
本专利技术涉及水声传感器网络、水声路由协议
，特别涉及一种水声传感器网络合作探索强化学习路由方法。
技术介绍
水声传感器网络，UnderwaterAcousticSensorNetworks，即UASNs，由水下部署的传感器节点和用于接收数据的汇聚节点sink组成。这些节点提供了许多应用如环境监测、战术监视、资源勘探、辅助导航和灾难防御等。由于无线电波高传输损耗的限制，水下通信常采用声波。同时，UASNs面临着电池容量有限、误码率高、端到端时延高、可用带宽有限等独特的挑战。由于UASNs的高延迟、高能耗以及低带宽等固有特性，其网络拓扑结构通常为分布式网络。其路由协议面临的一个主要问题是寻找高效且节能的路径。与环境试错交互以寻找最大期望奖励的强化学习算法已被应用于UASNs，基于强化学习的路由协议，每一个节点在选择路径时不必知道全网拓扑信息就可近似达到全局最优。强化学习算法可以使节点学习和适应其所处的动态环境，并且能够合并多项影响路由性能的因素，使路由决策考虑的更为全面。在本专利技术中，用源节点V值的收敛速度表征强化学习的收敛速度。在UASNs中，随着网络规模的扩大，强化学习的收敛速度减慢，网络能量消耗大，并在网络拓扑改变时，不能很好的跟踪其变化，影响网络性能。
技术实现思路
本专利技术的目的是针对上述现有技术的不足，提出一种水声传感器网络合作探索强化学习路由方法。在算法未收敛时，源节点发送数据包的同时发送数个控制包对路径进行合作探索，以加速其V值的收敛，解决了强化学习收敛速度慢的问题，同时减小了网络能耗，延长了...

【技术保护点】
1.一种水声传感器网络合作探索强化学习路由方法，其特征在于，该方法包括以下步骤：(1)初始化各节点Q值及V值；(2)根据各节点的Q值及V值，判断

【技术特征摘要】
1.一种水声传感器网络合作探索强化学习路由方法，其特征在于，该方法包括以下步骤：(1)初始化各节点Q值及V值；(2)根据各节点的Q值及V值，判断是否成立：(2.1)如果判断成立，源节点只发送数据包；(2.2)如果判断不成立，源节点在发送数据包的同时发送控制包；(3)根据源节点发送的数据包或控制包，中继节点接收数据并读取包头；(4)根据中继节点接收的数据更新路由表，并判断其是否继续发往本节点，若判断数据是发往本节点，则计算Q值，更新V值至包头，并继续传输数据包；(5)判断汇聚节点sink是否收到数据包：(5.1)若sink收到数据包，则结束本次传输；(5.2)若sink没有收到数据包，则重复步骤(3)到步骤(5)，直至sink收到数据包。2.根据权利要求1所述的一种水声传感器网络合作探索强化学习路由方法，其特征在于，所述步骤(1)包括以下步骤：(1.1)确定奖励函数；(1.2)根据奖励函数，确定各节点的Q值迭代函数；步骤(1.1)所述奖励函数Rnm为第一节点n向第二节点m传输数据包/控制包完成后所获得的即时奖励，奖励函数按下式结算：Rnm＝-g-α1c+α2d其中，g为节点在传输数据时的固定损耗，c为节点剩余能量消耗函数，d...

【专利技术属性】
技术研发人员：冯晓宁，宋雪，王卓，
申请(专利权)人：哈尔滨工程大学，
类型：发明
国别省市：黑龙江,23

全部详细技术资料下载我是这个专利的主人