【技术实现步骤摘要】
【技术保护点】
基于改进Q学习算法的物联网错误传感器节点定位方法,其特征在于,其步骤包括:(a)、将物联网传感器节点抽象成具有一定属性的自治Agent,包括汇聚节点和源节点;使强化学习与Agent概念相结合;(b)、源节点与汇聚节点通过有线或者无线的方式与具有较好计算能力的后台服务器相连,汇聚节点以一定的周期向邻居节点广播学习评估消息,启动路径评估过程;学习评估消息中包含Agent的回报值、Q评估值及能量信息;初始化Q学习算法的参数包括学习速率、折扣因子、Q值;(c)、将目标任务进行划分为多个子任务,即能耗最少,路径最优,跳数最少;不同的子任务得到环境不同的奖赏值,通过加权求和定义奖赏函数R′,即环境的回报值;(d)、各个Agent通过感知模块获得当前状态s的能量信息,并根据动作选择策略选择当前状态s下的最优动作;动作选择策略采用Boltzmann动作选择策略,通过策略执行动作到达新的状态s',同时从环境得到环境的回报值R′;Agent需要反复尝试每个状态动作对以获得每个状态动作对的最优Q值;(e)、根据改进Q学习算法中的Q值计算公式进行Q值的计算与更新;(f)、汇集节点不断向邻居节点广播学习评估消息 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:范新南,卞辉,史鹏飞,张继,
申请(专利权)人:河海大学常州校区,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。