一种基于Actor-Critic的传感器网络数据上传方法技术

技术编号：38397382 阅读：9 留言：0更新日期：2023-08-07 11:11

本发明专利技术公开了一种基于Actor

全部详细技术资料下载

【技术实现步骤摘要】
一种基于Actor
‑
Critic的传感器网络数据上传方法

[0001]本专利技术涉及无线通信
，使用了强化学习的方法来解决传感器数据上传研究问题。

技术介绍

[0002]未来物联网(Internet of Things,IoT)的趋势是实现无处不在的传感和连接系统，从而提供以数据为驱动的决策分析和无需人工干预的自动化，在这样的系统中，数据包延迟不能被视为主要的性能指标，而是目的地端接收到传感器数据的新鲜度，过时的传感器数据对目的地并无太大的意义，甚至可能导致目的地端做出错误的决策。AoI是一个衡量信息新鲜度的指标，定义为自从上一次在目的地收到的更新数据包以后过去的时间，该指标与经典的指标比如吞吐量和延迟有着很大区别，其可以更全面地反映目的地在每一时刻信息的新鲜度。
[0003]目前AoI的研究是一个热门的方向。在现有文献中，接入点和智能设备之间的通信是双向的，接入点有恒定的电源而智能设备没有，接入点同时向智能设备通过块衰落信道传输信息和能量，智能设备同时收到接入点传过来的能量和信息，并将能量储存在能量缓冲器中，给予AoI和传输速率不同的加权系数，并在AoI和传输速率之间进行权衡，然后通过高效算法提出最优功率分配比和最优加权系数，但是文献没有考虑到AoI可能会超过某一阈值的可能。另有文献，提出了AoI的违规概率(Violation Probability)，定义为AoI超过某一个给定值的概率，减少违规概率对于保证物联网系统数据的新鲜度具有重要意义，系统由一个传感器节点，一个监视者以及满...

【技术保护点】

【技术特征摘要】
1.一种基于Actor
‑
Critic的传感器网络数据上传方法，所述传感器网络包括K个传感器节点和一个调度节点，传感器节点监测任务，调度节点每次选取一个传感器节点进行传输并将获得的数据包传输给中央控制器，其特征在于，包括如下步骤：建立传感器节点无线传输问题所对应的传感器节点传输数学模型；所述传感器节点传输数学模型的优化目标是使得以下几项之和最小：调度节点侧的AoI，超过AoI阈值后给予的惩罚值，传感器节点传输的能量消耗和传输节点更换的成本；根据传感器节点传输数学模型搭建对应的仿真环境，以及初始化仿真环境中相关的各项参数，包括传感器节点k的AoI，传感器节点k最多能储存的能量，传感器节点k传输第i个任务所消耗的能量e
k
(i)，传感器节点k传输的数据包大小L
k
，传感器节点k传送数据包的速率λ(i)；k＝1,
…
,K；将调度节点的传感器节点调度问题转化为一个马尔可夫决策过程(S,A,R)，其中S表示状态空间，A表示动作空间，R表示奖励函数；采用强化学习Actor
‑
Critic算法训练智能体，用于决策满足各项约束并且使得AoI和能量消耗最少的数据上传方案。2.如权利要求1所述的基于Actor
‑
Critic的传感器网络数据上传方法，其特征在于，在调度节点侧，第k个传感器节点在调度节点侧的AoI表示为：被选中进行传输的传感器节点k在传输第i+1个任务前的电量为：则优化目标为：其中，r
k
(i)代表节点k成功传输数据包所做出的尝试次数；在监测第i个任务时，用I
k
(i)＝1表示传感器节点k被选择去传输，而I
k
(i)＝0表示传感器节点k没有被选择去传输；L
k
代表节点k传输的数据包大小；为传感器节点k在传输第i个任务前的电量；B为传感器节点的电池电量；e
k
(i)为传感器节点k传输第i个任务需要消耗的能量；u≠k；c为每次更换传感器节点所需要的成本；β
k
为传感器节点k的AoI上限；δ
k
为传感器节点k的AoI超过上限时，给予的惩罚。3.如权利要求1所述的基于Ac...

【专利技术属性】
技术研发人员：刘楠，许宪哲，潘志文，尤肖虎，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人