基于强化学习的多链路分配方法及装置、STA、AP、介质制造方法及图纸

技术编号：42956949 阅读：23 留言：0更新日期：2024-10-11 16:14

本申请涉及无线通信技术领域，公开一种基于强化学习的多链路分配方法，应用于STA，该方法包括：选择一目标链路，并，在当前时刻通过目标链路发送请求数据；根据无线接入点AP通过目标链路发送的响应数据，更新目标链路在下一时刻的Q值，响应数据用以表示目标链路在当前时刻被其他STA选择的情况；根据更新的Q表，选择下一时刻的目标链路，Q表存储有多个链路对应的最新时刻的Q值。该方法能够降低其他STA与本STA选择同一链路的概率，从而降低数据传输的干扰，实现多链路资源的合理分配，提高系统吞吐量。本申请还公开一种基于强化学习的多链路分配装置及STA、AP、介质。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及无线通信，例如涉及一种基于强化学习的多链路分配方法及装置、sta、ap、介质。

技术介绍

1、目前，mlo(multi-link operation)为802.11be(wi-fi 7)标准下的关键技术。mlo技术可使sta(站点，station)连接至不同的频段(2.4hz/5hz/6ghz)和信道上，并同时进行数据的发送和接收。mlo存在以下技术优势：第一，通过链路聚合大幅度提升数据传输速率。第二，通过多链路并发降低数据传输时延。第三，通过在不同的链路上传输相同的数据或者根据链路的质量无缝切换链路，提升数据传输的可靠性。由于mlo技术具有高传输速率、时延低以及可靠性高的多项优势，因此，mlo技术能够提升vr(virtual reality，虚拟现实)和ar(augmented reality，增强显示)等对网络带宽和时延具有较高要求的应用体验，有助于wi-fi向工业领域的应用拓展。

2、mlo允许在单一频段上建立多链路。例如，一sta(non-access-point station)在2.4ghz的单一频段上，向ap(acces本文档来自技高网...

【技术保护点】

1.一种基于强化学习的多链路分配方法，其特征在于，应用于站点STA，包括：

2.根据权利要求1所述的链路分配方法，其特征在于，根据更新的Q表，选择下一时刻的目标链路，包括：

3.根据权利要求1所述的链路分配方法，其特征在于，选择一目标链路，包括：

4.根据权利要求1所述的链路分配方法，其特征在于，根据无线接入点AP通过目标链路发送的响应数据，更新目标链路在下一时刻的Q值，包括：

5.根据权利要求4所述的链路分配方法，其特征在于，根据接收的响应数据，确定目标链路在当前时刻的即时奖励，包括：

6.根据权利要求4或5所述的链路分配方法...

【技术特征摘要】

1.一种基于强化学习的多链路分配方法，其特征在于，应用于站点sta，包括：

2.根据权利要求1所述的链路分配方法，其特征在于，根据更新的q表，选择下一时刻的目标链路，包括：

3.根据权利要求1所述的链路分配方法，其特征在于，选择一目标链路，包括：

4.根据权利要求1所述的链路分配方法，其特征在于，根据无线接入点ap通过目标链路发送的响应数据，更新目标链路在下一时刻的q值，包括：

5.根据权利要求4所述的链路分配方法，其特征在于，根据接收的响应数据，确定目标链路在当前时刻的即时奖励，包括：

6.根据权利要求4或5所述的链路分配方法，其特征在于，在其他sta不具备强化学习能力的情况下，根据目标链路在当前时刻的即时奖励rt，更新链路ak在当前时刻的q值，包括：

7.根据权利要求4或5所述的链路分配方法，其特征在于，在其他sta中至少一个sta具备强化学习能力的情况下，stak根据目标链路ak在当前时刻的即时奖励rt，更新目标链路ak在当前时刻的q(s，a)值，包括：

8.根据权利要求1至5任一项所述的链路分配方法，其特征在于，还包括：

9.一种基于强化学习的多链路分配...

【专利技术属性】
技术研发人员：王和俊，王滨后，徐芳，孙可欣，李江洲，
申请(专利权)人：青岛海尔智能技术研发有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人