【技术实现步骤摘要】
本申请涉及无线通信,例如涉及一种基于强化学习的多链路分配方法及装置、sta、ap、介质。
技术介绍
1、目前,mlo(multi-link operation)为802.11be(wi-fi 7)标准下的关键技术。mlo技术可使sta(站点,station)连接至不同的频段(2.4hz/5hz/6ghz)和信道上,并同时进行数据的发送和接收。mlo存在以下技术优势:第一,通过链路聚合大幅度提升数据传输速率。第二,通过多链路并发降低数据传输时延。第三,通过在不同的链路上传输相同的数据或者根据链路的质量无缝切换链路,提升数据传输的可靠性。由于mlo技术具有高传输速率、时延低以及可靠性高的多项优势,因此,mlo技术能够提升vr(virtual reality,虚拟现实)和ar(augmented reality,增强显示)等对网络带宽和时延具有较高要求的应用体验,有助于wi-fi向工业领域的应用拓展。
2、mlo允许在单一频段上建立多链路。例如,一sta(non-access-point station)在2.4ghz的单一频段上
...【技术保护点】
1.一种基于强化学习的多链路分配方法,其特征在于,应用于站点STA,包括:
2.根据权利要求1所述的链路分配方法,其特征在于,根据更新的Q表,选择下一时刻的目标链路,包括:
3.根据权利要求1所述的链路分配方法,其特征在于,选择一目标链路,包括:
4.根据权利要求1所述的链路分配方法,其特征在于,根据无线接入点AP通过目标链路发送的响应数据,更新目标链路在下一时刻的Q值,包括:
5.根据权利要求4所述的链路分配方法,其特征在于,根据接收的响应数据,确定目标链路在当前时刻的即时奖励,包括:
6.根据权利要求4或
...【技术特征摘要】
1.一种基于强化学习的多链路分配方法,其特征在于,应用于站点sta,包括:
2.根据权利要求1所述的链路分配方法,其特征在于,根据更新的q表,选择下一时刻的目标链路,包括:
3.根据权利要求1所述的链路分配方法,其特征在于,选择一目标链路,包括:
4.根据权利要求1所述的链路分配方法,其特征在于,根据无线接入点ap通过目标链路发送的响应数据,更新目标链路在下一时刻的q值,包括:
5.根据权利要求4所述的链路分配方法,其特征在于,根据接收的响应数据,确定目标链路在当前时刻的即时奖励,包括:
6.根据权利要求4或5所述的链路分配方法,其特征在于,在其他sta不具备强化学习能力的情况下,根据目标链路在当前时刻的即时奖励rt,更新链路ak在当前时刻的q值,包括:
7.根据权利要求4或5所述的链路分配方法,其特征在于,在其他sta中至少一个sta具备强化学习能力的情况下,stak根据目标链路ak在当前时刻的即时奖励rt,更新目标链路ak在当前时刻的q(s,a)值,包括:
8.根据权利要求1至5任一项所述的链路分配方法,其特征在于,还包括:
9.一种基于强化学习的多链路分配...
【专利技术属性】
技术研发人员:王和俊,王滨后,徐芳,孙可欣,李江洲,
申请(专利权)人:青岛海尔智能技术研发有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。