基于多AP组网的资源分配方法及网络设备组成比例

技术编号：40791350 阅读：3 留言：0更新日期：2024-03-28 19:21

本申请涉及无线通信技术领域，公开一种基于多AP组网的资源分配方法，应用于主接入点MAP。该资源分配方法包括：接收一个或多个子接入点SAP发送的信道信息；将SAP发送的信道消息输入基于强化学习的资源分配决策模型，获得资源RU分配方案；向对应的SAP发送RU分配方案，以进行下行数据传输。该方法能够抵抗高密度组网下多AP之间的干扰，提升系统吞吐量，降低通信延时，提高用户的通信体验。本申请还公开一种网络设备。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及无线通信，例如涉及一种基于多ap组网的资源分配方法及网络设备。

技术介绍

1、近年来，连接互联网的wifi设备数目日益增长，为解决用户密集的wifi网络严重的同频干扰问题，对其干扰管理进行了综合研究。无线网络的干扰管理研究主要依靠干扰抑制，干扰消除或者干扰对齐一般难以实现。通过干扰抑制，即无线访问接入点(wirelessaccess point，ap)的信道分配或者传输功率控制，可以实现吞吐量优化。

2、目前在wifi 6中，提出了频谱资源块(resource unit，ru)的概念，为资源调度提供了更多可能。通过ap将信道划分为多个ru，使得sta(终端，station)可以在自己对应的ru上接收数据，从而实现资源分配。

3、在实现本公开实施例的过程中，发现相关技术中至少存在如下问题：

4、在高密度组网的情况下，若同时有多个ap进行下行传输，且ap间覆盖范围有所重叠时，相邻的ap就会产生强干扰。此时干扰抑制策略所需的信道瞬时状态信息难以估计，因而降低了干扰抑制的效果，影响系统吞吐量。

技术实现思路

1、为了对披露的实施例的一些方面有基本的理解，下面给出了简单的概括。所述概括不是泛泛评述，也不是要确定关键/重要组成元素或描绘这些实施例的保护范围，而是作为后面的详细说明的序言。

2、本公开实施例提供了一种基于多ap组网的资源分配方法及网络设备，以降低多ap组网情况下的干扰问题。

3、在一些实施例中，所述基于多ap组

4、接收一个或多个子接入点sap发送的用于表示信道信息；

5、将sap发送的信道消息输入基于强化学习的资源分配决策模型，获得资源ru分配方案；

6、向对应的sap发送ru分配方案，以进行下行数据传输。

7、可选地，ru分配方案的获得，包括：

8、构建基于强化学习的资源分配决策模型；

9、将sap发送的信道消息输入到基于强化学习的资源分配决策模型中训练，利用训练后得到的最优策略获得系统吞吐量；

10、在系统吞吐量满足需求阈值的情况下，根据所述最优策略确定ru分配方案。

11、可选地，最优策略的训练，包括：

12、将sap发送的信道信息作为强化学习的状态集s＝s(u,q)；

13、其中，u＝{u1,u2,…,uj,…,um}，表示系统中所有sap的信道信息中的传输速率需求的集合；uj表示第j个sap的信道信息中的传输速率需求；

14、q＝{q1,q2,…,qj,…,qm}，表示系统中所有sap的信道信息中信干噪比的集合；qj表示第j个sap的信道信息中的信干噪比；

15、将所述状态集s输入基于强化学习的资源分配决策模型中训练，得到动作集a＝{f1,f2,…,ft,…,fn}；a表示map采取的对应于所有ru分配策略的所有动作集合；ft表示t时刻map所采取的动作；

16、根据所述状态集和动作集，确定奖励参数rt＝ctotal,t(s,a)；

17、根据所述奖励参数rt训练所述基于强化学习的资源分配决策模型，以得到使奖励参数rt最大的系统动作，作为所述最优策略。

18、可选地，所述基于强化学习的资源分配决策模型的建立，包括：

19、

20、其中，，ct表示在时刻t时系统吞吐量的大小，m表示sap的数量，n表示sta的数量；υij表示与sap相关的影响参数；b表示信道带宽，表示第i个sap与第j个sta之间传输的信干噪比。

21、可选地，所述信干噪比通过如下方式确定：

22、

23、其中，pi表示第i个sap的发射功率；gij表示表示从第j个sta到第i个sap之间的路径损耗；表示第i个sap的相邻ap的累计干扰功率)；σ2表示噪声功率。

24、可选地，所述影响参数υij的确定包括：

25、获得第j个sta的传输速率需求uj与第i个sap的关联关系；

26、在uj与第i个sap关联的情况下，υij＝1；

27、在uj不与第i个sap关联的情况下，υij＝0。

28、可选地，所述根据所述奖励参数rt训练所述基于强化学习的资源分配决策模型，包括：

29、将如下方式，作为强化学习的更新规则：

30、

31、其中，qt表示当前状态的q值，qt+1表示下一状态时刻的q值；α表示的强化学习的学习率，取值为(0,1)；β表示对历史奖励的重视程度，取值为(0,1)；表示即时奖励；maxqt(s′,a′)表示下一时刻所有可能动作策略的最大q值。

32、在一些实施例中，提供另一种基于多ap组网的资源分配方法，应用于子接入点sap，包括：向主接入点map发送信道信息；接收map发送的资源分配决策结果；所述资源分配决策结果是map通过基于强化学习的资源分配策略模型获取的；向接入的终端sta发送用于指示ru分配方案的指令。

33、可选地，该基于多ap组网的资源分配方法还包括：接收sta发送的用于确认状态的反馈信息；执行向sta进行下行数据传输。

34、在一些实施例中，提供一种网络设备，包括处理器和通信接口，通信接口用于与其它网络设备进行通信；处理器用于运行一组程序，以使得所述网络设备实现上述基于多ap组网的资源分配方法。

35、本公开实施例提供的基于多ap组网的资源分配方法及网络设备，可以实现以下技术效果：

36、通过基于强化学习的资源分配策略模型，使得主ap能够根据子ap发送的信道信息，确定资源分配的策略，并通过重新分配的方式，获取系统吞吐量最大状态下的资源分配方案。能够抵抗高密度组网下多ap之间的干扰，提升系统吞吐量，降低通信延时，提高用户的通信体验。

37、以上的总体描述和下文中的描述仅是示例性和解释性的，不用于限制本申请。

本文档来自技高网...

【技术保护点】

1.一种基于多AP组网的资源分配方法，应用于主接入点MAP，其特征在于，包括：

2.根据权利要求1所述的资源分配方法，其特征在于，RU分配方案的获得，包括：

3.根据权利要求2所述的资源分配方法，其特征在于，最优策略的训练，包括：

4.根据权利要求2所述的资源分配方法，其特征在于，所述基于强化学习的资源分配决策模型的建立，包括：

5.根据权利要求4所述的资源分配方法，其特征在于，所述信干噪比通过如下方式确定：

6.根据权利要求4所述的资源分配方法，其特征在于，所述影响参数υij的确定包括：

7.根据权利要求3所述的资源分配方法，其特征在于，所述根据所述奖励参数Rt训练所述基于强化学习的资源分配决策模型，包括：

8.一种基于多AP组网的资源分配方法，应用于子接入点SAP，其特征在于，包括：

9.根据权利要求8所述的资源分配方法，其特征在于，还包括：

10.一种网络设备，其特征在于，包括处理器和通信接口，通信接口用于与其它网络设备进行通信；处理器用于运行一组程序，以使得所述网络

...

【技术特征摘要】

1.一种基于多ap组网的资源分配方法，应用于主接入点map，其特征在于，包括：

2.根据权利要求1所述的资源分配方法，其特征在于，ru分配方案的获得，包括：

3.根据权利要求2所述的资源分配方法，其特征在于，最优策略的训练，包括：

4.根据权利要求2所述的资源分配方法，其特征在于，所述基于强化学习的资源分配决策模型的建立，包括：

5.根据权利要求4所述的资源分配方法，其特征在于，所述信干噪比通过如下方式确定：

6.根据权利要求4所述的资源分配方法，其特征在于，所述影...

【专利技术属性】
技术研发人员：王和俊，王滨后，徐芳，孙可欣，谢刚，
申请(专利权)人：青岛海尔智能技术研发有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人