System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于多AP组网的资源分配方法及网络设备组成比例_技高网

基于多AP组网的资源分配方法及网络设备组成比例

技术编号:40791350 阅读:3 留言:0更新日期:2024-03-28 19:21
本申请涉及无线通信技术领域,公开一种基于多AP组网的资源分配方法,应用于主接入点MAP。该资源分配方法包括:接收一个或多个子接入点SAP发送的信道信息;将SAP发送的信道消息输入基于强化学习的资源分配决策模型,获得资源RU分配方案;向对应的SAP发送RU分配方案,以进行下行数据传输。该方法能够抵抗高密度组网下多AP之间的干扰,提升系统吞吐量,降低通信延时,提高用户的通信体验。本申请还公开一种网络设备。

【技术实现步骤摘要】

本申请涉及无线通信,例如涉及一种基于多ap组网的资源分配方法及网络设备。


技术介绍

1、近年来,连接互联网的wifi设备数目日益增长,为解决用户密集的wifi网络严重的同频干扰问题,对其干扰管理进行了综合研究。无线网络的干扰管理研究主要依靠干扰抑制,干扰消除或者干扰对齐一般难以实现。通过干扰抑制,即无线访问接入点(wirelessaccess point,ap)的信道分配或者传输功率控制,可以实现吞吐量优化。

2、目前在wifi 6中,提出了频谱资源块(resource unit,ru)的概念,为资源调度提供了更多可能。通过ap将信道划分为多个ru,使得sta(终端,station)可以在自己对应的ru上接收数据,从而实现资源分配。

3、在实现本公开实施例的过程中,发现相关技术中至少存在如下问题:

4、在高密度组网的情况下,若同时有多个ap进行下行传输,且ap间覆盖范围有所重叠时,相邻的ap就会产生强干扰。此时干扰抑制策略所需的信道瞬时状态信息难以估计,因而降低了干扰抑制的效果,影响系统吞吐量。


技术实现思路

1、为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。

2、本公开实施例提供了一种基于多ap组网的资源分配方法及网络设备,以降低多ap组网情况下的干扰问题。

3、在一些实施例中,所述基于多ap组网的资源分配方法,应用于主接入点map,包括:

4、接收一个或多个子接入点sap发送的用于表示信道信息;

5、将sap发送的信道消息输入基于强化学习的资源分配决策模型,获得资源ru分配方案;

6、向对应的sap发送ru分配方案,以进行下行数据传输。

7、可选地,ru分配方案的获得,包括:

8、构建基于强化学习的资源分配决策模型;

9、将sap发送的信道消息输入到基于强化学习的资源分配决策模型中训练,利用训练后得到的最优策略获得系统吞吐量;

10、在系统吞吐量满足需求阈值的情况下,根据所述最优策略确定ru分配方案。

11、可选地,最优策略的训练,包括:

12、将sap发送的信道信息作为强化学习的状态集s=s(u,q);

13、其中,u={u1,u2,…,uj,…,um},表示系统中所有sap的信道信息中的传输速率需求的集合;uj表示第j个sap的信道信息中的传输速率需求;

14、q={q1,q2,…,qj,…,qm},表示系统中所有sap的信道信息中信干噪比的集合;qj表示第j个sap的信道信息中的信干噪比;

15、将所述状态集s输入基于强化学习的资源分配决策模型中训练,得到动作集a={f1,f2,…,ft,…,fn};a表示map采取的对应于所有ru分配策略的所有动作集合;ft表示t时刻map所采取的动作;

16、根据所述状态集和动作集,确定奖励参数rt=ctotal,t(s,a);

17、根据所述奖励参数rt训练所述基于强化学习的资源分配决策模型,以得到使奖励参数rt最大的系统动作,作为所述最优策略。

18、可选地,所述基于强化学习的资源分配决策模型的建立,包括:

19、

20、其中,,ct表示在时刻t时系统吞吐量的大小,m表示sap的数量,n表示sta的数量;υij表示与sap相关的影响参数;b表示信道带宽,表示第i个sap与第j个sta之间传输的信干噪比。

21、可选地,所述信干噪比通过如下方式确定:

22、

23、其中,pi表示第i个sap的发射功率;gij表示表示从第j个sta到第i个sap之间的路径损耗;表示第i个sap的相邻ap的累计干扰功率);σ2表示噪声功率。

24、可选地,所述影响参数υij的确定包括:

25、获得第j个sta的传输速率需求uj与第i个sap的关联关系;

26、在uj与第i个sap关联的情况下,υij=1;

27、在uj不与第i个sap关联的情况下,υij=0。

28、可选地,所述根据所述奖励参数rt训练所述基于强化学习的资源分配决策模型,包括:

29、将如下方式,作为强化学习的更新规则:

30、

31、其中,qt表示当前状态的q值,qt+1表示下一状态时刻的q值;α表示的强化学习的学习率,取值为(0,1);β表示对历史奖励的重视程度,取值为(0,1);表示即时奖励;maxqt(s′,a′)表示下一时刻所有可能动作策略的最大q值。

32、在一些实施例中,提供另一种基于多ap组网的资源分配方法,应用于子接入点sap,包括:向主接入点map发送信道信息;接收map发送的资源分配决策结果;所述资源分配决策结果是map通过基于强化学习的资源分配策略模型获取的;向接入的终端sta发送用于指示ru分配方案的指令。

33、可选地,该基于多ap组网的资源分配方法还包括:接收sta发送的用于确认状态的反馈信息;执行向sta进行下行数据传输。

34、在一些实施例中,提供一种网络设备,包括处理器和通信接口,通信接口用于与其它网络设备进行通信;处理器用于运行一组程序,以使得所述网络设备实现上述基于多ap组网的资源分配方法。

35、本公开实施例提供的基于多ap组网的资源分配方法及网络设备,可以实现以下技术效果:

36、通过基于强化学习的资源分配策略模型,使得主ap能够根据子ap发送的信道信息,确定资源分配的策略,并通过重新分配的方式,获取系统吞吐量最大状态下的资源分配方案。能够抵抗高密度组网下多ap之间的干扰,提升系统吞吐量,降低通信延时,提高用户的通信体验。

37、以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。

本文档来自技高网...

【技术保护点】

1.一种基于多AP组网的资源分配方法,应用于主接入点MAP,其特征在于,包括:

2.根据权利要求1所述的资源分配方法,其特征在于,RU分配方案的获得,包括:

3.根据权利要求2所述的资源分配方法,其特征在于,最优策略的训练,包括:

4.根据权利要求2所述的资源分配方法,其特征在于,所述基于强化学习的资源分配决策模型的建立,包括:

5.根据权利要求4所述的资源分配方法,其特征在于,所述信干噪比通过如下方式确定:

6.根据权利要求4所述的资源分配方法,其特征在于,所述影响参数υij的确定包括:

7.根据权利要求3所述的资源分配方法,其特征在于,所述根据所述奖励参数Rt训练所述基于强化学习的资源分配决策模型,包括:

8.一种基于多AP组网的资源分配方法,应用于子接入点SAP,其特征在于,包括:

9.根据权利要求8所述的资源分配方法,其特征在于,还包括:

10.一种网络设备,其特征在于,包括处理器和通信接口,通信接口用于与其它网络设备进行通信;处理器用于运行一组程序,以使得所述网络设备实现如权利要求1~9任一项所述基于多AP组网的资源分配方法。

...

【技术特征摘要】

1.一种基于多ap组网的资源分配方法,应用于主接入点map,其特征在于,包括:

2.根据权利要求1所述的资源分配方法,其特征在于,ru分配方案的获得,包括:

3.根据权利要求2所述的资源分配方法,其特征在于,最优策略的训练,包括:

4.根据权利要求2所述的资源分配方法,其特征在于,所述基于强化学习的资源分配决策模型的建立,包括:

5.根据权利要求4所述的资源分配方法,其特征在于,所述信干噪比通过如下方式确定:

6.根据权利要求4所述的资源分配方法,其特征在于,所述影...

【专利技术属性】
技术研发人员:王和俊王滨后徐芳孙可欣谢刚
申请(专利权)人:青岛海尔智能技术研发有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1