System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及无线通信,例如涉及一种基于多ap组网的资源分配方法及网络设备。
技术介绍
1、近年来,连接互联网的wifi设备数目日益增长,为解决用户密集的wifi网络严重的同频干扰问题,对其干扰管理进行了综合研究。无线网络的干扰管理研究主要依靠干扰抑制,干扰消除或者干扰对齐一般难以实现。通过干扰抑制,即无线访问接入点(wirelessaccess point,ap)的信道分配或者传输功率控制,可以实现吞吐量优化。
2、目前在wifi 6中,提出了频谱资源块(resource unit,ru)的概念,为资源调度提供了更多可能。通过ap将信道划分为多个ru,使得sta(终端,station)可以在自己对应的ru上接收数据,从而实现资源分配。
3、在实现本公开实施例的过程中,发现相关技术中至少存在如下问题:
4、在高密度组网的情况下,若同时有多个ap进行下行传输,且ap间覆盖范围有所重叠时,相邻的ap就会产生强干扰。此时干扰抑制策略所需的信道瞬时状态信息难以估计,因而降低了干扰抑制的效果,影响系统吞吐量。
技术实现思路
1、为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
2、本公开实施例提供了一种基于多ap组网的资源分配方法及网络设备,以降低多ap组网情况下的干扰问题。
3、在一些实施例中,所述基于多ap组
4、接收一个或多个子接入点sap发送的用于表示信道信息;
5、将sap发送的信道消息输入基于强化学习的资源分配决策模型,获得资源ru分配方案;
6、向对应的sap发送ru分配方案,以进行下行数据传输。
7、可选地,ru分配方案的获得,包括:
8、构建基于强化学习的资源分配决策模型;
9、将sap发送的信道消息输入到基于强化学习的资源分配决策模型中训练,利用训练后得到的最优策略获得系统吞吐量;
10、在系统吞吐量满足需求阈值的情况下,根据所述最优策略确定ru分配方案。
11、可选地,最优策略的训练,包括:
12、将sap发送的信道信息作为强化学习的状态集s=s(u,q);
13、其中,u={u1,u2,…,uj,…,um},表示系统中所有sap的信道信息中的传输速率需求的集合;uj表示第j个sap的信道信息中的传输速率需求;
14、q={q1,q2,…,qj,…,qm},表示系统中所有sap的信道信息中信干噪比的集合;qj表示第j个sap的信道信息中的信干噪比;
15、将所述状态集s输入基于强化学习的资源分配决策模型中训练,得到动作集a={f1,f2,…,ft,…,fn};a表示map采取的对应于所有ru分配策略的所有动作集合;ft表示t时刻map所采取的动作;
16、根据所述状态集和动作集,确定奖励参数rt=ctotal,t(s,a);
17、根据所述奖励参数rt训练所述基于强化学习的资源分配决策模型,以得到使奖励参数rt最大的系统动作,作为所述最优策略。
18、可选地,所述基于强化学习的资源分配决策模型的建立,包括:
19、
20、其中,,ct表示在时刻t时系统吞吐量的大小,m表示sap的数量,n表示sta的数量;υij表示与sap相关的影响参数;b表示信道带宽,表示第i个sap与第j个sta之间传输的信干噪比。
21、可选地,所述信干噪比通过如下方式确定:
22、
23、其中,pi表示第i个sap的发射功率;gij表示表示从第j个sta到第i个sap之间的路径损耗;表示第i个sap的相邻ap的累计干扰功率);σ2表示噪声功率。
24、可选地,所述影响参数υij的确定包括:
25、获得第j个sta的传输速率需求uj与第i个sap的关联关系;
26、在uj与第i个sap关联的情况下,υij=1;
27、在uj不与第i个sap关联的情况下,υij=0。
28、可选地,所述根据所述奖励参数rt训练所述基于强化学习的资源分配决策模型,包括:
29、将如下方式,作为强化学习的更新规则:
30、
31、其中,qt表示当前状态的q值,qt+1表示下一状态时刻的q值;α表示的强化学习的学习率,取值为(0,1);β表示对历史奖励的重视程度,取值为(0,1);表示即时奖励;maxqt(s′,a′)表示下一时刻所有可能动作策略的最大q值。
32、在一些实施例中,提供另一种基于多ap组网的资源分配方法,应用于子接入点sap,包括:向主接入点map发送信道信息;接收map发送的资源分配决策结果;所述资源分配决策结果是map通过基于强化学习的资源分配策略模型获取的;向接入的终端sta发送用于指示ru分配方案的指令。
33、可选地,该基于多ap组网的资源分配方法还包括:接收sta发送的用于确认状态的反馈信息;执行向sta进行下行数据传输。
34、在一些实施例中,提供一种网络设备,包括处理器和通信接口,通信接口用于与其它网络设备进行通信;处理器用于运行一组程序,以使得所述网络设备实现上述基于多ap组网的资源分配方法。
35、本公开实施例提供的基于多ap组网的资源分配方法及网络设备,可以实现以下技术效果:
36、通过基于强化学习的资源分配策略模型,使得主ap能够根据子ap发送的信道信息,确定资源分配的策略,并通过重新分配的方式,获取系统吞吐量最大状态下的资源分配方案。能够抵抗高密度组网下多ap之间的干扰,提升系统吞吐量,降低通信延时,提高用户的通信体验。
37、以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。
本文档来自技高网...【技术保护点】
1.一种基于多AP组网的资源分配方法,应用于主接入点MAP,其特征在于,包括:
2.根据权利要求1所述的资源分配方法,其特征在于,RU分配方案的获得,包括:
3.根据权利要求2所述的资源分配方法,其特征在于,最优策略的训练,包括:
4.根据权利要求2所述的资源分配方法,其特征在于,所述基于强化学习的资源分配决策模型的建立,包括:
5.根据权利要求4所述的资源分配方法,其特征在于,所述信干噪比通过如下方式确定:
6.根据权利要求4所述的资源分配方法,其特征在于,所述影响参数υij的确定包括:
7.根据权利要求3所述的资源分配方法,其特征在于,所述根据所述奖励参数Rt训练所述基于强化学习的资源分配决策模型,包括:
8.一种基于多AP组网的资源分配方法,应用于子接入点SAP,其特征在于,包括:
9.根据权利要求8所述的资源分配方法,其特征在于,还包括:
10.一种网络设备,其特征在于,包括处理器和通信接口,通信接口用于与其它网络设备进行通信;处理器用于运行一组程序,以使得所述网络
...【技术特征摘要】
1.一种基于多ap组网的资源分配方法,应用于主接入点map,其特征在于,包括:
2.根据权利要求1所述的资源分配方法,其特征在于,ru分配方案的获得,包括:
3.根据权利要求2所述的资源分配方法,其特征在于,最优策略的训练,包括:
4.根据权利要求2所述的资源分配方法,其特征在于,所述基于强化学习的资源分配决策模型的建立,包括:
5.根据权利要求4所述的资源分配方法,其特征在于,所述信干噪比通过如下方式确定:
6.根据权利要求4所述的资源分配方法,其特征在于,所述影...
【专利技术属性】
技术研发人员:王和俊,王滨后,徐芳,孙可欣,谢刚,
申请(专利权)人:青岛海尔智能技术研发有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。