当前位置: 首页 > 专利查询>上海大学专利>正文

一种基于深度强化学习的网络切片资源优化方法及装置制造方法及图纸

技术编号:34770530 阅读:110 留言:0更新日期:2022-08-31 19:31
本发明专利技术公开了一种基于深度强化学习的网络切片资源优化方法及装置,其中,所述方法包括:设置软硬混合策略的网络切片框架;基于所述网络切片框架在网络切片窗口内保障网络切片SLA的基础上,最大化频谱效率,获得网络切片优化问题;基于所述网络切片优化问题在给定初始资源分配的情况下,利用DQN网络进行在线网络切片资源优化调整处理,获得网络切片资源优化结果。在本发明专利技术实施例中,可以基于统一的优化框架对任性QoS要求的网络切片进行资源分配;能够在保障不同切片SLA的基础上,提升频谱效率。效率。效率。

【技术实现步骤摘要】
一种基于深度强化学习的网络切片资源优化方法及装置


[0001]本专利技术涉及通信
,尤其涉及一种基于深度强化学习的网络切片资源优化方法及装置。

技术介绍

[0002]近年来随着5G技术落地与研发,工业物联网、蜂窝车联网、增强/虚拟现实等垂直行业应用蓬勃发展。迥异的应用带来了差异化的性能需求,如车联网对时延、可靠性要求极高,增强/虚拟现实要求高速率、低时延。迥异的垂直应用场景促使5G网络在同一张物理网络上提供差异化的服务,并对5G网络的可扩展性、可用性、成本提出了更高的要求。网络切片技术在3GPP中广泛研究并被认为是促使5G在同一张物理网络上提供灵活、可定制异构服务的颠覆性技术。
[0003]网络切片在通用的物理网络基础设施之上,通过无线资源的虚拟化、隔离和共享,使多个网络切片能够完成不同的传输任务。目前,标准组织,如3GPP,也在广泛讨论如何设计无线接入网络(Radio Access Network,RAN)以支持网络切片,并开展RAN侧基于切片资源编排与管理的服务水平协议(Service Level Agreement,SLA)本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度强化学习的网络切片资源优化方法,其特征在于,所述方法包括:设置软硬混合策略的网络切片框架;基于所述网络切片框架在网络切片窗口内保障网络切片SLA的基础上,最大化频谱效率,获得网络切片优化问题;基于所述网络切片优化问题在给定初始资源分配的情况下,利用DQN网络进行在线网络切片资源优化调整处理,获得网络切片资源优化结果。2.根据权利要求1所述的网络切片资源优化方法,其特征在于,所述设置软硬混合策略的网络切片框架,包括:将总带宽的网络切片资源划分为软策略和硬策略两部分;对于硬策略,在网络切片窗口中对每个网络切片分配专用带宽资源;对于软策略,在每个网络切片中根据预设的调度优先级以及流量需求占用公共网络切片资源;其中,总带宽的网络切片资源为专用带宽资源和公共网络切片资源总和,公式如下:其中,w
m,k
表示在网络切片窗口k中的每个网络切片m分配的专用带宽资源;表示网络切片集合,w
c,k
表示网络切片窗口k中的每个网络切片c分配的公共网络切片资源。3.根据权利要求1所述的网络切片资源优化方法,其特征在于,所述设置软硬混合策略的网络切片框架还包括:对于网络切片隔离度,为基于资源占用的隔离度;对于网络切片m,定义所述网络切片m在一个网络切片窗口k中的隔离度如下:其中,o
m,k
表示所述网络切片m在一个网络切片窗口k中的隔离度;w
m,k
表示在网络切片窗口k中的每个网络切片m分配的专用带宽资源;w
c,m,k
表示网络切片m从公共网络切片资源w
c,k
中占有的资源量;w
c,k
表示网络切片窗口k中分配给公共网络切片c的资源。4.根据权利要求1所述的网络切片资源优化方法,其特征在于,所述基于所述网络切片框架在网络切片窗口内保障网络切片SLA的基础上,最大化频谱效率的表达式为:s.t.Q
m,k
=f(d
m,k
,w
m,k
,w
c,m,k
);););其中,Q
m,k
表示在网络切片窗口k中的每个网络切片m的SLA满足率;S
k
表示在网络切片窗口k中的频谱效率;d
m,k
表示网络切片m在网络切片窗口k的流量需求;f(.)表示SLA满足率
Q
m,k
与流量需求与网络切片资源分配、网络切片内部调度算法之间复杂的数学关系;α
m
表示网络切片m的效用因子;β表示对应频谱效率的效用因子;表示指示函数,用于表示网络切片SLA满足率是否达到要求;表示网络切片m所要求的隔离度;w
m,k
表示在网络切片窗口k中的每个网络切片m分配的专用带宽资源;表示网络切片集合,w
c,k
表示网络切片窗口k中分配给公共网络切片c的资源;W表示总带宽的网络切片资源;o
m,k
表示所述网络切片m在一个网络切片窗口k中的隔离度;w
c,m,k
表示网络切片m从公共网络切片资源w
c,k
中占有的资源量;r
n,t
表示用户n在t时刻数据包的速率。5.根据权利要求4所述的网络切片资源优化方法,其特征在于,所述用户n在t时刻数据包的速率的公式表示形式如下:包的速率的公式表示形式如下:其中,W
n,t
表示用户n在第t个TTI时刻的所被分配带宽;∈表示传输错误概率;Q
‑1(.)表示高斯Q函数的逆函数;l
n,t
表示以符合为单位的码字块的长度;γ
n,t
表示关联到基站b的用户n在t时刻的接收信号的信干噪比;C
n,t
表示用户n在t时刻的信道弥...

【专利技术属性】
技术研发人员:张恒徐树公潘广进
申请(专利权)人:上海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1