一种基于贝叶斯学习的端到端网络资源分配方法组成比例

技术编号:32022844 阅读:18 留言:0更新日期:2022-01-22 18:45
本发明专利技术公开一种基于贝叶斯学习的端到端网络资源分配方法,属于计算、推算或计数的技术领域。该方法采用基于博弈框架的解决方案,提出一个反映服务商需求信息的网络资源定价策略,通过对网络资源状态和服务商行为的分析,实现更加合理的网络资源定价和分配。该方法先建立多个服务商与运营商的博弈模型,运营商根据有限的需求信息选择第一阶段的单位网络切片价格;在第二阶段中更新需求信息确定价格。仿真结果表明该系统模型纳什均衡点的存在性,并提出一种响应式网络资源切片分配的方案,避免服务商集中请求资源时导致的资源短缺和网络拥塞,从而实现网络资源的合理分配。从而实现网络资源的合理分配。从而实现网络资源的合理分配。

【技术实现步骤摘要】
一种基于贝叶斯学习的端到端网络资源分配方法


[0001]本专利技术涉及通信技术,具体公开一种基于贝叶斯学习的端到端网络资源分配方法,属于计算、推算或计数的


技术介绍

[0002]近年来,现有网络难以支持5G网络中的应用场景,为不同应用程序场景部署多个不同的通信网络是不现实的,且所产生的巨大成本是运营商无法承受的。因此,下一代移动网络联盟提出了网络切片的概念,即在一个物理基础设施上,利用软件定义网络并采用网络功能虚拟化等技术,按需构建不同的网络切片。各种资源分配方案旨在实现切片间的资源隔离,以便实现动态网络环境中一个切片的故障不会影响到其它切片的通信。当前大部分资源调度都延续传统网络资源调度算法的思路进行研究,比如基于负载均衡通过网络映射实现虚拟网络资源分配,忽略了服务商的实际需求。
[0003]Alessandro Lieto等发表的文章《动态资源市场中的网络切片协商策略》(Strategies for Network Slicing Negotiation in a Dynamic Resource Market),基于博弈论对网络资源切片分配的市场机制,提出了一种在纳什均衡下研究用户策略的技术

经济博弈,在这种机制中动态调节不同租户间的协商,证明了这类博弈中至少存在一个纳什均衡,在多个场景中总是在实现最佳响应动态算法时达到纳什均衡。
[0004]本专利技术旨在通过采用博弈经济模型分析运营商的网络资源分配问题,将此转换为多个服务商与运营商间的非合作博弈问题以实现资源最优分配的目的。

技术实现思路

[0005]本专利技术的专利技术目的是针对上述
技术介绍
的不足,提供一种基于贝叶斯学习的端到端网络资源分配方法,采用基于博弈框架的解决方案,提出一个反映服务商需求信息的网络资源定价策略,通过分析服务商需求,实现合理定价网络资源和优化资源分配方案的专利技术目的,解决现有资源调度方案忽略服务商实际需求的技术问题。
[0006]本专利技术为实现上述专利技术目的采用如下技术方案:
[0007]在本专利技术中,考虑一个运营商有限时间内提供Q个单位的网络资源切片,并把提供服务的时间分为两个阶段:常规阶段(第一阶段T1)和激励阶段(第二阶段T2)。其中,多个服务商在系统中向运营商请求网络资源,服务商的数量是到达率为Λ的泊松过程,Λ服从参数为α和β的先验伽马分布。对于服务商来说,他们需要选择某个阶段来请求网络资源,服务商的决定主要取决于对网络资源的估值v,v服从[0,1]的均匀分布,如果服务商选择在T2阶段请求资源,则他的估值v会随周期变化而降低δ倍,例如,降低0.8倍。在决策过程中服务商采取阈值策略θ:在v≥θ时,服务商在T1阶段请求资源;在v<θ时,服务商在T2阶段请求资源。对于运营商来说,在T1阶段根据网络资源切片的初始数量Q和先验伽马分布对网络资源采取初始定价p1;在T2阶段,运营商根据更新后的网络资源状态和预测的服务商规模将p1更改为p2。本专利技术证明了该系统模型纳什均衡点的存在,并通过分析博弈模型优化运营商网络
资源的分配方案。本专利技术仿真结果表明了该系统模型纳什均衡点的存在性。
[0008]本专利技术解决其技术问题所采取地一种基于贝叶斯学习的端到端网络资源分配方法,包括以下是个步骤:
[0009]步骤一:设服务商j在常规阶段T1获取到一单位网络资源的可能性为:
[0010][0011]式(1)中,λ1是服务商在常规阶段T1到达系统的泊松速率,λ1=Λ(1

θ),表示常规阶段T1每单位网络资源平均分配给y+1个服务商的概率的期望值。
[0012]步骤二:设服务商j在常规阶段T1的预期效用为
[0013][0014]式(2)中,v
j
是服务商j对一单位网络资源的估价,p1是常规阶段T1一单位网络资源的价格。
[0015]步骤三:设服务商j在激励阶段T2获取到一单位网络资源的可能性为:
[0016][0017]式(3)中,λ2是在服务商在激励阶段T2到达系统的泊松速率,p2是激励阶段T2更新后的一单位网络资源的价格。
[0018]步骤四:设服务商j在激励阶段T2的预期效用为
[0019][0020]式(4)中,[0.8v
j

p2(θ,x)]+
表示[0.8v
j

p2(θ,x)]≥0时才有意义,p2(θ,x)为激励阶段T2一单位网络资源价格关于θ、x的函数。
[0021]步骤五:根据隐函数定理和布劳威尔不动点定理可知,所有服务商采取相同的阈值θ时,服务商之间的子博弈存在均衡。
[0022]步骤六:设运营商在常规阶段T1的效益函数为:
[0023][0024]式(5)中,π1为运营商在常规阶段T1的效益值,α和β是系统中常规阶段T1服务商到达率Λ的先验伽马分布的参数,伽马分布的概率密度函数为达率Λ的先验伽马分布的参数,伽马分布的概率密度函数为其中,
[0025]步骤七:设运营商在激励阶段T2的效益函数为:
[0026][0027]式(6)中,π2为运营商在激励阶段T2的效益值,x是在常规阶段T1中被请求的网络资源数量,运营商根据x的值对服务商到达率Λ的分布参数进行更新,系统中激励阶段T2服务商到达率Λ的后验伽马分布的参数分别为:和其概率密度函数为其中,其中,
[0028]步骤八:由步骤六和步骤七可知,运营商的总体最优效益为π
R
(Q):
[0029][0030]步骤九:求出常规阶段T1的最优定价将π2对p2求一阶导数并令其等于0,求出激励阶段T2的最优定价再将和代入式(7),即可求得运营商的最优效益。
[0031]步骤十:由步骤九可知在运营商获得最优效益时的θ
*
值,θ
*
=arg max
θ
π
R
(Q),将其代入λ1和λ2,可以求出服务商在两个阶段的潜在需求量:
[0032][0033][0034]式(8)是一个负二项分布其中,N1表示服务商在常规阶段T1的网络资源请求量,其期望值为P(N1=k)表示服务商在常规阶段T1的网络资源请求量为k的概率;式(9)也是一个负二项分布其中,N2表示服务商在激励阶段T2的网络资源请求量,其期望值为P(N2=k)表示服务商在激励阶段T2的网络资源请求量为k的概率。由此可以得出服务商各阶段需求量的期望值,即潜在需求量,可以有效避免服务商集中请求资源时导致的资源短缺和网络拥塞,从而实现网络资源的合理分配。
[0035]本专利技术采用上述技术方案,具有以下有益效果:本专利技术基于对服务商请求网络资源决策的分析,将网络资源分配问题映射为运营商效益最大化的问题,通过采用博弈论经济模型分析服务商和运营商的效益最大化问题,在分析服务商和运营商效益最大化问题的过程中,运营商根据服务商常规阶段到达系统的泊松速度的先验概率密度函数以及观测到的先验伽马分布参数确定服务商激励本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于贝叶斯学习的端到端网络资源分配方法,其特征在于,根据服务商在常规阶段的预期效用值和服务商在激励阶段的预期效用值相等的约束下确定运营商在常规阶段的最优定价,取服务商在激励阶段的预期效用极大值处的定价为运营商在激励阶段的最优定价,求解运营商响应最优定价且获得最优效益时服务商所采取的最优阈值策略,根据服务商所采取的最优阈值策略更新服务商在常规阶段到达系统的泊松速率以及服务商在激励阶段到达系统的泊松速率,根据更新后的服务商在常规阶段到达系统的泊松速率计算服务商在常规阶段的网络资源请求量,根据更新后的服务商在激励阶段到达系统的泊松速率计算服务商在激励阶段的网络资源请求量。2.根据权利要求1所述一种基于贝叶斯学习的端到端网络资源分配方法,其特征在于,所述服务商在常规阶段的预期效用值根据表达式所述服务商在常规阶段的预期效用值根据表达式计算,其中,为服务商j在常规阶段T1的预期效用值,v
j
为服务商j对一单位网络资源的估价,p1为常规阶段T1一单位网络资源的价格,为服务商j在常规阶段T1获取到一单位网络资源的可能性,λ1为服务商在常规阶段T1到达系统的泊松速率,λ1=Λ(1

θ),Λ服从参数为α和β的先验伽马分布,为常规阶段T1每单位网络资源平均分配给y+1个服务商的概率的期望值,Q为初始网络资源数量。3.根据权利要求2所述一种基于贝叶斯学习的端到端网络资源分配方法,其特征在于,所述服务商在激励阶段的预期效用值根据表达式所述服务商在激励阶段的预期效用值根据表达式计算,其中,为服务商j在激励阶段T2的预期效用值,[0.8v
j

p2(θ,x)]
+
表示[0.8v
j

p2(θ,x...

【专利技术属性】
技术研发人员:李大鹏柳晓寒朱天林蒋锐王小明徐友云
申请(专利权)人:南京南邮通信网络产业研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1