当前位置: 首页 > 专利查询>清华大学专利>正文

基于流量迁移的模型训练方法技术

技术编号:39821411 阅读:10 留言:0更新日期:2023-12-22 19:41
本申请公开了一种基于流量迁移的模型训练方法

【技术实现步骤摘要】
基于流量迁移的模型训练方法、装置、设备及介质


[0001]本申请属于网络功能虚拟化
,尤其涉及一种基于流量迁移的模型训练方法

装置

设备及介质


技术介绍

[0002]通常,网络中的用户流量是动态变化的,为保证网络性能,在实际应用中,需对网络中的用户流量进行流量迁移

[0003]在相关技术中,通常采用固定阈值法来确定执行流量迁移操作的执行时机

然而,固定阈值法需人工设置一个合理的阈值范围,如果该阈值范围设置的过于紧凑,则在用户流量发生轻微变化时,即触发流量迁移,而频繁的执行流量迁移操作无疑会产生大量的迁移成本;如果该阈值范围设置的过于宽松,则在用户流量发生变化时,无法及时检测到,从而导致无法及时的进行流量迁移,从而降低了网络性能


技术实现思路

[0004]本申请实施例提供一种基于流量迁移的模型训练方法

装置

设备及介质,能够在保证网络性能的同时减少流量迁移的迁移成本

[0005]第一方面,本申请实施例提供一种基于流量迁移的模型训练方法,该方法包括:获取由多条用户流量组成的用户流量集合;遍历用户流量集合中的每条用户流量,基于当前网络中的虚拟网络功能
VNF
实例的第一负载状态对多个流量迁移策略进行随机抽样处理,得到每条用户流量所对应的目标流量迁移策略,其中,第一负载状态为执行目标流量迁移策略前,
VNF
例的负载状态;计算执行目标流量迁移策略所对应的奖励值,并确定
VNF
实例所对应的第二负载状态,其中,第二负载状态为在执行目标流量迁移策略后,
VNF
实例的负载状态;奖励值用于表征执行目标流量迁移策略所对应的
VNF
实例状态惩罚成本和流量迁移成本;基于第一负载状态

第二负载状态

目标流量迁移策略以及奖励值,对初始流量迁移模型的模型参数进行更新,得到目标流量迁移模型

[0006]第二方面,本申请实施例提供了一种基于流量迁移的模型训练装置,该装置包括:流量获取模块,用于获取由多条用户流量组成的用户流量集合;策略确定模块,用于遍历用户流量集合中的每条用户流量,基于当前网络中的虚拟网络功能
VNF
实例的第一负载状态对多个流量迁移策略进行随机抽样处理,得到每条用户流量所对应的目标流量迁移策略,其中,第一负载状态为执行目标流量迁移策略前,
VNF
实例的负载状态;状态确定模块,用于计算执行目标流量迁移策略所对应的奖励值,并确定
VNF
实例所对应的第二负载状态,其中,第二负载状态为在执行目标流量迁移策略后,
VNF
实例的负载状态;奖励值用于表征执行目标流量迁移策略所对应的
VNF
实例状态惩罚成本和流量迁移成本;参数更新模块,用于基于第一负载状态

第二负载状态

目标流量迁移策略以及奖励值,对初始流量迁移模型的模型参数进行更新,得到目标流量迁移模型

[0007]第三方面,本申请实施例提供了一种电子设备,该电子设备包括:处理器以及存储
有计算机程序指令的存储器;处理器执行计算机程序指令时实现如第一方面所述的基于流量迁移的模型训练方法

[0008]第四方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面所述的基于流量迁移的模型训练方法

[0009]第五方面,本申请实施例提供了一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行如第一方面所述的基于流量迁移的模型训练方法

[0010]由上述内容可知,本申请构建了目标流量迁移模型,该目标流量迁移模型仅根据当前网络中
VNF
实例的负载状态以及用户流量即可确定当前时刻的流量迁移策略,而无需设定阈值,从而避免了由于阈值设置的不合理所导致的降低网络性能以及增加迁移成本的问题

[0011]此外,在本申请中,目标流量迁移模型是基于迁移前后的负载状态

迁移策略以及表征迁移成本的奖励值所确定的,而迁移后的负载状态表征了执行该迁移策略所对应的迁移效果,由此可见,本申请在训练目标流量迁移模型的过程中,综合考虑了流量迁移的迁移成本和迁移效果

因此,在使用训练得到的目标流量迁移模型进行流量迁移时,目标流量迁移模型可根据不同流量迁移策略所对应的奖励值来确定当前时刻所要执行的目标流量迁移策略,从而可以有效避免相关技术中,网络性能提升所产生的收益低于流量迁移操作所产生的开销的不合理现象的产生,实现了在保证迁移效果的同时,减少流量迁移成本的目的

附图说明
[0012]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0013]图1是本申请一个实施例提供的基于流量迁移的模型训练方法的流程示意图;
[0014]图2是本申请一个实施例提供的目标流量迁移模型的训练框架示意图;
[0015]图
3(a)
是本申请一个实施例提供的
Abilene
拓扑中最大
VNF
实例负载比率优化结果示意图;
[0016]图
3(b)
是本申请一个实施例提供的
Geant
拓扑中最大
VNF
实例负载比率优化结果示意图;
[0017]图
3(c)
是本申请一个实施例提供的
Abilene
拓扑中最小
VNF
实例负载比率优化结果示意图;
[0018]图
3(d)
是本申请一个实施例提供的
Geant
拓扑中最小
VNF
实例负载比率优化结果示意图;
[0019]图
4(a)
是本申请一个实施例提供的
Abilene
拓扑中
VNF
实例负载方差的累积概率分布结果示意图;
[0020]图
4(b)
是本申请一个实施例提供的
Geant
拓扑中
VNF
实例负载方差的累积概率分布结果示意图;
[0021]图
5(a)
是本申请一个实施例提供的
Abilene
拓扑中累计流量迁移成本示意图;
[0022]图
5(b)
是本申请一个实施例提供的
Geant
拓扑中累计流量迁本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于流量迁移的模型训练方法,其特征在于,包括:获取由多条用户流量组成的用户流量集合;遍历所述用户流量集合中的每条用户流量,基于当前网络中的虚拟网络功能
VNF
实例的第一负载状态对多个流量迁移策略进行随机抽样处理,得到所述每条用户流量所对应的目标流量迁移策略,其中,所述第一负载状态为执行所述目标流量迁移策略前,所述
VNF
实例的负载状态;计算执行所述目标流量迁移策略所对应的奖励值,并确定所述
VNF
实例所对应的第二负载状态,其中,所述第二负载状态为在执行所述目标流量迁移策略后,所述
VNF
实例的负载状态;所述奖励值用于表征执行所述目标流量迁移策略所对应的
VNF
实例状态惩罚成本和流量迁移成本;基于所述第一负载状态

所述第二负载状态

所述目标流量迁移策略以及所述奖励值,对初始流量迁移模型的模型参数进行更新,得到目标流量迁移模型
。2.
根据权利要求1所述的方法,其特征在于,计算执行所述目标流量迁移策略所对应的奖励值,包括:获取
VNF
实例负载最大值
、VNF
实例负载最小值以及所述当前网络所包含的
VNF
实例的负载方差值,其中,所述
VNF
实例负载最大值为所述当前网络中所有的
VNF
实例所对应的负载上限值的最大值,所述
VNF
实例负载最小值为所述当前网络中所有的
VNF
实例所对应的负载下限值的最小值;基于所述
VNF
实例负载最大值以及当前
VNF
实例所对应的负载上限值,确定所述当前
VNF
实例所对应的实例过载惩罚成本,其中,所述当前
VNF
实例为所述当前网络所包含的
VNF
实例中的任意一个实例;基于所述
VNF
实例负载最小值以及所述当前
VNF
实例所对应的负载下限值,确定所述当前
VNF
实例所对应的实例轻载惩罚成本;基于所述负载方差值确定所述当前
VNF
实例所对应的实例方差惩罚成本;基于预设的流量迁移算法计算执行所述目标流量迁移策略所对应的流量迁移成本;基于所述实例过载惩罚成本

所述实例轻载惩罚成本

所述实例方差惩罚成本以及所述流量迁移成本确定所述奖励值
。3.
根据权利要求2所述的方法,其特征在于,基于所述实例过载惩罚成本

所述实例轻载惩罚成本

所述实例方差惩罚成本以及所述流量迁移成本确定所述奖励值,包括:根据如下公式确定所述奖励值:
r(t)

P
O
(t)+P
U
(t)+P
V
(t)+
ω1C
M
(a(o,t))
其中,
r(t)

t
时刻的奖励值;
P
O
(t)

t
时刻的实例过载惩罚成本;
P
U
(t)

t
时刻的实例轻载惩罚成本;
P
V
(t)

t
时刻的实例方差惩罚成本;
a(o,t)

t
时刻所采用的标识为
o
的目标流量迁移策略;
C
M
(a(o,t))
为所述目标流量迁移策略所对应的流量迁移成本;
ω1为权重系数,用于均衡所述目标流量迁移模型的流量迁移成本与负载优化结果,所述负载优化结果为对所述当前网络中的
VNF
实例的负载状态进行优化所得到的结果
。4.
根据权利要求3所述的方法,其特征在于,所述方法还包括:获取所述
VNF
实例状态惩罚成本的最大值

所述每条用户流量迁移的平均时间成本

所述当前网络所包含的
VNF
实例的最大迁移流量数量以及所述
VNF
实例状态惩罚成本的最小
值;基于所述
VNF
实例状态惩罚成本的最大值

所述每条用户流量迁移的平均时间成本以及所述最大迁移流量数量,构建所述权重系数的第一约束条件;基于所述
VNF
实例状态惩罚成本的最大值

所述每条用户流量迁移的平均时间成本以及所述
VNF
实例状态惩罚成本的最小值,构建所述权重系数的第二约束条件;基于所述第一约束条件及所述第二约束条件确定所述权重系数所对应的权重范围
。5.
根据权利要求4所述的方法,其特征在于,所述方法还包括:所述第一约束条件为:
ω1×
n1×
t1<p1其中,

【专利技术属性】
技术研发人员:王之梁陈蔚瀚张晗尹霞施新刚
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1