软件定义网络SDN控制器部署方法、装置、设备及存储介质制造方法及图纸

技术编号:33759530 阅读:18 留言:0更新日期:2022-06-12 14:08
本申请实施例提供了一种软件定义网络SDN控制器部署方法、装置、设备及存储介质。该方法包括:将SDN网络区域划分为多个SDN子网络区域;针对每个SDN子网络区域,分别执行以下步骤:确定SDN子网络区域中的总节点数量n以及用于部署控制器的控制器节点数量q;根据总节点数量n和控制器节点数量q构建Q学习矩阵;对Q学习矩阵进行强化学习,直至Q学习矩阵收敛,得到目标Q学习矩阵;将目标Q学习矩阵中最大奖励值的部署策略,确定为SDN子网络区域的控制器部署策略。根据本申请实施例技术方案,能够大大减少计算时间,保证网络的可靠性,还可以解决通信时延的问题。通信时延的问题。通信时延的问题。

【技术实现步骤摘要】
软件定义网络SDN控制器部署方法、装置、设备及存储介质


[0001]本申请属于SDN控制器部署
,尤其涉及一种软件定义网络SDN控制器部署方法、装置、设备及存储介质。

技术介绍

[0002]随着当今社会互联网的快速发展,数据中心网络变得越来越复杂,对数据中心网络的管理也变得愈加困难。传统的数据中心网络架构已经很难适应庞大的网络规模和复杂多变的业务需求。为了解决上述问题,SDN(Software Defined Network,软件定义网络)应运而生。
[0003]SDN可以通过控制器对网络资源进行灵活集中管理,但由于单个控制器的处理能力和容量有限,需要在SDN数据中心网络中部署多个控制器。目前已经有很多关于SDN控制器部署的研究,例如,以建设成本为目标的基于数学模型求解的部署算法,以优化平均时延和最坏时延为目标的部署方案,以优化可靠性为目标的基于聚类和基于贪婪算法的控制器部署方法。
[0004]上述方案中,以建设成本为目标的基于数学模型求解的部署算法,用于大规模的数据中心网络时计算时间太长;以优化平均时延和最坏时延为目标的部署方案没有考虑到网络的可靠性;以优化可靠性为目标的基于聚类和基于贪婪算法的控制器部署方法很难消除通信时延带来的影响。

技术实现思路

[0005]本申请实施例提供一种软件定义网络SDN控制器部署方法、装置、设备及存储介质,能够大大减少计算时间,保证网络的可靠性,还可以解决通信时延的问题。
[0006]第一方面,本申请实施例提供了一种软件定义网络SDN控制器部署方法,方法包括:
[0007]将SDN网络区域划分为多个SDN子网络区域;
[0008]针对每个SDN子网络区域,分别执行以下步骤:
[0009]确定SDN子网络区域中的总节点数量n以及用于部署控制器的控制器节点数量q;n,q均为正整数,且q<n;
[0010]根据总节点数量n和控制器节点数量q构建Q学习矩阵,Q学习矩阵为n行q列矩阵,Q学习矩阵中的元素为每个控制器的部署策略对应的奖励值;奖励值与每个控制器的部署策略对应的链路代价反相关,链路代价为从交换机节点到控制器节点之间的链路代价;交换机节点为总节点中去除控制器节点后剩余的节点;
[0011]对Q学习矩阵进行强化学习,直至Q学习矩阵收敛,得到目标Q学习矩阵;
[0012]将目标Q学习矩阵中最大奖励值的部署策略,确定为SDN子网络区域的控制器部署策略。
[0013]在一种可选的实施方式中,对Q学习矩阵进行强化学习,直至Q学习矩阵收敛,得到
目标Q学习矩阵,具体包括:
[0014]获取SDN子网络区域的网络视图,网络视图包括SDN子网络区域的n个节点及节点间的拓扑结构;
[0015]迭代执行以下第一操作,直至一次控制器部署学习过程中的q个控制器节点均被确定出;
[0016]在每次控制器部署学习过程中的q个控制器节点均被确定出之后,恢复网络视图中的n个节点,返回执行:迭代执行以下第一操作,直至一次控制器部署学习过程中的q个控制器节点均被确定出;直到以n个节点中的每个节点为起始控制器节点的所有控制器部署策略均被部署完毕,起始控制器节点为每次控制器部署学习过程中第一个被选取的控制器节点;
[0017]根据每次控制器部署学习对应的Q学习矩阵,选取奖励值之和最大的部署策略构建目标Q学习矩阵;
[0018]其中,第一操作包括:
[0019]从网络视图中选取第一节点作为第一控制器节点,并从剩余节点中确定第一控制器节点对应的m个第一交换机节点;剩余节点为全部节点中去除第一控制器节点后的节点;
[0020]根据SDN子网络区域中的链路带宽、链路负载、链路时延,确定m个第一交换机节点中的每个第一交换机节点到第一控制器节点的链路代价;m为正整数;
[0021]根据m个链路代价,确定第一控制器节点的奖励值;
[0022]根据奖励值,更新Q学习矩阵;
[0023]从全部节点中删除第一控制器节点和第一交换机节点,以得到更新后的网络视图。
[0024]在一种可选的实施方式中,根据SDN子网络区域中的链路带宽、链路负载、链路时延,确定m个第一交换机节点中的每个第一交换机节点到第一控制器节点的链路代价,具体包括:
[0025]根据以下公式确定m个第一交换机节点中的每个第一交换机节点到第一控制器节点的链路代价:
[0026]price
i
=αB
i
+βL
i
+γD
i
[0027]其中,price
i
为m个第一交换机节点中的第i台交换机节点到第一控制器节点的链路代价,B
i
为子网络区域中第i台交换机节点到第一控制器节点的链路带宽,L
i
为子网络区域中第i台交换机节点到第一控制器节点的链路负载,D
i
为子网络区域中第i台交换机节点到第一控制器节点的链路时延,α为链路带宽对链路代价影响的权重,β为链路负载对链路代价影响的权重,γ为链路时延对链路代价影响的权重。
[0028]在一种可选的实施方式中,根据m个链路代价,确定第一控制器节点的奖励值,包括:
[0029]计算m个链路代价之和,并确定链路代价之和的倒数为第一控制器节点的奖励值。
[0030]在一种可选的实施方式中,第一控制器节点的奖励值根据以下公式确定:
[0031][0032]其中,r为第一控制器节点的奖励值。
[0033]在一种可选的实施方式中,m根据以下公式确定:
[0034][0035]在一种可选的实施方式中,奖励值之和最大的部署策略为每次确定出的q个控制器节点对应的q个奖励值之和最大的部署策略。
[0036]第二方面,本申请实施例提供了一种软件定义网络SDN控制器部署装置,装置包括:
[0037]划分模块,用于将SDN网络区域划分为多个SDN子网络区域;
[0038]第一确定模块,用于针对每个SDN子网络区域,确定SDN子网络区域中的总节点数量n以及用于部署控制器的控制器节点数量q;n,q均为正整数,且q<n;
[0039]构建模块,用于针对每个SDN子网络区域,根据总节点数量n和控制器节点数量q构建Q学习矩阵,Q学习矩阵为n行q列矩阵,Q学习矩阵中的元素为每个控制器的部署策略对应的奖励值;奖励值与每个控制器的部署策略对应的链路代价反相关,链路代价为从交换机节点到控制器节点之间的链路代价;交换机节点为总节点中去除控制器节点后剩余的节点;
[0040]学习模块,用于针对每个SDN子网络区域,对Q学习矩阵进行强化学习,直至Q学习矩阵收敛,得到目标Q学习矩阵;
[0041]第二确定模块,用于针对每个SDN子网络区域,将目标Q学习矩阵中最大奖励值的部署策略,确定为SDN子网络区域的控制器部署策略。
[0042]第三方面,本申请实施例提供了一种软件定义网络S本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种软件定义网络SDN控制器部署方法,其特征在于,包括:将SDN网络区域划分为多个SDN子网络区域;针对每个SDN子网络区域,分别执行以下步骤:确定所述SDN子网络区域中的总节点数量n以及用于部署控制器的控制器节点数量q;n,q均为正整数,且q<n;根据总节点数量n和控制器节点数量q构建Q学习矩阵,所述Q学习矩阵为n行q列矩阵,所述Q学习矩阵中的元素为每个控制器的部署策略对应的奖励值;所述奖励值与每个控制器的部署策略对应的链路代价反相关,所述链路代价为从交换机节点到所述控制器节点之间的链路代价;所述交换机节点为总节点中去除控制器节点后剩余的节点;对所述Q学习矩阵进行强化学习,直至所述Q学习矩阵收敛,得到目标Q学习矩阵;将所述目标Q学习矩阵中最大奖励值的部署策略,确定为所述SDN子网络区域的控制器部署策略。2.根据权利要求1所述的方法,其特征在于,所述对所述Q学习矩阵进行强化学习,直至所述Q学习矩阵收敛,得到目标Q学习矩阵,具体包括:获取所述SDN子网络区域的网络视图,所述网络视图包括所述SDN子网络区域的n个节点及所述节点间的拓扑结构;迭代执行以下第一操作,直至一次控制器部署学习过程中的q个控制器节点均被确定出;在每次控制器部署学习过程中的q个控制器节点均被确定出之后,恢复所述网络视图中的n个节点,返回执行:所述迭代执行以下第一操作,直至一次控制器部署学习过程中的q个控制器节点均被确定出;直到以所述n个节点中的每个节点为起始控制器节点的所有控制器部署策略均被部署完毕,所述起始控制器节点为每次控制器部署学习过程中第一个被选取的控制器节点;根据每次控制器部署学习对应的Q学习矩阵,选取奖励值之和最大的部署策略构建所述目标Q学习矩阵;其中,所述第一操作包括:从所述网络视图中选取第一节点作为第一控制器节点,并从剩余节点中确定所述第一控制器节点对应的m个第一交换机节点;所述剩余节点为所述全部节点中去除所述第一控制器节点后的节点;根据SDN子网络区域中的链路带宽、链路负载、链路时延,确定所述m个第一交换机节点中的每个第一交换机节点到所述第一控制器节点的链路代价;m为正整数;根据m个所述链路代价,确定所述第一控制器节点的奖励值;根据所述奖励值,更新所述Q学习矩阵;从所述全部节点中删除所述第一控制器节点和所述第一交换机节点,以得到更新后的网络视图。3.根据权利要求2所述的方法,其特征在于,所述根据SDN子网络区域中的链路带宽、链路负载、链路时延,确定所述m个第一交换机节点中的每个第一交换机节点到所述第一控制器节点的链路代价,具体包括:根据以下公式确定所述m个第一交换机节点中的每个第一交换机节点到所述第一控制
器节点的链路代价:price
i
=αB
i
+βL
i
+γD
i
...

【专利技术属性】
技术研发人员:严伟白波
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1