基于Q-学习的SDN链路抗毁方法、存储介质及系统技术方案

技术编号：29928110 阅读：28 留言：0更新日期：2021-09-04 18:51

本发明专利技术提出一种基于Q

全部详细技术资料下载

【技术实现步骤摘要】
基于Q
‑
学习的SDN链路抗毁方法、存储介质及系统

[0001]本专利技术涉及网络抗毁性能优化的
，更具体地，涉及一种基于Q
‑
学习的SDN链路抗毁方法、存储介质及系统。

技术介绍

[0002]网络的抗毁性能优化是许多通信网络需要研究的关键问题，某些链路发生故障时，如果控制器不及时进行故障处理，会导致网络节点出现严重拥塞，造成数据丢失。软件定义网络(SDN，Software Defined Network)是一种数据控制分离、软件可编程的新型网络体系架构，在SDN架构下，控制层和数据层实现了解耦，控制层的控制器对整个网络进行管理，在链路抗毁方面，逻辑集中的控制器可在链路出现问题时，更容易判断其对整网的影响，并且可以从全局网络角度进行恢复。
[0003]目前，SDN网络抗毁技术研究主要集中在路径保护机制方面，例如2018年9月21日公开的中国专利技术专利(公布号：CN108566298A)中公开了一种链路故障处理方法、交换机和链路故障处理系统，在该专利中，首先获取流表信息，包括...

【技术保护点】

【技术特征摘要】
1.一种基于Q
‑
学习的SDN链路抗毁方法，其特征在于，至少包括：S1.获取网络拓扑，统计链路状态信息，根据链路状态信息，获得每一段链路的中断概率；S2.通过中断概率获得每一段链路的奖励值，根据奖励值得到奖励矩阵R，设置折扣因子γ，初始化Q
‑
学习的Q矩阵为全零矩阵；S3.从网络中随机选择一个交换机作为目的交换机S
d
，初始化随机选择一个交换机作为源交换机S；S4.在源交换机S所有能到达的交换机中随机选择一个交换机作为次态交换机S
’
，发送数据包，计算该过程中的Q值,更新Q矩阵；S5.判断次态交换机S＇是否为目的交换机，若是，一次交换机变化训练完成，执行步骤S6；否则，将次态S＇更新为当前的交换机，返回步骤S4；S6.判断Q矩阵是否收敛，若是，通过Q矩阵的值确定最不易中断的链路路径，根据链路路径生成流表，下发至交换机的端口进行数据转发；否则，返回步骤S4。2.根据权利要求1所述的基于Q
‑
学习的SDN链路抗毁方法，其特征在于，步骤S1所述根据链路状态信息，获得每一段链路的中断概率的过程为：统计一定时间段T内网络中每一段链路的中断时间t
i
，i表示链路序号，得到每一段链路的中断概率p
i
，表达式为：p
i
＝t
i
/T。3.根据权利要求2所述的基于Q
‑
学习的SDN链路抗毁方法，其特征在于，通过中断概率获得每一段链路的奖励值为：rw
t
＝λlog(1
‑
p
i
)+c其中，rw
t
表示t时刻下数据包从交换机S发送到下一个交换机S
′
时所获取的奖励值；λ表示奖励系数，c表示附加常数；p
i
表示每一段链路的中断概率。4.根据权利要求3所述的基于Q
‑
学习的SDN链路抗毁方法，其特征在于，步骤S4中Q值的计算公式为：其中，S
′
表示下一状态的交换机，γ表示折扣因子，Q表示在数据包到达交换机S时，能够获得的最大期望收益；R(S,S
′
)表示立即获得的收益，γmaxQ*
k
(S')是未来折扣收益；通过Q值更新确定Q矩阵的所有元素。5.根据权利要求4所述的基于Q
‑
学习的SDN链路抗毁方法，其特征在于，γ代表Q
...

【专利技术属性】
技术研发人员：王炜发，杨青桦，张大眀，李勇，
申请(专利权)人：中国电子科技集团公司第七研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人