【技术实现步骤摘要】
基于Q
‑
学习的SDN链路抗毁方法、存储介质及系统
[0001]本专利技术涉及网络抗毁性能优化的
,更具体地,涉及一种基于Q
‑
学习的SDN链路抗毁方法、存储介质及系统。
技术介绍
[0002]网络的抗毁性能优化是许多通信网络需要研究的关键问题,某些链路发生故障时,如果控制器不及时进行故障处理,会导致网络节点出现严重拥塞,造成数据丢失。软件定义网络(SDN,Software Defined Network)是一种数据控制分离、软件可编程的新型网络体系架构,在SDN架构下,控制层和数据层实现了解耦,控制层的控制器对整个网络进行管理,在链路抗毁方面,逻辑集中的控制器可在链路出现问题时,更容易判断其对整网的影响,并且可以从全局网络角度进行恢复。
[0003]目前,SDN网络抗毁技术研究主要集中在路径保护机制方面,例如2018年9月21日公开的中国专利技术专利(公布号:CN108566298A)中公开了一种链路故障处理方法、交换机和链路故障处理系统,在该专利中,首先获取流表信息,包括正常工作所使用的第一链路,以及在发生故障时作为所述第一链路的备份链路的第二链路,然后在检测到第一链路发生故障时,上报故障信息,并从流表信息获取所述第二链路,然后基于第二链路传输数据,直至接收到重新分配的流表信息,即该方法采用了多路径备份的方案,当检测到链路故障时,将受影响的流故障转移至备份路径,这样主机的连接性可以在很短的时间内恢复,但是这种在交换机上为所有流表添加备份路径的做法会消耗大量的流表资 ...
【技术保护点】
【技术特征摘要】
1.一种基于Q
‑
学习的SDN链路抗毁方法,其特征在于,至少包括:S1.获取网络拓扑,统计链路状态信息,根据链路状态信息,获得每一段链路的中断概率;S2.通过中断概率获得每一段链路的奖励值,根据奖励值得到奖励矩阵R,设置折扣因子γ,初始化Q
‑
学习的Q矩阵为全零矩阵;S3.从网络中随机选择一个交换机作为目的交换机S
d
,初始化随机选择一个交换机作为源交换机S;S4.在源交换机S所有能到达的交换机中随机选择一个交换机作为次态交换机S
’
,发送数据包,计算该过程中的Q值,更新Q矩阵;S5.判断次态交换机S'是否为目的交换机,若是,一次交换机变化训练完成,执行步骤S6;否则,将次态S'更新为当前的交换机,返回步骤S4;S6.判断Q矩阵是否收敛,若是,通过Q矩阵的值确定最不易中断的链路路径,根据链路路径生成流表,下发至交换机的端口进行数据转发;否则,返回步骤S4。2.根据权利要求1所述的基于Q
‑
学习的SDN链路抗毁方法,其特征在于,步骤S1所述根据链路状态信息,获得每一段链路的中断概率的过程为:统计一定时间段T内网络中每一段链路的中断时间t
i
,i表示链路序号,得到每一段链路的中断概率p
i
,表达式为:p
i
=t
i
/T。3.根据权利要求2所述的基于Q
‑
学习的SDN链路抗毁方法,其特征在于,通过中断概率获得每一段链路的奖励值为:rw
t
=λlog(1
‑
p
i
)+c其中,rw
t
表示t时刻下数据包从交换机S发送到下一个交换机S
′
时所获取的奖励值;λ表示奖励系数,c表示附加常数;p
i
表示每一段链路的中断概率。4.根据权利要求3所述的基于Q
‑
学习的SDN链路抗毁方法,其特征在于,步骤S4中Q值的计算公式为:其中,S
′
表示下一状态的交换机,γ表示折扣因子,Q表示在数据包到达交换机S时,能够获得的最大期望收益;R(S,S
′
)表示立即获得的收益,γmaxQ*
k
(S')是未来折扣收益;通过Q值更新确定Q矩阵的所有元素。5.根据权利要求4所述的基于Q
‑
学习的SDN链路抗毁方法,其特征在于,γ代表Q
...
【专利技术属性】
技术研发人员:王炜发,杨青桦,张大眀,李勇,
申请(专利权)人:中国电子科技集团公司第七研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。