基于强化学习的服务功能链部署方法、系统及装置制造方法及图纸

技术编号：38400180 阅读：17 留言：0更新日期：2023-08-07 11:12

本发明专利技术公开了一种基于强化学习的服务功能链部署方法、系统及装置，包括，S1、获取时延最短的服务路径；S2、判断时延最短的服务路径是否满足时延约束条件，若满足服务链路由约束条件，则将服务链中的虚拟链路重映射到底层链路中，若重构路径违反资源约束条件，则回溯到次优路径进行判断，直到搜索到满足约束条件的路径；S3、将映射节点选择问题建模成DTMDP模型，利用强化学习算法在服务路径上搜索最优映射节点，直到迭代次数达到上限值或实现算法的全局收敛，则终止强化学习算法；S4、完成服务功能链部署。本发明专利技术可以实现基于强化学习的服务功能链部署。功能链部署。功能链部署。

全部详细技术资料下载

【技术实现步骤摘要】
基于强化学习的服务功能链部署方法、系统及装置

[0001]本专利技术涉及服务链部署领域，尤其是涉及一种基于强化学习的服务功能链部署方法、系统及装置。

技术介绍

[0002]服务功能链部署框架主要分为基于软件定义网络/Middlebox和基于软件定义网络/网络功能虚拟化。其中Zhang等[1]提出一种基于StEERING的服务功能链部署框架，该框架的主要思想是采用多级流表来引导流量在服务链路上进行转发，并使用metadata来标记业务流量在服务路径上的状态。Ding等[2]提出一种基于OpenSCaaS服务功能链部署框架，该框架的主要思想是将服务功能链上识别策略、转发策略和服务节点的管理，分别放在控制平面的策略控制器、软件定义网络控制器和网络功能虚拟化控制器中实现，然后在控制平面之上定位统一的编排器。根据租户需求分解编排策略，并将分解后的结果分别发放给策略控制器、软件定义网络控制器和网络功能虚拟化控制器，三者的配合实现对服务功能链部署。当前服务功能链部署方法主要分为精确算法和启发式算法这两大类。Moens等[3]提出了一种虚拟网络功能部署模型，该模型采用决策树算法实现对功能模块的映射和编排，所提出的算法仅能得到映射收益的最优解，而无法兼顾时延优化的精确度。Lukovszki等[4]提出了一种基于启发式Greedy算法的服务功能链部署方法，该方法通过穷举所有满足连通性和策略需求的路径，并在其中选择部署开销最小的服务路径，但请求处理时间较长，时延优化精度不高。
[0003][1]Zhang Y,Beheshti N...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的服务功能链部署方法，其特征在于，包括，S1、获取时延最短的服务路径；S2、判断时延最短的服务路径是否满足时延约束条件，若满足服务链路由约束条件，则将服务链中的虚拟链路重映射到底层链路中，若重构路径违反资源约束条件，则回溯到次优路径进行判断，直到搜索到满足约束条件的路径；S3、将映射节点选择问题建模成DTMDP模型，利用强化学习算法在服务路径上搜索最优映射节点，直到迭代次数达到上限值或实现算法的全局收敛，则终止强化学习算法；S4、完成服务功能链部署。2.根据权利要求1所述的方法，其特征在于，所述S1具体包括：采用K
‑
最短路径算法搜索得到时延最短的服务路径。3.根据权利要求3所述的方法，其特征在于，所述S3具体包括：将VNF映射节点选择问题建模成DTMDP模型，利用Dyna
‑
Q强化学习算法在服务路径上搜索最优映射节点，直到迭代次数达到上限值或实现算法的全局收敛，则终止Dyna
‑
Q算法。4.根据权利要求3所述的方法，其特征在于，所述Dyna
‑
Q算法包括：DRL算法和IRL算法。5.一种基于强化学习的服务功能链部署系统，其特征在于，包括，获取模块：用于获取时延最短的服务路径；判断模块：用于判断时延最短的服务路径是否满足时延约束条件，若满足服务链路由约束条件，则将服务链中的虚拟链路重映射到底层链路中，若重构路径违反...

【专利技术属性】
技术研发人员：刘益岑，赵东昊，董海瑞，马晓琳，卢昱，
申请(专利权)人：中国人民解放军陆军工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人