一种基于强化学习模型的云租户虚拟网络智能映射方法技术

技术编号：34801378 阅读：14 留言：0更新日期：2022-09-03 20:07

本发明专利技术公开了一种基于强化学习模型的云租户虚拟网络智能映射方法，其特点是该方法将资源抽象模型Blocking Island和深度强化学习方法Actor

全部详细技术资料下载

【技术实现步骤摘要】
一种基于强化学习模型的云租户虚拟网络智能映射方法

[0001]本专利技术涉及云边虚拟网络
，尤其是一种用于处理云边虚拟网络请求，高效分配计算资源和带宽资源的基于强化学习模型的云租户虚拟网络智能映射方法。

技术介绍

[0002]云计算数据中心作为高度复用的共享环境，配置了大量的物理服务器和其上运行的虚拟机，以一种即付即用的模式来为多租户提供高可靠性的计算、存储、网络等资源。随着，云服务领域不断地发展，如何优化该技术实现对物理资源更加合理的分配，进而使得收益最大化，是研究人员们一直在思考的问题。该研究的主要挑战是如何有效地动态地将服务器的计算资源和网络的链路带宽资源分配给云租户自定义的虚拟网络(Virtual Network,VN)，提升底层网络的计算和带宽资源的利用率，从而容纳更多的租户资源请求。这被称为虚拟网络映射(Virtual Network Embedding，VNE)问题，该VNE问题主要分成节点映射和链路映射两个阶段。在满足一系列约束和限制条件下，实现将虚拟网络映射到共享的底层物理资源是一个计算复杂度极高的资源分配和调度问题，并已被证明是NP
‑
hard的，求解其最优解的算法都达到了指数阶复杂度。针对上述问题，国内外学者展开了大量的研究工作，致力于找到处理VNE问题的最优解决办法。整体的研究成果可根据映射方案分为：精确式算法映射、启发式算法映射和基于机器学习的智能算法映射三种方法。
[0003]精确式算法是以建立特定的数学模型求解映射问题。例如，利用一些约束条件，对VNE问题...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习模型的云租户虚拟网络智能映射方法，其特征在于采用映射虚拟网络的算法模型，将资源抽象模型与深度强化学习结合，通过资源抽象模型对底层网络资源进行合理抽象，以节点与节点之间可用资源量为下界，表示整个网络的资源连通性信息，云租户虚拟网络的智能映射具体包括以下步骤：S1、虚拟网络映射的建模S1
‑
1：将云数据中心配备的物理网络建模为有权无向图G
s
＝(N
s
，E
s
)；云租户的虚拟网络建模为带权的无向图G
v
＝(N
v
，E
v
)；其中，N
s
和N
v
代表图中的点集，E
s
和E
v
代表图中的边集；S1
‑
2：节点映射，假设虚拟网络有p个节点，每个节点所对应的权重值，其权集为则映射成功的条件为：在中，寻找p个节点中，寻找p个节点使得若有一个节点无法通过映射规则映射到对应的物理节点上，则节点映射失败，若所有节点都能映射到对应的物理节点，则映射成功并结束；其中，N
v
为单个虚拟网络所有虚拟节点的集合；表示该虚拟网络中的第i个虚拟节点；M
v
为单个虚拟网络节点权重的集合；表示第i个虚拟节点的权重；N
s
为物理网络中所有物理节点的集合；表示该物理网络中的第i个物理节点；N
t
为物理网络中被选中的p个物理节点的集合；表示被选中映射的物理节点集合中的第i个物理节点；表示被选中映射的物理节点集合中的第j个物理节点的权重；S1
‑
3：在节点映射成功的基础上进行链路映射，假设3：在节点映射成功的基础上进行链路映射，假设3：在节点映射成功的基础上进行链路映射，假设代表连接节点i和节点j的对应虚拟链路边，实现链路映射的物理路径对于R中的所有物理链路都要满足：成立；其中，表示连接虚拟节点i和虚拟节点j的链路权重；表示连接物理节点u和物理节点v的链路权重，即所有的虚拟链路都能在物理网络中找到对应的一条物理路径与其映射，链路映射成功并结束，若有一条虚拟链路不能通过映射规则映射到物理网络中，则链路映射失败，并结束虚拟网络的映射；S2、计算资源和带宽资源建模根据物理网络中计算资源和带宽资源的上下限，对可映射权值分割成steps个范围，将这些范围的上限值生成steps个β值不同的点权Blocking Island模型和边权Blocking Island模型，并在每一个Blocking Island模型中，其底层网络的每一个节点都会生成一个计算资源的Blocking Island模型V(β
n
‑
BI)和一个带宽资源的V(β
e
‑
BI)，所述Blocking Island模型V(β
n
‑
BI)的定义是从当前节点出发，沿着链路通过至少包含β个计算资源的目的点的集合，且包含当前节点；S3、构建神经网络从待映射的节点和底层网络G
s
＝(N
s
，E
s
)中选取特征作为神经网络的输入，经神经网络各层参数的处理，得到一组概率输出，选取最大概率的那个物理节点为该虚拟节点的映射对象，通过自定义的计算reward规则，将得到的reward和概率值计算当次映射误差，在反向传播误差的过程中通过链式求导法则，更新模型的参数。
2.根据权利...

【专利技术属性】
技术研发人员：王廷，姚東序，
申请(专利权)人：华东师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人