一种基于流量识别的网络功能虚拟化智能调度方法技术

技术编号：22298331 阅读：79 留言：0更新日期：2019-10-15 06:54

一种基于流量识别的网络功能虚拟化智能调度方法，基于置信区域策略优化算法实现，所述方法包括下列操作步骤：(1)对网络数据流进行分类：(2)设置置信区域策略优化算法的状态空间；(3)设置置信区域策略优化算法的动作空间；(4)设置置信区域策略优化算法的奖励函数：(5)设置置信区域策略优化算法的损失函数；(6)在前述步骤的基础上，利用置信区域策略优化算法实现对虚拟网络功能的智能调度。本发明专利技术方法，能根据不同流量数据的服务质量需求，实现虚拟网络功能的智能调度，提高了网络利用率和网络服务性能。

An Intelligent Scheduling Method for Network Function Virtualization Based on Traffic Recognition

全部详细技术资料下载

【技术实现步骤摘要】
一种基于流量识别的网络功能虚拟化智能调度方法
本专利技术涉及一种基于流量识别的网络功能虚拟化智能调度方法，属于信息
，特别是属于网络功能虚拟化

技术介绍
随着网络流量数据的快速增长和网络应用的不断普及，网络用户对于服务质量的需求越来越高，包括低延时、低丢包率和高吞吐量等，因此网络设备不仅需要提高带宽和容量，更需要一个合适的资源调度机制。NetworkFunctionVirtualization(NFV)即网络功能虚拟化技术将网络功能从传统硬件设备分离，能够灵活地编排网络功能，共享网络资源。NFV技术使用virtualizednetworkfunctions(VNF)即虚拟网络功能实现对不同网络的创建、配置、监测和运行，VNF被部署在不同的网络节点中，不同的网络服务由一些特定的虚拟网络功能组成的服务功能链完成。因此在NFV环境下，对网络功能的编排即调度决定了网络服务的质量与网络资源的调度使用。但是目前NFV环境中的调度方案大多遵从先进先出原则，以提高网络利用率为目标，完成尽可能多的流量数据的传输任务，而没有考虑到用户对于不同种类的流量数据有着不同的服务质量要求，往往会导致用户优先级较低的流量数据占用大量网络带宽等资源，影响优先级较高的流量数据的用户体验。当前主流的流量识别研究都采用机器学习的方法，提取流量数据的特征进行识别分类。然而这些工作大多局限在识别少数特定网络应用或者特定网络环境下的流量数据，在流量包被加密后很难起到作用，应用的范围较为狭窄。而虚拟网络功能的动态编排方案被视为一个在线决策问题，现有的研究都局限于对环境进行建模来得到最优方...

【技术保护点】
1.一种基于流量识别的网络功能虚拟化智能调度方法，基于置信区域策略优化算法Trust Region Policy Optimization算法实现，其特征在于：所述方法包括下列操作步骤：(1)对网络数据流进行分类：根据网络数据流的到达时间、数量和长度构造网络数据流的识别特征，对网络数据流进行分类；所述识别特征不会受到网络数据流是否加密的限制；所述识别特征取决于网络用户行为的流量类型，不会受到同一类型不同应用的限制；(2)设置Trust Region Policy Optimization算法的状态空间：

【技术特征摘要】
1.一种基于流量识别的网络功能虚拟化智能调度方法，基于置信区域策略优化算法TrustRegionPolicyOptimization算法实现，其特征在于：所述方法包括下列操作步骤：(1)对网络数据流进行分类：根据网络数据流的到达时间、数量和长度构造网络数据流的识别特征，对网络数据流进行分类；所述识别特征不会受到网络数据流是否加密的限制；所述识别特征取决于网络用户行为的流量类型，不会受到同一类型不同应用的限制；(2)设置TrustRegionPolicyOptimization算法的状态空间：对于数据包i，定义其在时间步ti到达时的网络状态为由此时网络中所有节点状态链路状态和传输状态共同组成；上式中，表示时间步ti时节点n的空闲计算资源，表示时间步ti时链路e的空闲带宽资源；MTTi表示数据包i的最大传输时间，该最大传输时间根据步骤(1)中对数据包i的分类结果来设定；TPi表示数据包i的传输优先级，该传输优先级根据步骤(1)中对数据包i的分类结果来设定；(3)设置TrustRegionPolicyOptimization算法的动作空间：系统扫描整个网络，获得所有从源节点到目的节点的所有可达路径，假设存在P条路径，则动作空间为：A＝{a|a∈{1,2,…,P}，上式中a表示系统所采取的动作，即对应具体编号的路径；(4)设置TrustRegionPolicyOptimization算法的奖励函数：由于受到网络服务质量的限制，当数据包在网络中传输时间超过其最大传输时间时，则该数据包被丢弃，故以最小化数据包的平均延时和丢弃包的数量为目的，设置t时间步的奖励函数rt为：上式中It表示t时间步在网络中传输的流量数据包的集合，Nt表示t时间步丢弃的数据包的数量，b和c分别表示基准值和惩罚系数；(5)设置TrustRegionPolicyOptimization算法的损失函数：上式中，Et[]表示对t时间步方括号内的部分求数学期望；θ表示生成该算法中决策策略的神经网络所有参数集合，表示新策略πθ(at|st)与旧策略之间相同的状态-动作对被选中的概率比值，clip()函数表示数值截断函数，括号内第二项和第三项的数值分别为第一项数值的上界和下界，rt(θ)在上下界之间则函数值输出rt(θ)的原始值，若超出上下界则对rt(θ)进行截断，输出上界值或下界值；表示新策略...

【专利技术属性】
技术研发人员：王晶，王敬宇，孙海峰，戚琦，何波，廖建新，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人