一种基于机器学习的主动式队列管理方法生成器技术

技术编号：10919182 阅读：101 留言：0更新日期：2015-01-15 13:09

本发明专利技术涉及一种基于机器学习的主动式队列管理方法生成器，利用用户对网络环境的模糊描述，通过机器学习中强化学习的方法在该网络环境下进行离线学习，以生成符合用户定制需求的主动式队列管理方法。本发明专利技术避免了对不同网络场景手工设计主动队式管理方法的繁琐，且生成的方法具有高吞吐率低延时的特征。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于机器学习的主动式队列管理方法生成器
本专利技术涉及网络拥塞控制，特别是一种基于机器学习的主动式队列管理方法生成器。
技术介绍
随着近年来计算机网络规模的急剧膨胀，特别是层出不穷的多媒体应用对网络服务质量的要求越来越高，控制网络拥塞，提高网络服务质量变得尤为重要。网络拥塞控制主要由两部分组成：一是端到端的传输协议，比如TCP协议，二是部署在中间节点的主动式队列管理算法。在网络传输过程中，中间节点的队列过短，会导致新到的数据包无法入队而被丢弃；过长，会导致排队时延太大。同时，中间节点适时丢包可以作为一种拥塞信号反馈给发送端，使其降低发送速率，避免拥塞。因此，如何管理队列是网络拥塞控制的关键。
技术实现思路
本专利技术的目的是提供一种基于机器学习的主动式队列管理方法生成器，能自动为用户定制的网络生成高效的主动式队列管理算法。本专利技术采用以下技术方案实现：一种基于机器学习的主动式队列管理方法生成器，其特征在于,包括以下步骤：步骤S01：根据用户对网络环境的模糊描述模拟出一仿真网络场景；步骤S02：定义规则为状态空间到动作的映射，将现有的规则集合初始化为一条规则；步骤S03：将所述规则集合作为队列管理方法应用到所述仿真网络场景中，该队列管理方法在所述仿真网络场景运行固定时间后计算出规则集合反馈值；步骤S04：对所述规则集合内的所有规则进行规则优化后跳回步骤S03，直至无法得到更高的规则集合的反馈值后执行步骤S05；步骤S05：选择获得最大规则反馈值的规则进行规则分裂，将该规则分裂成若干子规则；步骤S06：返回步骤S03，直至达到规定的迭代次数后退出，最终得到的...
一种基于机器学习的主动式队列管理方法生成器

【技术保护点】
一种基于机器学习的主动式队列管理方法生成器，其特征在于，包括以下步骤：步骤S01：根据用户对网络环境的模糊描述模拟出一仿真网络场景；步骤S02：定义规则为状态空间到动作的映射，将现有的规则集合初始化为一条规则；步骤S03：将所述规则集合作为队列管理方法应用到所述仿真网络场景中，该队列管理方法在所述仿真网络场景运行固定时间后计算出所述规则集合反馈值；步骤S04：对所述规则集合内的所有规则进行规则优化后跳回步骤S03，直至无法得到更高的规则集合的反馈值后执行步骤S05；步骤S05：选择获得最大规则反馈值的规则进行规则分裂，将该规则分裂成若干子规则；步骤S06：返回步骤S03，直至达到规定的迭代次数后退出，最终得到的规则集合为生成的队列管理方法。

【技术特征摘要】
1.一种基于机器学习的主动式队列管理方法生成器，其特征在于,包括以下步骤：步骤S01：根据用户对网络环境的模糊描述模拟出一仿真网络场景；步骤S02：定义规则为状态空间到动作的映射(ewma_qlen，ewma_inter)→＜k，b＞，将现有的规则集合初始化为一条规则；步骤S03：将所述规则集合作为队列管理方法应用到所述仿真网络场景中，该队列管理方法在所述仿真网络场景运行固定时间后计算出规则集合反馈值；步骤S04：对所述规则集合内的所有规则进行规则优化后跳回步骤S03，直至无法得到更高的规则集合的反馈值后执行步骤S05；步骤S05：选择获得最大反馈值的规则，并将该规则进行规则分裂成若干子规则；步骤S06：返回步骤S03，直至达到规定的迭代次数后退出，最终得到的规则集合为生成的队列管理方法；步骤S03中所述规则集合的反馈值的为：其中throughput是指全局的吞吐率，delay是指每个数据包的平均端到端时延；其中i表示第i个数据包，N表示全局数据包总数；所述规则集合的反馈值越大，表示其所构成的队列管理算法性能越好。2.根据权利要求1所述的基于机器学习的主动式队列式管理方法生成器，其特征在于：所述仿真网络场景中的每个发送端部署了随机开关的FTP，使得每个发送端随机关闭一段时间后发送随机数量的数据包，再随机关闭，再随机发送，如此循环。3.根据权利要求1所述的基于机器学习的主动式队列式管理方...

【专利技术属性】
技术研发人员：张栋，林新安，
申请(专利权)人：福州大学，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人