一种基于多维信息和强化学习的动态分组路由算法制造技术

技术编号:43355703 阅读:20 留言:0更新日期:2024-11-19 17:42
本发明专利技术公开了一种基于多维信息和强化学习的动态分组路由算法,属于路由网络技术领域。针对如何确定机器学习算法中网络状态与路由动作的映射关系,如何设计在线优化算法策略,并最大化算法收益问题,通过基于马尔可夫过程对路由过程进行建模;基于Double DQN算法框架并采用DNN网络构建评论网络Q(·)、目标评论网络Q<supgt;‑</supgt;(·);利用深度学习网络对建立的模型进行更新训练与强化学习,寻找出最佳的路由分组策略。本发明专利技术将每个路由器节点抽象为独立的智能体,以数据包当前位置节点、网络中节点数量、当前位置节点数据包接收长度、邻居节点集合等多维数据作为神经网络的输入,并结合分段奖励函数来确定路由最佳动作,最终实现路由过程的效率最大化。

【技术实现步骤摘要】

本专利技术属于路由网络,具体涉及一种基于多维信息和强化学习的动态分组路由算法


技术介绍

1、分组路由是通信网络的关键功能之一,通常以最小化分组从源节点到目的节点的传输时间(即端到端延迟)为路由目标。然而,当前网络规模及其承载流量的爆炸式增长,网络结构呈现出分布式、动态性的特点,网络流量呈现突发性和不可预测性的特点,在这种情况下如何确保网络的连通性并保障网络各种应用的服务质量(qos),给传统路由算法和路由协议带来巨大的挑战。如经典的bellman-ford算法通过寻找网络拓扑中最短路径,并利用最短路径来最小化分组路由的传输时延,其对网络流量波动、负载均衡和网络拓扑变化等其它因素缺少考虑;而dsdv路由协议需采用泛洪方法来维护全局一致的路由表。然而,在缺乏网络全局协调方法和机制的分布式网络中,路由器需自行选择分组的下一跳路由节点,这要求路由算法必须具备自主学习网络局部特性的能力,进而可优选出适合的下一跳路由,这通常是一项具有挑战性的任务。

2、目前,路由算法大致可以分为两类,一类是传统的最短路径算法,如bellman-ford算法和dijkst本文档来自技高网...

【技术保护点】

1.一种基于多维信息和强化学习的动态分组路由算法,其特征在于,所述算法包括以下步骤:

2.根据权利要求1所述的一种基于多维信息和强化学习的动态分组路由算法,其特征在于,所述步骤1的具体操作为:

3.根据权利要求2所述的一种基于多维信息和强化学习的动态分组路由算法,其特征在于,所述步骤2:基于DoubleDQN算法框架并采用DNN网络构建评论网络Q(·)、目标评论网络Q-(·);其中:

4.根据权利要求3所述的一种基于多维信息和强化学习的动态分组路由算法,其特征在于,所述步骤3的具体操作为:

【技术特征摘要】

1.一种基于多维信息和强化学习的动态分组路由算法,其特征在于,所述算法包括以下步骤:

2.根据权利要求1所述的一种基于多维信息和强化学习的动态分组路由算法,其特征在于,所述步骤1的具体操作为:

3.根据权利要求2所述的一种基于多维信息和强化学...

【专利技术属性】
技术研发人员:杜瑞芳胡治国张林梁
申请(专利权)人:山西金融职业学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1