基于强化学习的路由方法、中央服务器、存储介质及产品技术

技术编号：38256720 阅读：22 留言：0更新日期：2023-07-27 10:19

本发明专利技术属于计算机技术领域，具体公开了一种基于强化学习的路由方法、中央服务器、存储介质及产品。该方法包括：接收到路由传输请求时，记录路由器拓扑网络中各个路由器在预定时间段内的流量模式；将流量模式作为强化学习中智能体的环境状态，以使智能体根据流量模式预测下一步路由位置，若路由位置不为收点路由位置，则将路由位置作为新的发点路由位置预测下一步路由位置，直至下一步路由位置为收点路由位置时，将路由路径存储在预设的路由表中，路由路径用于反映预测出的每一步路由位置的顺序；根据路由路径将服务请求方路由至目标服务方。本发明专利技术解决了服务器分配给路由器的计算资源较高的难题。源较高的难题。源较高的难题。

全部详细技术资料下载

【技术实现步骤摘要】
基于强化学习的路由方法、中央服务器、存储介质及产品

[0001]本专利技术属于计算机
，具体涉及一种基于强化学习的路由方法、中央服务器、存储介质及产品。

技术介绍

[0002]计算机网络通信中，路由技术是其关键和核心的一项技术。在其中，路由选择协议又是路由技术的核心部分，根据网络的自治系统，路由协议分为内部网关协议IGPI，外部网关协议EGP。我们讨论的主要是自治系统中的网络通信协议，所以主要关注内部网关协议IGPI。传统的内部网关协议主要包括且使用的是RIP协议(RoutingInformation Protocol)和OSPF协议(Open Shortest Path First)。其中OSPF协议的工作步骤为：1、建立邻居。2、向网络中所有路由器广播链路状态，更新路由表。3、通过传统的一些最短路径算法来计算最优路由；RIP协议和OSPF协议在早期表现良好，但随着网络用户的增多，请求网络传输的数据量激增，这些传统路由协议的问题就日益凸显，比如OSPF协议每更新一次就要广播一次更新一下路由表，极大的消耗了计算资源，这...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的路由方法，其特征在于，所述方法应用于中央服务器，所述中央服务器为基于软件定义网络框架部署的服务器，所述方法包括：接收到路由传输请求时，记录路由器拓扑网络中各个路由器在预定时间段内的流量模式，所述路由传输请求携带有服务请求方的发点路由位置和目标服务方的收点路由位置；将所述流量模式作为强化学习中智能体的环境状态，以使所述智能体根据所述流量模式预测下一步路由位置，若所述路由位置不为收点路由位置，则将所述路由位置作为新的发点路由位置预测下一步路由位置，直至下一步所述路由位置为收点路由位置时，将路由路径存储在预设的路由表中，所述路由路径用于反映预测出的每一步路由位置的顺序；根据所述路由路径将所述服务请求方路由至所述目标服务方。2.如权利要求1所述的基于强化学习的路由方法，其特征在于，所述路由器内设置有流量监控模块，记录路由器拓扑网络中各个路由器在预定时间段内的流量模式的步骤包括：在所述预定时间段内，获取所述流量监控模块记录的各自所属的所述路由器的流量,并将各个所述路由器的所述流量组成列向量；在所述列向量中添加个所述路由器具有的绝对位置编码后，获得所述流量模式。3.如权利要求1或2所述的基于强化学习的路由方法，其特征在于，所述智能体根据所述流量模式预测下一步路由位置之前，所述方法包括：训练所述智能体根据所述流量模式预测下一步所述路由位置，以使训练出的所述智能体具备预测下一步所述路由位置的能力。4.如权利要求3所述的基于强化学习的路由方法，其特征在于，训练所述智能体根据所述流量模式预测下一步所述路由位置的步骤包括：通过所述智能体根据所述流量模式执行action动作，所述action动作为选择下一步所述路由位置的动作；判断所述路由位置是否为收点路由位置，若是，向所述智能体反馈正反馈信息，若否，向所述智能体反馈负反馈信息；根据所述正反馈信息和所述负反馈信息，判断所述智能体是否具备预测下一步所述路由位置的能力。5.如权利要求4所述的基于强化学习的路由方法，其特征在于，通过所述智能体根据所述流量模式执行action动作之前，训练所述智能体根据所述流量模式预测下一步所述路由位置的步骤还包括：基于DQN算法构造神经网络模块，利用所述神经网络模块根据所述流量模式，预测所述...

【专利技术属性】
技术研发人员：付惠惠，刘韡，滕海，刘曦冉，
申请(专利权)人：航天科工网络信息发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人