下载基于多智能体强化学习路由策略控制路由动作的方法的技术资料

文档序号:24893631

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明涉及信息技术领域,公开了一种基于多智能体强化学习路由策略控制路由动作的方法,包括:训练强化学习模型,所述强化学习模型利用Q学习算法更新路由节点的决策值,并结合更新的所述决策值利用策略梯度算法更新策略参数;根据所述路由节点转发数据包的目...
该专利属于深圳市大数据研究院;香港中文大学(深圳)所有,仅供学习研究参考,未经过深圳市大数据研究院;香港中文大学(深圳)授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。