基于深度强化学习的资源调度优化系统及方法技术方案

技术编号：39309661 阅读：10 留言：0更新日期：2023-11-12 15:56

本发明专利技术公开了基于深度强化学习的资源调度优化系统及方法，包括数据获取模块、资源筹备模块、资源存储模块、资源调度模块和资源运输模块；所述数据获取模块用于获取救援地点的位置信息及救援物资的需求信息；所述资源筹备模块用于通过物联网发送救援物资筹备信息，对救援物资进行筹备；所述资源存储模块用于对筹备的救援物资进行存储。本发明专利技术通过设置数据获取模块和资源筹备模块，能够根据救援地点的位置信息及救援物资的需求信息，通过物联网发送救援物资筹备信息，对救援物资进行筹备，从而能够从周边进行物资筹备，有利于加速物资筹备的速度，提高救援速度。提高救援速度。提高救援速度。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度强化学习的资源调度优化系统及方法

[0001]本专利技术属于资源调度
，具体涉及基于深度强化学习的资源调度优化系统及方法。

技术介绍

[0002]资源调度是指对各种资源进行合理有效的调节和测量及分析和使用。资源调度按照资源种类分为：信息资源调度、水资源调度、煤矿资源调度、燃气资源调度等，都是由国家相关职能管理部门统一管理与执行。按照调度性质分为：应急资源调度、普通资源调度。
[0003]应急资源调度：当发生不可预见的自然灾害或者特殊因素，我们一般需要制定应急资源的调度方案，确保受难区在第一时间内完成资源运达任务。
[0004]目前现有的用于应急资源调度的资源调度优化系统及方法还存在一些问题：物资筹备速度较慢，影响救援速度，不能够对救援物质进行溯源，降低的救援物资的安全性，同时资源调度的数据处理过程中的感知能力和决策能力不能同时处于较高水平，导致资源调度效率低，为此我们提出基于深度强化学习的资源调度优化系统及方法。

技术实现思路

[0005]本专利技术的目的在于提供基于深度强化学习的资源调度优化系统及方法，以解决上述
技术介绍
中提出的问题。
[0006]为实现上述目的，本专利技术提供如下技术方案：基于深度强化学习的资源调度优化系统，包括数据获取模块、资源筹备模块、资源存储模块、资源调度模块和资源运输模块；
[0007]所述数据获取模块用于获取救援地点的位置信息及救援物资的需求信息；
[0008]所述资源筹备模块用于通过物联网发送救援物资筹备信息，对救援

【技术保护点】

【技术特征摘要】
1.基于深度强化学习的资源调度优化系统，其特征在于：包括数据获取模块、资源筹备模块、资源存储模块、资源调度模块和资源运输模块；所述数据获取模块用于获取救援地点的位置信息及救援物资的需求信息；所述资源筹备模块用于通过物联网发送救援物资筹备信息，对救援物资进行筹备；所述资源存储模块用于对筹备的救援物资进行存储；所述资源调度模块用于通过深度强化学习方法，输入物资需求量、事故最早结束时间、救援费用和物资供给量之间的预设关系，对救援物资进行调度；所述资源运输模块用于根据综合道路状况和外部环境等影响因素，对救援物资信息计算出最优车辆调集方案，完成救援物资运输。2.根据权利要求1所述的基于深度强化学习的资源调度优化系统，其特征在于：所述资源存储模块包括RFID电子标签、RFID读写器和出入记录单元；所述RFID电子标签用于存储对应的救援物资的信息；所述RFID读写器用于对RFID电子标签进行扫描，并通过网络通信，完成物救援资信息获取、传输和处理；所述出入记录单元用于对出入仓库门口的RFID电子标签进行扫描，并通过网络通信，完成救援物资的出入进行记录和更新。3.根据权利要求1所述的基于深度强化学习的资源调度优化系统，其特征在于：所述资源调度模块包括深度强化学习单元，所述深度强化学习单元用于将深度学习和强化学习相结合，利用深度学习的感知能力和强化学习的决策能力，输入物资需求量、事故最早结束时间、救援费用和物资供给量之间的预设关系，对救援物资进行调度。4.根据权利要求1所述的基于深度强化学习的资源调度优化系统，其特征在于：所述资源运输模块包括获取单元、分析单元、路径确定单元和运输单元；所述获取单元用于获取救援地点的位置信息及救援物资的需求信息；所述分析单元用于根据获取的救援物资信息，查找预先设置的救援物资与资源点标识的映射关系表，找到能够提供与所述获取的救援物资信息对应的各资源点标识，依据找到的资源点标识获取资源点的空间位置信息；所述路径确定单元用于根据救援地点的位置信息以及资源点的空间位置信息，确定各资源点与救援地点的路径集；所述运输单元用于从预设的数据库中获取路径集中每条路径的道路属性参数和外部环境条件参数，根据获取的道路属性参数、外部环境条件参数以及预先设置的调集策略，为救援物资信息计算出最优车辆调集方案。5.基于深度强化学习的资源调度优化方法，其特征在于：包括以下步骤：S1.获取救援地点的位置信息及救援物资的需求信息；S2.通过物联网发送救援物资筹备信息，对救援物资进行筹备；S3.对筹备的救援物资进行存储；S4.通过深度强化学习方法，输入物资需求量、事故最早结束时间、救援费用和物资供给量之间的预设关系，对救援物资进行调度；S5.根据综合道路状况和外部环境等影响因素，对救援物资信息计算出最优车辆调集方案，完成救援物资运输。
6.根据权利要求5所述的基于深度强化学习的资源调度优化方法，其特征在于：所述S3中对筹备的救援物资进行存储的具体方法包括：S301.通过RFID电子标签存储对应的救援物资的信息；S302.通过RFID读写器对RFID电子标签进行扫描，并通过网络通信，完成物救援资信息获取、传输和处理；S3...

【专利技术属性】
技术研发人员：王玲，陈淑君，
申请(专利权)人：南京信同诚信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人