【技术实现步骤摘要】
本专利技术涉及智慧城市领域,尤其涉及一种基于强化学习的城市垃圾收运方法及系统。
技术介绍
1、随着城市化进程的不断加速,城市生活垃圾的规模呈现持续增长的趋势,这对于城市环境的维护和居民生活质量的保障至关重要。然而,当前的垃圾处理系统面临着多方面的问题和挑战,垃圾收集、运输、处理等环节存在着效率低下的情况,这导致了资源的浪费和环境的污染,垃圾处理过程中的成本较高。此外,当前的垃圾管理往往是基于经验和简单的统计数据,缺乏科学性和系统性,导致了决策的盲目性和不确定性。
技术实现思路
1、有鉴于此,为了解决现有城市垃圾收运方法中大多依据简单的经验数据,进而导致垃圾收运效率不高的技术问题,本专利技术提出一种基于强化学习的城市垃圾收运方法,所述方法包括以下步骤:
2、基于马尔可夫决策过程,构建垃圾收运车与收发点的行驶模型;
3、基于所述行驶模型,根据优化目标,定义第一状态空间、第一动作空间和第一奖励函数;
4、基于马尔可夫决策过程,构建路径模型;
5、基...
【技术保护点】
1.一种基于强化学习的城市垃圾收运方法,其特征在于,包括以下步骤:
2.根据权利要求1所述一种基于强化学习的城市垃圾收运方法,其特征在于,所述这基于马尔可夫决策过程,构建垃圾运收车与收发点的行驶模型一步骤,其具体包括:
3.根据权利要求1所述一种基于强化学习的城市垃圾收运方法,其特征在于,所述基于所述行驶模型,根据优化目标,定义第一状态空间、第一动作空间和第一奖励函数这一步骤,其具体包括:
4.根据权利要求1所述一种基于强化学习的城市垃圾收运方法,其特征在于,所述基于所述路径模型,限定搜索空间,划分第二状态空间、第二动作空间和第二奖...
【技术特征摘要】
1.一种基于强化学习的城市垃圾收运方法,其特征在于,包括以下步骤:
2.根据权利要求1所述一种基于强化学习的城市垃圾收运方法,其特征在于,所述这基于马尔可夫决策过程,构建垃圾运收车与收发点的行驶模型一步骤,其具体包括:
3.根据权利要求1所述一种基于强化学习的城市垃圾收运方法,其特征在于,所述基于所述行驶模型,根据优化目标,定义第一状态空间、第一动作空间和第一奖励函数这一步骤,其具体包括:
4.根据权利要求1所述一种基于强化学习的城市垃圾收运方法,其特征在于,所述基于所述路径模型,限定搜索空间,划...
【专利技术属性】
技术研发人员:张鼎华,汤培新,张胜营,李硕,周德靖,郎旭涵,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。