利用弯路估计的深度强化学习求解车辆路径问题的方法技术

技术编号:40468917 阅读:28 留言:0更新日期:2024-02-22 23:23
本发明专利技术属于人工智能技术领域,具体技术方案为:利用弯路估计的深度强化学习求解车辆路径问题的方法,具体步骤如下:一、构建深度强化学习模型网络结构及优化目标;二、初始化学习模型的所有参数值,随机生成数据集;三、构建训练过程,将生成的数据集输入学习模型,获得通过概率抽样和贪婪策略构造的路径解;四、计算损失值,记录平均成本;五、根据损失值,对学习模型的网络参数进行优化;六、设置最大训练轮数,重复步骤三、步骤四和步骤五;本发明专利技术设计了在模型训练过程中对配送车辆所走弯路的估计值计算方法,并将其有效地融入强化学习的训练算法之中,加快了模型训练的收敛速度,提高了解的质量。

【技术实现步骤摘要】

本专利技术属于人工智能,具体涉及一种对训练过程中的弯路进行估计并加以利用,进而改善模型训练效果的深度强化学习求解车辆路径问题的方法。


技术介绍

1、近年来,随着移动互联网和电子商务的不断发展,我国物流业持续保持稳定发展势头,成为畅通经济增长的重要力量和促进国内国际双循环的重要推动力,也成为缓解医疗资源不足的重要帮手,在医疗场景为公众提供了高效优质的服务。随着我国老龄化逐渐加剧,医疗资源的供给和需求的矛盾会越来越大,结合软硬件技术以及人工智能技术,实现医疗自动化和智能化以提高服务效率成了新的挑战。

2、医疗机器人类型主要分为手术机器人、康复机器人、辅助机器人以及医疗服务机器人。医疗服务机器人主要包括送药机器人、消毒机器人等,医疗服务机器人的路径规划问题和组合优化一直是一个难题,研究人员们对其理论和实际应用进行了大量的研究,提出了许多优秀的精确算法、启发式算法和元启发式算法。但这些算法都缺乏泛化性能,在遇到新的问题时总要重复计算,且当问题规模越大,解的质量也越难以保证。

3、于是,为了解决这一问题,随着深度强化学习的发展,人们提出了一系本文档来自技高网...

【技术保护点】

1.利用弯路估计的深度强化学习求解车辆路径问题的方法,其特征在于,具体步骤如下:

2.根据权利要求1所述的利用弯路估计的深度强化学习求解车辆路径问题的方法,其特征在于,在步骤一中,优化目标的具体表达式如下:

3.根据权利要求2所述的利用弯路估计的深度强化学习求解车辆路径问题的方法,其特征在于,深度强化学习模型网络结构包括一个编码器和一个解码器;

4.根据权利要求1所述的利用弯路估计的深度强化学习求解车辆路径问题的方法,其特征在于,在步骤二中,初始化参数值,采用随机生成的方式生成需要的训练集,具体如下:所有节点的坐标均从[1×1]的矩形中均匀随机抽样得到...

【技术特征摘要】

1.利用弯路估计的深度强化学习求解车辆路径问题的方法,其特征在于,具体步骤如下:

2.根据权利要求1所述的利用弯路估计的深度强化学习求解车辆路径问题的方法,其特征在于,在步骤一中,优化目标的具体表达式如下:

3.根据权利要求2所述的利用弯路估计的深度强化学习求解车辆路径问题的方法,其特征在于,深度强化学习模型网络结构包括一个编码器和一个解码器;

4.根据权利要求1所述的利用弯路估计的深度强化学习求解车辆路径问题的方法,其特征在于,在步骤二中,初始化参数值,采用随机生成的方式生成需要的训练集,具体如下:所有节...

【专利技术属性】
技术研发人员:张春美马兆良梁子琪郭红戈陈高华
申请(专利权)人:太原科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1