一种基于SAC和神经回路策略的机器人控制方法、电子设备及存储介质技术

技术编号:39943346 阅读:20 留言:0更新日期:2024-01-08 22:44
一种基于SAC和神经回路策略的机器人控制方法、电子设备及存储介质,属于机器人行为控制技术领域。为提高机器人处理速度和智能特性,本发明专利技术将机器人控制与强化学习中SAC算法相结合,摆脱了传统控制算法对模型的限制,提高了机器人的学习速度和对经验样本的利用效率,解决了机器人易陷入局部最优、无法合理规划动作的问题。通过构建四层神经回路策略网络作为控制输出生成网络,能够高效准确地完成机器人控制,与当前时期其他技术相比,本方法对硬件算力要求更低,能够拥有较高的计算效率,只需要少量神经元便能达到较好的效果。本方法工作原理更接近神经细胞的功能原理,具有更先进的理论支撑,在人工智能领域有更多发展潜力。

【技术实现步骤摘要】

本专利技术属于机器人行为控制,具体涉及一种基于sac和神经回路策略的机器人控制方法、电子设备及存储介质。


技术介绍

1、机器人领域的最新进展应用于各个行业中。机器人设计的一个关键方面是开发能够有效处理复杂和动态环境的控制系统。强化学习已经成为一种强大的工具,使机器人能够通过获取环境的反馈来学习如何执行特定的任务。

2、尽管强化学习算法取得了进展,但开发能够鲁棒地适应环境变化并有效执行复杂任务的控制系统仍然具有挑战性。这些强化学习的方法虽然性能要优于传统网络,但往往缺乏泛化能力,且有可能陷入次优决策,对训练数据过度拟合。


技术实现思路

1、本专利技术要解决的问题是提高机器人处理速度和智能特性,提出一种基于sac和神经回路策略的机器人控制方法、电子设备及存储介质。

2、为实现上述目的,本专利技术通过以下技术方案实现:

3、一种基于sac和神经回路策略的机器人控制方法,包括如下步骤:

4、s1.构建仿真环境,设计机器人初始位置、速度和倾角,采集机器人的运动状态数据;<本文档来自技高网...

【技术保护点】

1.一种基于SAC和神经回路策略的机器人控制方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于SAC和神经回路策略的机器人控制方法,其特征在于,步骤S1的仿真环境基于PyBullet Walker2D和PyBullet Ant实现。

3.根据权利要求2所述的一种基于SAC和神经回路策略的机器人控制方法,其特征在于,步骤S3所述神经回路策略网络由四层分层网络拓扑结构构建而成,包括感知层、中转层、控制层和驱动层,感知层的神经元为感知神经元Ns,中转层的神经元为中间神经元Ni,控制层的神经元为命令神经元Nc,驱动层的神经元为运动神经元Nm;所述感知神经元...

【技术特征摘要】

1.一种基于sac和神经回路策略的机器人控制方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于sac和神经回路策略的机器人控制方法,其特征在于,步骤s1的仿真环境基于pybullet walker2d和pybullet ant实现。

3.根据权利要求2所述的一种基于sac和神经回路策略的机器人控制方法,其特征在于,步骤s3所述神经回路策略网络由四层分层网络拓扑结构构建而成,包括感知层、中转层、控制层和驱动层,感知层的神经元为感知神经元ns,中转层的神经元为中间神经元ni,控制层的神经元为命令神经元nc,驱动层的神经元为运动神经元nm;所述感知神经元到中间神经元为前馈主导连接,中间神经元和命令神经元为高度重合性连接,命令神经元到运动神经元为前馈连接;

4.根据权利要求3所述的一种基于sac和神经回路策略的机器人控制方法,其特征在于,步骤s3的具体实现方法包括如下步骤:

5.根据权利...

【专利技术属性】
技术研发人员:莫宏伟徐立芳张圣胤温峰
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1