【技术实现步骤摘要】
本专利技术属于机器人行为控制,具体涉及一种基于sac和神经回路策略的机器人控制方法、电子设备及存储介质。
技术介绍
1、机器人领域的最新进展应用于各个行业中。机器人设计的一个关键方面是开发能够有效处理复杂和动态环境的控制系统。强化学习已经成为一种强大的工具,使机器人能够通过获取环境的反馈来学习如何执行特定的任务。
2、尽管强化学习算法取得了进展,但开发能够鲁棒地适应环境变化并有效执行复杂任务的控制系统仍然具有挑战性。这些强化学习的方法虽然性能要优于传统网络,但往往缺乏泛化能力,且有可能陷入次优决策,对训练数据过度拟合。
技术实现思路
1、本专利技术要解决的问题是提高机器人处理速度和智能特性,提出一种基于sac和神经回路策略的机器人控制方法、电子设备及存储介质。
2、为实现上述目的,本专利技术通过以下技术方案实现:
3、一种基于sac和神经回路策略的机器人控制方法,包括如下步骤:
4、s1.构建仿真环境,设计机器人初始位置、速度和倾角,采集机器
...【技术保护点】
1.一种基于SAC和神经回路策略的机器人控制方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于SAC和神经回路策略的机器人控制方法,其特征在于,步骤S1的仿真环境基于PyBullet Walker2D和PyBullet Ant实现。
3.根据权利要求2所述的一种基于SAC和神经回路策略的机器人控制方法,其特征在于,步骤S3所述神经回路策略网络由四层分层网络拓扑结构构建而成,包括感知层、中转层、控制层和驱动层,感知层的神经元为感知神经元Ns,中转层的神经元为中间神经元Ni,控制层的神经元为命令神经元Nc,驱动层的神经元为运动神经元
...【技术特征摘要】
1.一种基于sac和神经回路策略的机器人控制方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于sac和神经回路策略的机器人控制方法,其特征在于,步骤s1的仿真环境基于pybullet walker2d和pybullet ant实现。
3.根据权利要求2所述的一种基于sac和神经回路策略的机器人控制方法,其特征在于,步骤s3所述神经回路策略网络由四层分层网络拓扑结构构建而成,包括感知层、中转层、控制层和驱动层,感知层的神经元为感知神经元ns,中转层的神经元为中间神经元ni,控制层的神经元为命令神经元nc,驱动层的神经元为运动神经元nm;所述感知神经元到中间神经元为前馈主导连接,中间神经元和命令神经元为高度重合性连接,命令神经元到运动神经元为前馈连接;
4.根据权利要求3所述的一种基于sac和神经回路策略的机器人控制方法,其特征在于,步骤s3的具体实现方法包括如下步骤:
5.根据权利...
【专利技术属性】
技术研发人员:莫宏伟,徐立芳,张圣胤,温峰,
申请(专利权)人:哈尔滨工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。