基于D2BC-TD3的机器人导航方法及系统技术方案

技术编号：41421053 阅读：19 留言：0更新日期：2024-05-28 20:21

本发明专利技术涉及路径规划技术领域，尤其涉及基于D2BC‑TD3的机器人导航方法及系统，包括采集移动机器人雷达参数、设置初始化参数；构建包括Actor网络和Critic网络的D2BC‑TD3模型，将雷达参数输入Actor网络，Actor网络由四个全连接层组成，每个全连接层后连接ReLU激活函数，第二至第四个全连接层与输入特征进行残差连接，最后一个全连接层连接到输出层，输出层采用tanh激活函数，Actor网络输出状态‑动作对，并作为Critic网络的输入；Critic网络采用孪生结构，Critic网络与Actor网络结构相同。本发明专利技术解决现有方法处理复杂任务时存在收敛速度慢、动作估值准确性差的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及路径规划，尤其涉及基于d2bc-td3的机器人导航方法及系统。

技术介绍

1、随着机器人技术的发展，机器人高效率、无间隙工作的优势越来越明显，进而能够极大地促进生产力，在人类社会中正发挥着愈发重要的作用。

2、而现实中仍有大量的任务需要机器人能够具备空间移动能力，因此如何使移动机器人具有更大的使用灵活性，逐渐成为机器人领域的研究焦点。

3、理想的移动机器人应具有以下能力：当处于一个未知的、复杂的、动态的非结构化环境中时，能够在没有人干预下的情况下，通过自身所带的传感器来感知环境，到达期望的目的地，同时保证时间最少或能量消耗最低等。

4、因此，自主导航技术无疑是移动机器人技术中最为基础和核心的技术，通过移动机器人自身携带的传感器感知周围环境，并对获得的环境数据进行处理以得到周围环境的特征信息与位置信息，进而根据任务目标规划出满足机器人自身约束条件的路径。

5、陈康雄等人的基于扰动流体与td3的无人机路径规划算法，提出基于扰动流体与td3算法的无人机路径规划框架；但其是以td3算...

【技术保护点】

1.基于D2BC-TD3的机器人导航方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于D2BC-TD3的机器人导航方法，其特征在于，Actor网络输出动作值被缩放，缩放的公式为：

3.根据权利要求1所述的基于D2BC-TD3的机器人导航方法，其特征在于，对D2BC-TD3模型进行总奖励函数设置，通过总奖励函数实现避障和到达目标两个任务，并实现两个子任务平衡。

4.根据权利要求1所述的基于D2BC-TD3的机器人导航方法，其特征在于，总奖励函数的公式为：

5.根据权利要求4所述的基于D2BC-TD3的机器人导航方法，其特征在于，到...

【技术特征摘要】

1.基于d2bc-td3的机器人导航方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于d2bc-td3的机器人导航方法，其特征在于，actor网络输出动作值被缩放，缩放的公式为：

3.根据权利要求1所述的基于d2bc-td3的机器人导航方法，其特征在于，对d2bc-td3模型进行总奖励函数设置，通过总奖励函数实现避障和到达目标两个任务，并实现两个子任务平衡。

4.根据权利要求1所述的基于d2bc-td3的机器人导航方法，其特征在于，总奖励函数的公式为：

5.根据权利要求4所述的基于d2bc-td3的机器人导航方法，其特征在于，到达目标奖励函数的公式为：

6.根据权利要求4所述的基于d2bc-td3的机器人导航方法，其特征在于，碰撞奖励函数的公式为：<...

【专利技术属性】
技术研发人员：顾玉宛，朱一驰，张梓浩，周嵩棋，吕继东，陈滟，孟放，
申请(专利权)人：常州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人