【技术实现步骤摘要】
一种基于迁移强化学习的大鼠机器人流畅控制方法
[0001]本专利技术属于大鼠机器人
,具体涉及一种基于迁移强化学习的大鼠机器人流畅性控制方法。
技术背景
[0002]动物机器人是一种新型机器人,它是集人工智能和生物智能于一体的混合智能体,不仅保留了经过自然进化的智慧生物体优势,运动灵活协调,而且分别强于独立的动物体或机器。动物机器人应用范围极广,可用于军事侦察、灾难搜救、医疗诊断等场景。作为科学研究的前沿领域,其运动控制得到了诸多学者关注。
[0003]动物机器人是动物生理学、计算机科学、控制学等多学科交叉融合的产物,原理是利用脑机接口技术将电极安装至动物大脑,通过电极背包产生电信号刺激使得动物完成指定动作。相较于传统机器人,动物机器人直接以动物身体为本体,不需额外考虑利用合金或特殊材料制造,保留了动物自身经自然进化的良好机能,在复杂环境中不用通过专门的控制算法对环境进行检测和判断,可自主实现运动和避障功能。动物机器人续航能力得到大大提升,解决了目前机器人领域电能供给的长期困扰。
[0004]由于大鼠的 ...
【技术保护点】
【技术特征摘要】
1.一种基于迁移强化学习的大鼠机器人流畅控制方法,其特征在于,通过以下方案实现:首先是基于Ensemble LSTM的环境模型构建、然后为仿真迷宫平台和仿真大鼠搭建、接着是RTRPO控制算法仿真环境训练、最后为ELSTM和RTRPO在线自适应,其中仿真迷宫平台是基于集成环境模型构建,在该环境模型中加入流畅性度量指标的限制,使用RTRPO算法来完成仿真训练任务;将ELSTM模型和RTRPO模型迁移到真实环境,通过与真实环境交互来修正ELSTM环境模型,然后通过ELSTM环境模型产生虚拟数据来帮助RTRPO模型快速完成在线自适应得到针对当前大鼠机器人的流畅控制。2.如权利要求1所述的一种基于迁移强化学习的大鼠机器人流畅控制方法,其特征在于,所述ELSTM环境模型的输入为真实大鼠的关键姿态点和当前的刺激指令信息,输出为受到刺激后真实大鼠下一时刻的关键姿态点,采用L2距离作为损失函数对ELSTM环境模型进行训练,所述关键姿态点是基于第三视角俯拍视频,通过基于差值的背景建模方法,对视频中真实大鼠机器人的关键点进行检测提取得到,设置8个二维关键点,包括头、尾巴根部、左前爪、左后爪、右前爪、右后爪、颈部中点以及脊柱中点。3.如权利要求1所述的一种基于迁移强化...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。