基于Q学习和胸鳍相位差的仿蝠鲼机器鱼航向控制方法技术

技术编号:37299966 阅读:34 留言:0更新日期:2023-04-21 22:46
本发明专利技术涉及一种基于Q学习和胸鳍相位差的仿蝠鲼机器鱼航向控制方法,与传统的控制方法相比,本发明专利技术不需要建立控制对象模型,通过采集实验数据,离线训练Q表格,然后将表格移植到样机控制器中,通过查表的方式取得控制变量,控制样机在固定深度游动。与其他强化学习控制方法相比,其对硬件资源要求低,对空间需求小,功耗小,实现方便。其有益效果在于:对控制器的硬件要求低,普通的单片机就可以实现,除了节约成本外,还达到节约空间和节约能源的效果。节约大量时间成本。实现简单,泛化能力强,除了可以应用于仿生水下机器人外,还能应用于传统水下AUV。水下AUV。水下AUV。

【技术实现步骤摘要】
基于Q学习和胸鳍相位差的仿蝠鲼机器鱼航向控制方法


[0001]本专利技术属于水下仿生机器人智能控制领域,涉及一种基于Q学习和胸鳍相位差的仿蝠鲼机器鱼航向控制方法。

技术介绍

[0002]随着社会科学技术的发展和人类面临的日益严峻的生态环境问题,人类对海洋环境的探测和资源的开采需求日益增加。自主水下航行器(AUV)能够在近远海域水下环境监测、科学考察、水下考古、资源开发等任务,具有很好的科学和工程应用前景。仿蝠鲼水下机器鱼是一种新型的仿生AUV,相比传统的螺旋桨推进器,其具有更好的环境亲和性和高机动能力,复杂环境适应能力更强。近些年,仿生水下机器人的控制问题引起了学者们的研究兴趣和热情,相关领域的科学与技术问题也得到了极大的发展。
[0003]水下仿生机器人的控制问题是仿生机器人的难点之一,而航向控制作为姿态控制的一部分是水下仿生机器人实现其他任务的基础,是实现水下作业控制的基本要求之一。目前水下航向控制方法可以按照需不需要模型分为基于模型的方法和无模型的方法。基于模型的方法需要对控制对象建立数学模型,而仿生水下机器人的动力学模型相对于传本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于Q学习和胸鳍相位差的仿蝠鲼机器鱼航向控制方法,其特征在于步骤如下:步骤1、建立仿蝠鲼机器鱼航向控制问题的有限马尔科夫模型:1、建立航向控制的离散状态空间S:S={s

n
,s

n+1
,

,s
‑1,s0,s1,

,s
n
‑1,s
n
}其中:s

n
=(

∞,Δψ

n
],s

n+1
=(Δψ

n
,Δψ

n+1
],
……
,s
‑1=(Δψ
‑2,Δψ
‑1],s0=(Δψ
‑1,Δψ1),s1=(Δψ1,Δψ2],
……
,s
n
‑1=(Δψ
n
‑1,Δψ
n
]s
n
=(Δψ
n
,+∞]其中,Δψ
i
的取值范围可以根据实际情况调整,i∈{

n,

n+1,

,

1,0,1,

,n

1,n};2、建立离散动作空间A:仿蝠鲼机器鱼航向控制的动作空间为连续动作空间[

a
min
,+a
max
],将控制变量离散化为2n+1个动作,设离散动作空间其中:a表示动作空间的元素,代表固定的胸鳍摆动的相位差,且0≤a≤a
max
;3、设计奖励函数:其中:δ为调整仿蝠鲼机器鱼的深度控制精度的参数;所述r
t+1
为在时刻t,状态为s
t
,动作为a
t
,下一时刻状态为s
t+1
,得到的奖励;步骤2、建立动作

价值函数表格Q(s,a):步骤3、训练Q表格:1、训练数据样本:以原始深度和姿态变化数据,计算t时刻奖励函数r
t+1
(s
t
,a
t
);建立训练Q表的数据集Data
test
,设存储...

【专利技术属性】
技术研发人员:曹勇张代利潘光曹永辉黄桥高
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1