【技术实现步骤摘要】
一种智能鱼流场模拟控制方法、系统、设备及存储介质
[0001]本专利技术属于仿生模拟
,具体涉及一种智能鱼流场模拟控制方法、系统、设备及存储介质。
技术介绍
[0002]对于鱼类游动的研究,目前主要有室内实验、野外勘察、数值模拟几种手段。其中,数值模拟手段大多通过计算流体力学的方法建立鱼类游动流固耦合模型,并给定运动自由度,从而模拟智能鱼的巡游游动,随着近些年来机器学习等智慧型算法的普及,对鱼类游泳行为的数值模拟又进入到了一个新的阶段。
[0003]目前,对鱼类游动大型智慧计算平台的搭建方法主要基于传统流固耦合技术和深度强化学习算法搭建,传统流固耦合模拟技术主要分为界面捕捉类方法和界面追踪类方法,界面捕捉类方法包括流体体积算法(Volume of Fluid Methods,VOF)和浸没边界法(Immersed Boundary,IB)等,界面追踪类方法包括任意拉格朗日
‑
欧拉算法(Arbitrary Lagrangian Eulerian,ALE)和变形空间域/稳定时空算法(Deforming
‑
Spatial
‑
Domain/Stabilized Space
‑
Time,DSD/SST)等。这两类方法的主要区别在于,在流固界面的计算中,界面追踪采用Lagrange坐标,而界面捕捉还吸收了Euler方法的优点,上述两种方法都可成功应用于鱼类游动大型智慧计算平台的搭建中。
[0004]深度强化学习(Deep reinfor
【技术保护点】
【技术特征摘要】
1.一种智能鱼流场模拟控制方法,其特征在于,包括:a.获取当前流场的流速特征参数和压力特征参数,通过预置流场识别系统对当前流场的流速特征参数和压力特征参数进行识别,确定当前流场的流场类型;b.根据当前流场的流场类型从动作记忆系统数据库中选取相应的摆尾频率集合;c.根据摆尾频率集合确定预置动作迁移系统的动作空间,所述动作空间包含若干动作方式;d.获取流场生境端当前时刻反馈的第一状态信息和第一奖励信息;e.将第一状态信息、第一奖励信息及动作空间导入当前的策略价值估算模型中,计算输出各动作方式的估计策略价值,并根据各动作方式的估计策略价值确定动作空间中各动作方式的概率参数信息;f.根据动作空间中各动作方式的概率参数信息确定动作空间中各动作方式的概率分布情况,并根据动作空间中各动作方式的概率分布情况随机选取其中一动作方式作为目标动作方式;g.根据目标动作方式生成相应的动作控制指令,并将动作控制指令发送至鱼体游动端。2.根据权利要求1所述的一种智能鱼流场模拟控制方法,其特征在于,在将动作控制指令发送至鱼体游动端后,所述方法还包括:h.获取流场生境端下一时刻反馈的第二状态信息和第二奖励信息;i.利用第一状态信息、目标动作方式、第二状态信息和第二奖励信息组成相应的四元组经验样本记录存储到动作记忆系统数据库中;j.从动作记忆系统数据库中提取若干连续记录的四元组经验样本对策略价值估算模型进行训练,得到训练后的策略价值估算模型;k.将训练后的策略价值估算模型更新为当前的策略价值估算模型,并重复步骤d至步骤j,形成闭环控制。3.根据权利要求2所述的一种智能鱼流场模拟控制方法,其特征在于,所述摆尾频率集合包含若干摆尾频率[ω1,ω2,ω3...ω
n
],所述动作迁移系统的动作空间为[a
accelerate
,a
cruise
,a
decelerate
],其中,a
accelerate
表征加速动作方式,a
cruise
表征巡航动作方式,a
decelerate
表征减速动作方式。4.根据权利要求3所述的一种智能鱼流场模拟控制方法,其特征在于,所述第一状态信息包括当前的游动摆尾频率ω
t
,在ω
t
=ω
max
时,所述动作迁移系统的动作空间为[0,a
cruise
,a
decelerate
],在ω
t
=ω
min
时,所述动作迁移系统的动作空间为[a
accelerate
,a
cruise
,0],其中,ω
max
为[ω1,ω2,ω3...ω
n
]中的最大摆尾频率,ω
min
为[ω1,ω2,ω3...ω
n<...
【专利技术属性】
技术研发人员:张春泽,李涛,侯极,张湛,彭培艺,马倩,周勤,米家杉,谢灵运,
申请(专利权)人:重庆西科水运工程咨询有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。