【技术实现步骤摘要】
基于自学习的船舶协同控制方法
[0001]本专利技术涉及多智能体协同
,尤其涉及基于自学习的船舶协同控制方法。
技术介绍
[0002]自上世纪80年代以来,受生物学、人类社会学研究的启发,多个体协调控制成为众多领域的研究热点。类似于鱼群捕食、鸟群迁徙等生物与人类社会中的群体性优势,多个体之间的协调与合作将大大提高个体行为的智能化程度,更好地完成很多单个个体无法完成的工作,并具有高效率,高容错性和内在的并行性等优点。时至今日,多个体协调控制技术已在无线传感器网络、多机械臂协同装配、无人机、卫星、集群航天器深空探测等领域得到广泛应用。
[0003]随着对海洋资源的不断开发,我们逐渐从浅海域向深海域跃进,并对海上作业的效率和对海洋资源开发的自动化程度提出了更高的要求,从而多艘船舶的协同在民用和军事作业的应用也越来越广泛。相比于单艘船舶作业,多艘船舶相互协调作业有着许多潜在的优势:可以提高执行某作业的效率;完成海上比较复杂的任务,而这些任务有可能是单艘船根本无法完成的;可以改善作业的性能;并且能避免操纵员因作业的高难度 ...
【技术保护点】
【技术特征摘要】
1.基于自学习的船舶协同控制策略优化方法,其特征在于:包括以下步骤:步骤S10,利用输入模块获取该多智能体系统当中每个船舶的参数,船舶的期望运行轨迹等,然后对多智能体系统当中的每个船舶进行数学建模;步骤S20,利用参数及网络初始化模块、网络权值赋值模块和全局循环模块,开启全局循环,在当前局部最优控制策略、局部最优性能指标通过叠加随机赋值的方法初始化所述评价网络的权值;步骤S30,利用网络训练模块和局部循环模块,开启局部循环,基于初始化的相关参数,通过自适应动态规划方法训练权值赋值后的评价网络,向网络最小化误差函数梯度下降方向迭代进行网络权值的更新直至达到预设的局部循环次数,获得迭代控制律,通过局部循环后获取局部最优控制策略、局部最优性能指标函数;步骤S40,以所述迭代控制律、局部最优性能指标函数替代当前迭代控制律、性能指标函数,并重复执行步骤S20-步骤S40直至网络满足收敛精度,则该船舶的控制策略优化完成,利用输出模块获取船舶协同控制策略,开始进行下一个船舶的控制策略的优化。2.根据权利要求1所述的基于自学习的船舶协同控制策略优化方法,其特征在于:所述网络收敛精度为1.0
×
10
‑5。3.根据权利要求1所述的基于自学习的船舶协同控制策略优化方法,其特征在于:步骤S20“通过随机赋值的方法初始化所述动作网络、评价网络的权值”,其方法为:在设定的范围(
‑
0.1,0.1)内,采用随机赋值的方法进行所述动作网络、评价网络的权值...
【专利技术属性】
技术研发人员:黄百乔,鞠鸿彬,张鹏翼,王坤福,闫丹,闫钰天,朱振华,魏庆来,
申请(专利权)人:中国船舶工业系统工程研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。