【技术实现步骤摘要】
本专利技术属于无人艇,具体涉及一种基于强化学习的无人艇导弹拦截和规避算法、拦截和规避系统及可读存储介质。
技术介绍
1、随着无人艇在军事、安全和应急救援等领域的应用,无人艇面临的导弹威胁也在不断增加,对导弹拦截和规避成为无人艇正常航行的关键,针对无人艇导弹拦截和规避问题,传统方法主要依赖于规则和预先设计的控制算法,这些方法难以应对导弹威胁的复杂性和不确定性,在应对复杂多变的导弹威胁时存在局限性,难以适应不同的环境和战术情景;此外,现有算法在适应不同环境和敌对策略时存在固有局限性,无法实现自主学习和优化,难以保证导弹拦截和规避的精度和效率,影响无人艇海上工作的安全性。
技术实现思路
1、基于上述问题,本专利技术提供了一种基于强化学习的无人艇导弹拦截和规避算法、拦截和规避系统及可读存储介质。
2、基于上述目的,本专利技术通过如下技术方案实现:
3、本专利技术第一方面提供一种基于强化学习的无人艇导弹拦截和规避算法,包括以下步骤:
4、s11、利用无人艇上搭载的
...【技术保护点】
1.一种基于强化学习的无人艇导弹拦截和规避算法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于强化学习的无人艇导弹拦截和规避算法,其特征在于,包括以下步骤:
3.根据权利要求2所述的基于强化学习的无人艇导弹拦截和规避算法,其特征在于,在步骤S5中,所述状态量所述动作量at=(vu′,vl′,αu′,αl′,Bl);
4.根据权利要求2所述的基于强化学习的无人艇导弹拦截和规避算法,其特征在于,在步骤S5中,局部奖励函数rst(st)为:
5.根据权利要求2所述的基于强化学习的无人艇导弹拦截和规避算法,其特征在于,
...【技术特征摘要】
1.一种基于强化学习的无人艇导弹拦截和规避算法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于强化学习的无人艇导弹拦截和规避算法,其特征在于,包括以下步骤:
3.根据权利要求2所述的基于强化学习的无人艇导弹拦截和规避算法,其特征在于,在步骤s5中,所述状态量所述动作量at=(vu′,vl′,αu′,αl′,bl);
4.根据权利要求2所述的基于强化学习的无人艇导弹拦截和规避算法,其特征在于,在步骤s5中,局部奖励函数rst(st)为:
5.根据权利要求2所述的基于强化学习的无人艇导弹拦截和规避算法,其特征在于,在步骤s7中,全局奖励函数rt(s1,a1,s2,a2,...,st)为:
6.根据权利要求2所述的基于强化学习的无人艇导弹拦截和规避算法,其特征在于,在步骤s7中,全局局部奖励函数rt(si)为:
7.根据权利要求2所述的基于强化学习的无人艇导弹拦截和规避算法,其特征在于,在步骤s5中,所述无人艇导弹拦截和规避网络模型包括actor网络和critic网络;所述actor网络的输入为状态量st,输出为动作...
【专利技术属性】
技术研发人员:刘军,孔凤杰,肖翰文,丁晓蕾,尹小丹,冯亿喆,王颖,程士豪,
申请(专利权)人:济宁学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。