一种海射火箭子级回收方法、设备及存储介质技术

技术编号：40648132 阅读：8 留言：0更新日期：2024-03-13 21:27

本发明专利技术公开了一种海射火箭子级回收方法、设备及存储介质，属于火箭控制技术领域，海射火箭子级回收方法包括：建立海射火箭子级回收模型，并定义优化目标；使用强化学习算法对模型进行训练和优化，使用遗传编程算法对回收轨迹进行搜索和优化，将强化学习算法与遗传编程算法进行融合，将状态信息作为海射火箭子级回收模型的输入，计算并输出动作空间，指导和控制火箭子级回收过程中的行为和决策。本发明专利技术能够对搜索空间进行全面的探索，确保找到最优的回收策略，避免局部最优解的限制，有效解决海面发射子级回收中的复杂决策问题，从而提高回收的成功率和可行性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及火箭控制，特别涉及一种海射火箭子级回收方法、设备及存储介质。

技术介绍

1、海射火箭子级回收技术融合了海面发射和火箭子级回收的优势，具有多方面的技术和经济优势。海洋作为发射平台可以扩大发射范围，避免了对特定地理条件的依赖。这意味着可以根据任务需求选择最佳的发射位置，并在全球范围内进行发射，以适应不同的任务要求和发射时间窗口。此外，由于海洋面积较大，火箭可以更容易地保持安全距离，并减少对人口稠密区域的风险。发射噪音和排放物也可以更好地分散在海洋环境中，减少对人类和自然生态系统的干扰。同时，海射火箭子级回收技术可以实现火箭子级的重复使用，降低航天任务的成本。火箭子级回收后可以进行检查、维修和再利用，避免了每次发射都需要新的子级的成本。

2、但是，海洋环境的不稳定性和多变性给火箭子级回收带来了巨大挑战。海浪、风力、洋流等因素的干扰使得火箭子级的飞行轨迹规划和控制变得更加困难，导致着陆精度和稳定性难以保证。

3、此外，海洋环境的复杂性使得火箭子级的轨迹规划和着陆区域选择变得非常具有挑战性。现有技术往往无法充分考虑海洋环境的特点和变化，导致着陆区域的选择不理想，进而影响回收的成功率和安全性。

4、有鉴于此，实有必要提供一种新的技术方案以解决上述问题。

技术实现思路

1、为解决上述技术问题，本申请提供一种海射火箭子级回收方法、设备及存储介质，能够对搜索空间进行全面的探索，确保找到最优的回收策略，避免局部最优解的限制，有效解决海面发射子级回收中的

2、一种海射火箭子级回收方法，其特征在于，包括：

3、建立海射火箭子级回收模型，并定义优化目标；

4、使用强化学习算法对海射火箭子级回收模型进行训练和优化；

5、使用遗传编程算法对回收轨迹进行搜索和优化；

6、将强化学习算法与遗传编程算法进行融合；

7、确定海射火箭子级回收中的状态信息表示和动作空间,将状态信息作为海射火箭子级回收模型的输入，计算并输出动作空间，用于指导和控制火箭子级回收过程中的行为和决策。

8、优选的，所述在建立海射火箭子级回收模型中包括：

9、基于神经网络将火箭子级回收过程中涉及的相关参数和变量进行建模和表示；

10、对火箭子级回收过程中可以采取的操作和控制动作进行定义；

11、定义状态转移函数描述火箭子级在不同状态下执行特定动作后的状态转移规律；

12、根据目标任务和优化目标，定义一个评估子级回收行为的奖励函数；

13、定义用于确定子级回收过程结束的终止条件。

14、优选的，所述火箭子级回收过程中涉及的相关参数包括子级位置、速度、姿态、燃料消耗和环境条件。

15、优选的，所述使用强化学习算法对海射火箭子级回收模型进行训练和优化包括：

16、初始化神经网络权重和经验回放缓冲区；

17、设置初始状态；

18、分别重置环境状态、步数和累计奖励；

19、根据策略探索方法从状态中选择动作；

20、观察环境返回的新状态，奖励，执行选择的动作；

21、将经验存储到经验回放缓冲区；

22、从经验回放缓冲区中随机采样训练样本；

23、计算目标q值；

24、更新神经网络的权重和当前状态，增加步数和累计奖励，重复训练过程，直至满足预设训练轮数；

25、输出训练轮数、累计奖励、步数等结果信息；

26、返回训练后的神经网络模型。

27、优选的，所述使用遗传编程算法对回收轨迹进行搜索和优化包括：

28、初始化种群；

29、计算每个个体的适应度值，通过评估子级设计的性能指标，来确定适应度；

30、选择一定数量的个体作为父代个体；

31、对父代个体进行交叉操作，产生新的子代个体；

32、对子代个体进行变异操作，引入随机的基因变化；

33、产生的子代个体与父代个体合并，形成新一代的种群：

34、进行多轮种群更新直至满足收敛条件，获得最终种群；

35、从最终的种群中选择适应度最高的个体作为最优解，实现更高的回收着陆成功率和精度。

36、优选的，所述将强化学习算法与遗传编程算法进行融合包括：

37、确定强化学习算法和遗传编程算法之间的信息交互方式；

38、确定强化学习算法与遗传编程算法之间的信息传递机制；

39、确定强化学习算法和遗传编程算法之间的协同工作方式；

40、确定利用遗传编程算法生成新个体，并将其融入强化学习算法中的策略；

41、设定用于监控和控制两个算法之间交互和信息传递的参数。

42、优选的，所述状态信息表示为将火箭子级的状态信息进行编码和表示，以构成问题的状态空间；所述火箭子级的状态信息包括位置、速度、姿态、感知端数据。

43、优选的，所述优化目标包括最大化回收成功率以及最小化着陆误差或最小化资源消耗量。

44、根据本申请的另一方面，还提供一种计算设备包括：处理器、存储有计算机程序的存储器，所述计算机程序被处理器运行时，执行所述的海射火箭子级回收方法。

45、根据本申请的另一方面，还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机指令，当所述指令在计算机上运行时，使得计算机执行所述的海射火箭子级回收方法。

46、与现有技术相比，本申请至少具有以下有益效果：

47、1、本专利技术能够对不同的姿态、轨迹和着陆点进行广泛搜索可能的解空间，通过强化学习和遗传编程的组合，可以对搜索空间进行全面的探索，确保找到最优的回收策略。这种搜索空间探索能够有效保护问题解的多样性，避免局部最优解的限制，有效解决海面发射子级回收中的复杂决策问题，从而提高回收的成功率和可行性。

48、2、本专利技术的混合优化算法具有强大的适应性，能够通过强化学习学习环境模型和策略，及时调整控制策略以适应不同的海洋环境变化。这种适应性能够提高回收系统的稳定性和鲁棒性，确保回收过程的可靠性。

本文档来自技高网...

【技术保护点】

1.一种海射火箭子级回收方法，其特征在于，包括：

2.如权利要求1所述的海射火箭子级回收方法，其特征在于，所述在建立海射火箭子级回收模型包括：

3.如权利要求2所述的海射火箭子级回收方法，其特征在于，所述火箭子级回收过程中涉及的相关参数包括子级位置、速度、姿态、燃料消耗和环境条件。

4.如权利要求3所述的海射火箭子级回收方法，其特征在于，所述使用强化学习算法对海射火箭子级回收模型进行训练和优化包括：

5.如权利要求1所述的海射火箭子级回收方法，其特征在于，所述使用遗传编程算法对回收轨迹进行搜索和优化包括：

6.如权利要求1所述的海射火箭子级回收方法，其特征在于，所述将强化学习算法与遗传编程算法进行融合包括：

7.如权利要求1所述的海射火箭子级回收方法，其特征在于，所述状态信息表示为将火箭子级的状态信息进行编码和表示，以构成问题的状态空间；所述火箭子级的状态信息包括位置、速度、姿态、感知端数据。

8.如权利要求1所述的海射火箭子级回收方法，其特征在于，所述优化目标包括最大化回收成功率以及最小化着陆误差或最小化资源消耗量。

9.一种计算设备，其特征在于，包括：处理器、存储有计算机程序的存储器，所述计算机程序被处理器运行时，执行如权利要求1至8任一项所述的海射火箭子级回收方法。

10.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机指令，当所述指令在计算机上运行时，使得计算机执行如权利要求1至8任一项所述的海射火箭子级回收方法。

...

【技术特征摘要】

1.一种海射火箭子级回收方法，其特征在于，包括：

2.如权利要求1所述的海射火箭子级回收方法，其特征在于，所述在建立海射火箭子级回收模型包括：

4.如权利要求3所述的海射火箭子级回收方法，其特征在于，所述使用强化学习算法对海射火箭子级回收模型进行训练和优化包括：

5.如权利要求1所述的海射火箭子级回收方法，其特征在于，所述使用遗传编程算法对回收轨迹进行搜索和优化包括：

6.如权利要求1所述的海射火箭子级回收方法，其特征在于，所述将强化学习算法与遗传编程算法进行融合包括：

【专利技术属性】
技术研发人员：王健，布向伟，彭昊旻，姚颂，魏凯，于继超，郭文正，马向明，李凌云，
申请(专利权)人：东方空间技术山东有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人