System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于强化学习的天线抗风扰调控方法、系统、设备及存储介质技术方案_技高网

基于强化学习的天线抗风扰调控方法、系统、设备及存储介质技术方案

技术编号:40467783 阅读:10 留言:0更新日期:2024-02-22 23:22
本发明专利技术公开了一种基于强化学习的天线抗风扰调控方法、系统、设备及存储介质,通过天线反射面、反射副面关键节点的位置信息及天线最佳吻合抛物面方程分别求出反射面促动器调整量、天线俯仰角调整量及反射副面平台调整量,并将天线俯仰角调整量输入至已训练好的天线俯仰角控制模型中,输出天线俯仰角调整信号,将反射面促动器调整量输入至已训练好的天线反射面促动器控制模型中,输出天线反射面促动器调整信号,利用已训练好的天线俯仰角控制模型及已训练好的天线反射面促动器控制模型分别实现对天线俯仰角控制系统及天线反射面促动器控制系统的调整,具有良好的抗干扰能力,确保天线在受到风扰时仍能保持良好的指向和增益性能。

【技术实现步骤摘要】

本专利技术属于大口径天线变形调控领域,具体涉及一种基于强化学习的天线抗风扰调控方法、系统、设备及存储介质


技术介绍

1、良好的主副面伺服控制系统是解决大型反射面天线在复杂环境下提升天线电性能的关键技术。现如今高性能大型反射面天线控制系统往往包括方位俯仰伺服、主动副反射面和主动主反射面三个子控制系统。然而当前三个子控制系统工作往往是分离的,未考虑大型天线主副面伺服系统在天线调控时的可调可控性问题,未合理有效分配不同状态下各个系统之间如何调整。而风载荷相较于重力、温度载荷具有时变性和随机性,很难像缓变载荷一样建立查表法进行补偿,风扰是大型反射面天线环境载荷中最复杂、最难以补偿的问题。

2、反射面天线调控发展到现今,一直是工业界、学术界研究的重要话题,已经是个多学科交叉的技术,对此,相关学者提出了许多方法。最传统的控制方法是pid控制,但是pid控制器已不能满足大型反射面天线高精度控制的需求。gawronski针对nasa-dsn深空网络天线x波段和ka波段进行了pi、lqg、h∞三种控制器实验,研究证明了pi算法虽然简单可靠,但其性能已无法满足高频段的要求,lqg和h∞虽然能够提高天线伺服系统的传动性能,但由于硬件制约,其控制效果不是很理想。

3、虽然各种控制方法试图降低算法对模型精度的依赖程度,但基于模型的控制方法不可避免的受到模型误差的影响,不可能建立准确的模型。近年来随着人工智能的快速发展,结合人工智能和自动控制的新型算法是控制领域的发展趋势。


技术实现思路

1、本专利技术的目的在于提供一种基于强化学习的天线抗风扰调控方法、系统、设备及存储介质,以克服现有技术反射面天线控制系统抗风扰建模困难,精度低的问题。

2、为达到上述目的,本专利技术采用如下技术方案:

3、一种基于强化学习的天线抗风扰调控方法,包括以下步骤:

4、获得天线变形后反射面、反射副面关键节点的位置信息,建立天线最佳吻合抛物面方程;

5、根据天线最佳吻合抛物面方程与反射面关键节点位置信息,得到反射面促动器调整量及天线俯仰角调整量;

6、根据反射副面关键节点位置信息与天线最佳吻合抛物面方程,得到反射副面平台调整量;

7、将天线俯仰角调整量输入至已训练好的天线俯仰角控制模型中,输出天线俯仰角调整信号,将反射面促动器调整量输入至已训练好的天线反射面促动器控制模型中,输出天线反射面促动器调整信号;

8、根据得到的反射副面调整量、天线俯仰角调整信号及天线反射面促动器调整信号对天线进行调整。

9、进一步的,所述预先训练好的天线反射面促动器控制模型及天线俯仰角控制模型为通过仿真训练获得的天线反射面促动器控制模型及天线俯仰角控制模型,所述天线反射面促动器控制模型及天线俯仰角控制模型均采用ddpg模型。

10、进一步的,所述天线变形后反射面、反射副面关键节点的位置信息通过布置在天线上的位移传感器获得。

11、进一步的,所述天线最佳吻合抛物面通过反射面关键节点位置信息拟合得到,天线最佳吻合抛物面方程为:

12、

13、式中,x、y为最佳吻合抛物面横、纵坐标,δx、δy、δz分别为天线最佳吻合抛物面顶点与理想抛物面顶点之间的相对位移量,φx、φy分别为最佳吻合抛物面相对于理想抛物面方位、俯仰轴的转动量,δf为焦距的变化。

14、进一步的,所述反射面促动器调整量公式为:

15、

16、其中,p1(x0,y0,z0)为变形后节点的真实坐标,p0(x0′,y0′,z0′)为最佳吻合抛物面上与之相对应的关键节点的坐标。

17、进一步的,所述天线俯仰角的调整量为:

18、δφy=-φy+δθ

19、其中,θ指的是俯仰角调整前角度,θ′指的是俯仰角调整后角度。

20、进一步的,所述根据反射副面调整量通过stewart平台将反射副面调整至最佳匹配位置处,所述最佳匹配位置处反射主面与反射副面焦点重合且焦轴重合,反射副面可以通过平移、旋转操作移动到最佳匹配位置。

21、一种基于强化学习的天线抗风扰调控系统,包括:

22、获取模块:用于获得天线变形后反射面、反射副面关键节点的位置信息,建立天线最佳吻合抛物面方程;

23、计算模块:用于根据天线最佳吻合抛物面方程与反射面关键节点位置信息,得到反射面促动器调整量及天线俯仰角调整量,根据反射副面关键节点位置信息与天线最佳吻合抛物面方程,得到反射副面平台调整量;

24、调整信号输出模块:用于将天线俯仰角调整量输入至已训练好的天线俯仰角控制模型中,输出天线俯仰角调整信号,将反射面促动器调整量输入至已训练好的天线反射面促动器控制模型中,输出天线反射面促动器调整信号;

25、调整模块:用于根据得到的反射副面调整量、天线俯仰角调整信号及天线反射面促动器调整信号对天线进行调整。

26、一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现基于强化学习反射面天线抗风扰调控方法的步骤。

27、一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现基于强化学习反射面天线抗风扰调控方法的步骤。

28、与现有技术相比,本专利技术具有以下有益的技术效果:

29、本专利技术一种基于强化学习的天线抗风扰调控方法,通过获取天线受到风扰后的天线变形后反射面、反射副面关键节点的位置信息并建立天线最佳吻合抛物面方程,并根据天线反射面、反射副面关键节点的位置信息及天线最佳吻合抛物面方程分别求出反射面促动器调整量、天线俯仰角调整量及反射副面平台调整量,并将天线俯仰角调整量输入至已训练好的天线俯仰角控制模型中,输出天线俯仰角调整信号,将反射面促动器调整量输入至已训练好的天线反射面促动器控制模型中,输出天线反射面促动器调整信号,利用已训练好的天线俯仰角控制模型及已训练好的天线反射面促动器控制模型分别实现对天线俯仰角控制系统及天线反射面促动器控制系统的调整,通过多系统调控策略能应对各种复杂的环境工况,具有良好的抗干扰能力,确保天线在受到风扰时仍能保持良好的指向和增益性能。

30、进一步的,强化学习通过动态的环境数据集,经过大量的训练来探索环境、从环境中学习,从而确定生成最优结果的最佳调整策略。实时分配各子系统的调整量,实现对天线形面变形直接补偿及对高频指向误差的快速补偿,以达到快速综合补偿大型反射面天线电性能的目的。

本文档来自技高网
...

【技术保护点】

1.一种基于强化学习的天线抗风扰调控方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于强化学习的天线抗风扰调控方法,其特征在于,所述预先训练好的天线反射面促动器控制模型及天线俯仰角控制模型为通过仿真训练获得的天线反射面促动器控制模型及天线俯仰角控制模型,所述天线反射面促动器控制模型及天线俯仰角控制模型均采用DDPG模型。

3.根据权利要求1所述的基于强化学习的天线抗风扰调控方法,其特征在于,所述天线变形后反射面、反射副面关键节点的位置信息通过布置在天线上的位移传感器获得。

4.根据权利要求1所述的基于强化学习的天线抗风扰调控方法,其特征在于,所述天线最佳吻合抛物面通过反射面关键节点位置信息拟合得到,天线最佳吻合抛物面方程为:

5.根据权利要求1所述的基于强化学习的天线抗风扰调控方法,其特征在于,所述反射面促动器调整量公式为:

6.根据权利要求1所述的基于强化学习的天线抗风扰调控方法,其特征在于,所述天线俯仰角的调整量为:

7.根据权利要求1所述的基于强化学习的天线抗风扰调控方法,其特征在于,所述根据反射副面调整量通过Stewart平台将反射副面调整至最佳匹配位置处,所述最佳匹配位置处反射主面与反射副面焦点重合且焦轴重合,反射副面可以通过平移、旋转操作移动到最佳匹配位置。

8.一种基于强化学习的天线抗风扰调控系统,其特征在于,包括:

9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7任一项所述基于强化学习反射面天线抗风扰调控方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述基于强化学习反射面天线抗风扰调控方法的步骤。

...

【技术特征摘要】

1.一种基于强化学习的天线抗风扰调控方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于强化学习的天线抗风扰调控方法,其特征在于,所述预先训练好的天线反射面促动器控制模型及天线俯仰角控制模型为通过仿真训练获得的天线反射面促动器控制模型及天线俯仰角控制模型,所述天线反射面促动器控制模型及天线俯仰角控制模型均采用ddpg模型。

3.根据权利要求1所述的基于强化学习的天线抗风扰调控方法,其特征在于,所述天线变形后反射面、反射副面关键节点的位置信息通过布置在天线上的位移传感器获得。

4.根据权利要求1所述的基于强化学习的天线抗风扰调控方法,其特征在于,所述天线最佳吻合抛物面通过反射面关键节点位置信息拟合得到,天线最佳吻合抛物面方程为:

5.根据权利要求1所述的基于强化学习的天线抗风扰调控方法,其特征在于,所述反射面促动器调整量公式为:

6.根据权利要求1所述的基...

【专利技术属性】
技术研发人员:李宁王晓洁彭海波马元元程杰张坤杨佩李桐李凯胜
申请(专利权)人:西安微电子技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1