一种基于嵌入式GPU和FPGA异构的实时成像处理系统及方法技术方案

技术编号:38201953 阅读:11 留言:0更新日期:2023-07-21 16:45
本发明专利技术公开了一种基于嵌入式GPU和FPGA异构的高帧率实时成像处理系统及方法,将信号的产生和采集部分在FPGA上实施,而将可并行计算的实时成像处理部分在嵌入式GPU上进行加速处理。本发明专利技术结合FPGA的高数据吞吐率和嵌入式GPU的并行计算优势,有效提升成像效率;可以实现不小于10Hz的实时成像帧率,能够满足视频SAR实时成像的要求。SAR实时成像的要求。SAR实时成像的要求。

【技术实现步骤摘要】
一种基于嵌入式GPU和FPGA异构的实时成像处理系统及方法


[0001]本专利技术属于SAR成像系统
,涉及一种基于嵌入式GPU和FPGA异构的实时成像处理系统及方法。

技术介绍

[0002]合成孔径雷达(Synthetic Aperture Radar,SAR)通过发射宽带调频信号和脉冲压缩技术获得距离向的高分辨率,通过合成孔径技术获得方位向的高分辨率,具有全天时、全天候的工作特点,广泛应用于军事侦察、灾害监测、资源勘查和环境保护等重要领域。
[0003]由于传统的SAR成像的帧率较低,因此无法区分场景中的静止目标和运动目标,也无法获得运动目标的轨迹和速度,对于运动目标的检测具有一定的局限性。随着视频SAR成像的提出,这一问题得以解决。视频SAR系统通过对目标区域的持续监测,将场景目标的回波数据进行成像处理,最终以连续帧的图像进行呈现,可以有效反映出场景区域的变化情况。
[0004]对于视频SAR成像的研究,如何获取更高的成像帧率是一个重要的研究方向。视频SAR成像系统的特点是数据吞吐率大、成像帧率高,这对成像算法流程和成像处理平台的选取都提出了非常高的要求。对于成像帧率的提升,不仅需要对成像算法流程进行优化,还需要选取合适的实时成像处理平台,并在成像处理平台上对算法的进行优化以获取最大的实时处理性能,从而达到更高的成像帧率。
[0005]目前主流的实时信号处理平台主要包括CPU、DSP、FPGA和GPU。CPU的主频高,但是串行计算的特点使其无法提供足够的处理性能;DSP的运算资源有限,且工作主频较低无法实现高速率的并行计算;基于FPGA的处理系统是目前应用最广泛的实时信号处理平台,不仅可以进行并行计算且功耗非常低,数据的吞吐率也很高,但是其进行浮点运算占用的资源更多,且对于时钟频率的提升较困难,如果进行大量并行计算其有限的计算资源很难满足要求,性能的提升需要和受限的计算资源之间需要进行平衡,因此开发周期较长。
[0006]GPU是专用于高性能计算的处理平台,具有成百上千个处理核心使其非常适合于并行度高且计算复杂度高的计算任务,且开发周期较短。但是传统的GPU体积和功耗较高,难以应用于实时成像处理领域,且与CPU之间采用离散架构,需要通过PCIE总线进行通信,对于较大数据的吞吐存在瓶颈。
[0007]近年来,随着采用集成架构的嵌入式GPU的出现,为实时信号处理领域提供了新平台。嵌入式GPU具有高性能低功耗的特点,不仅具有传统GPU的并行计算的优势,还克服了CPU和GPU之间的通信瓶颈,在实时信号处理领域具有非常好的应用前景。在嵌入式GPU上实施视频SAR成像算法,不仅需要对整个成像算法的流程进行优化,还需要对计算过程中的内存和并行计算的性能进行优化,才能够满足视频SAR成像对高帧率高分辨的成像要求。
[0008]现有技术采用在FPGA作为视频SAR实时成像处理平台时,由于视频SAR原始数据量大和处理流程复杂的特点,而浮点运算在FPGA上占用的资源较多,因此FPGA的并行处理能力会受限于资源的占用,很难提升成像帧率。GPU的峰值性能远远高于FPGA平台,虽然FPGA
平台可以通过架构优化来弥补运行速度上的优势,但是对于SAR成像的大量可并行计算的特点,GPU更适合做加速处理。传统的GPU平台多用于地面加速处理,由于体积和功耗的原因,无法应用于实时处理领域。

技术实现思路

[0009]本专利技术解决的问题在于提出了一种基于嵌入式GPU和FPGA异构的高帧率视频SAR实时成像处理系统及方法,基于FPGA和嵌入式GPU的处理优势以及视频SAR实时成像的处理流程,可以实现不小于10Hz的视频SAR实时成像帧率。
[0010]本专利技术是通过以下技术方案来实现:
[0011]一种基于嵌入式GPU和FPGA异构的高帧率视频SAR实时成像处理系统,包括处理雷达信号FPGA信号产生/采集模块,其将处理得到的零中频基带信号通过PCIE总线,发送至嵌入式GPU实时信号处理模块进行SAR实时成像处理;
[0012]所述FPGA信号产生/采集模块包括分别与FPGA相连接并由其控制的信号产生部分和信号采集部分,信号产生部分包括DDS信号产生模块和数模转换模块,信号采集部分包括模数转换、数字下变频模块和DDR3模块;
[0013]嵌入式GPU实时信号处理模块包括设备端和主机端;设备端包括并行运行的处理零中频基带信号实时成像的RD部分、进行运动误差估计与补偿的MD部分;主机端处理雷达参数的生成部分。
[0014]所述信号产生部分通过DDS信号产生模块产生宽带线性调频信号,由数模转换模块将宽带线性调频信号由数字信号转换为中频模拟信号;
[0015]雷达发射机将中频模拟信号处理并将辐射到观测区域;雷达接收机接收到回波信号并进行下变频处理,得到中频模拟信号;
[0016]所述信号采集部分通过模数转换模块将中频模拟信号转换为数字信号,由数字下变频处理模块将数字信号经数字下变频处理得到零中频基带信号;
[0017]零中频基带信号分为相同的两路数据,一路通过PCIE总线传输到嵌入式GPU实时信号处理模块进行实时成像处理;另一路发送至DDR3模块并行存储。
[0018]所述的嵌入式GPU实时信号处理模块集成架构,CPU和GPU共享同一块物理内存空间,并使用统一内存管理的方式开辟内存空间;采用矩阵转置使内存访问过程中达到合并内存访问;采用共享内存以及内存填充优化全局内存的访问。
[0019]一种基于嵌入式GPU和FPGA异构的高帧率视频SAR实时成像处理方法,由FPGA信号产生/采集模块处理雷达信号并生成零中频基带信号,通过PCIE总线发送至嵌入式GPU处理模块;由嵌入式GPU处理模块并行运行距离

多普勒算法处理视频SAR初步成像、图像偏移算法处理运动误差的补偿;其中,距离

多普勒算法生成视频SAR初步成像后,先将成像结果进行截取,在不损失精度的前提下降低运算量,然后进行运动误差补偿,再经过方位向去斜处理后得到最终的成像结果;
[0020]嵌入式GPU处理模块采用集成架构,CPU和GPU共享同一块物理内存空间;在嵌入式GPU中使用统一内存管理的方式为原始数据开辟内存空间;核函数计算后采用原位输出。
[0021]与现有技术相比,本专利技术具有以下有益的技术效果:
[0022]本专利技术提出的基于嵌入式GPU和FPGA异构的视频SAR高帧率实时成像处理系统,将
信号产生和采集部分在FPGA上实施,而实时成像处理部分在嵌入式GPU上实现,结合FPGA高数据吞吐以及高速接口丰富和嵌入式GPU并行计算的优势,两个平台的体积和功耗都能满足实时成像处理平台的要求,二者通过PCIE总线进行通信,能够有效提升视频SAR实时成像处理的成像帧率。本专利技术所提出的基于嵌入式GPU和FPGA异构的视频SAR实时成像处理系统具有实时性更好和开发周期更短的优势,可以有效提升视频SAR实时成像系统的成像帧率。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于嵌入式GPU和FPGA异构的高帧率视频SAR实时成像处理系统,其特征在于,包括处理雷达信号FPGA信号产生/采集模块,其将处理得到的零中频基带信号通过PCIE总线,发送至嵌入式GPU实时信号处理模块进行SAR实时成像处理;所述FPGA信号产生/采集模块包括分别与FPGA相连接并由其控制的信号产生部分和信号采集部分,信号产生部分包括DDS信号产生模块和数模转换模块,信号采集部分包括模数转换、数字下变频模块和DDR3模块;嵌入式GPU实时信号处理模块包括设备端和主机端;设备端包括并行运行的处理零中频基带信号实时成像的RD部分、进行运动误差估计与补偿的MD部分;主机端处理雷达参数的生成部分。2.如权利要求1所述的基于嵌入式GPU和FPGA异构的高帧率视频SAR实时成像处理系统,其特征在于,所述信号产生部分通过DDS信号产生模块产生宽带线性调频信号,由数模转换模块将宽带线性调频信号由数字信号转换为中频模拟信号;雷达发射机将中频模拟信号处理并将辐射到观测区域;雷达接收机接收到回波信号并进行下变频处理,得到中频模拟信号;所述信号采集部分通过模数转换模块将中频模拟信号转换为数字信号,由数字下变频处理模块将数字信号经数字下变频处理得到零中频基带信号;零中频基带信号分为相同的两路数据,一路通过PCIE总线传输到嵌入式GPU实时信号处理模块进行实时成像处理;另一路发送至DDR3模块并行存储。3.如权利要求1所述的基于嵌入式GPU和FPGA异构的高帧率视频SAR实时成像处理系统,其特征在于,所述的嵌入式GPU实时信号处理模块集成架构,CPU和GPU共享同一块物理内存空间,并使用统一内存管理的方式开辟内存空间;采用矩阵转置使内存访问过程中达到合并内存访问;采用共享内存以及内存填充优化全局内存的访问。4.一种基于嵌入式GPU和FPGA异构的高帧率视频SAR实时成像处理方法,其特征在于,由FPGA信号产生/采集模块处理雷达信号并生成零中频基带信号,通过PCIE总线发送至嵌入式GPU处理模块;由嵌入式GPU处理模块并行运行距离

多普勒算法处理视频SAR初步成像、图像偏移算法处理运动误差的补偿;其中,距离

多普勒算法生成视频SAR初步成像后,先将成像结果进行截取,在不损失精度的前提下降低运算量,然后进行运动误差补偿,再经过方位向去斜处理后得到最终的成像结果;嵌入式GPU处理模块采用集成架构,CPU和GPU共享同一块物理内存空间;在嵌入式GPU中使用统一内存管理的方式为原始数据开辟内存空间;核函数计算后采用原位输出。5.如权利要求4所述的基于嵌入式GPU和FPGA异构的高帧率视频SAR实时成像处理方法,其特征在于,所述距离

多普勒算法处理包括以下操作:1)调用CUDA中的cuFFT库函数对原始数据进行一维距离向傅里叶变换,将待处理信号进行距离向FFT处理;其中仅在第一次调用cuFFT函数时配置,而在最后一次调用cuFFT函数后进行销毁;2)设置第一核函数并通过其并行计算距离向FFT后的数据与距离向去斜函数相乘;并在核函数中建立线程索引映射到矩阵坐标上;3)将距离向去斜处理后的数据进行截取,截取后的数据执行距离向FFT处理;4)设置第二核函数并通过其并行计算距离走动矫正与惯导补偿因子与距离向FFT处理
后的相乘结果;5)设置矩阵转置核函数,将第二核函数的输出数据由按照距离向连续排列转置为按照方位向连续排列;在矩阵转置中使用共享内存,将共享内存中的数据按照转置后的索引输出到转置后的矩阵中;6)将转置...

【专利技术属性】
技术研发人员:刘冬张富利杨真郭文伟周静波
申请(专利权)人:西安辉道电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1