基于GPU的相干激光雷达信号处理方法技术

技术编号:18762471 阅读:250 留言:0更新日期:2018-08-25 09:53
本发明专利技术公开了一种基于GPU的相干激光雷达信号处理方法,该发明专利技术基于英伟达公司的统一计算架构(CUDA)算法,使用显卡(GPU)并行运算代替传统相干测风激光雷达中的FPGA或DSP运算,使用CPU对GPU输出的功率谱进行保存和深入处理。相对于传统相干测风激光雷达,使用GPU运算速度更快,成本更低,可以实现实时风速反演或实时时‑频变换。将功率谱数据保存,便于使用其他算法对数据进行深度处理,以提取大气能见度、大气退偏振比等更多有用信息。

【技术实现步骤摘要】
基于GPU的相干激光雷达信号处理方法
本专利技术涉及激光雷达
,尤其涉及一种基于GPU的相干激光雷达信号处理方法。
技术介绍
精确的大气风场测量对检测大气污染,获取军事环境情报,提高航空航天安全性,提高天气预报准确性,改进气候模型等具有重大意义。测风激光雷达是风场测量的有效手段,分为直接探测测风激光雷达和相干探测测风激光雷达。直接探测测风激光雷达使用光学鉴频器,将多普勒频移信息转化为能量的相对变化,实现大气风场的测量;相干探测测风激光雷达通过大气回波信号与本振激光的相干拍频实现大气风场的测量。相干测风激光雷达基本原理如下:连续波激光器产生中心频率为υ0的线偏振光,经分光片后分为信号光和本振光,信号光经声光调制器(AOM)调制为脉冲光,并产生υM的频移,再由放大器进行功率放大,经环形器后由望远镜出射。设风场对脉冲光产生的多普勒频移为υd,则回波信号中心频率为υ0+υM+υd,回波信号与本振光两者的拍频信号经光电探测器转换为频率为υM+υd的IF电信号,再经接收机中采集卡采样和后续电路数据处理分析得到风场信息。1.5μm的全光纤相干测风激光雷达具有体积小,高测量精度,高时间和高空间分辨率等优点,是世界各国争相发展的领域。日本三菱机电有限公司报道了世界上第一台1.5μm的相干测风激光雷达。法国LEOSPHERE公司生产了可以商用的WINDCUBE相干测风激光雷达,法国航空航天研究中心(ONERA)自主研制了1.5μm相干测风激光雷达,英国SgurrEnergy推出了搭配风力发电设备使用的Galion系列相干测风激光雷达,英国QinetiQ公司开发出了ZephIR系列基于光纤技术的1.548μm脉冲相干测风激光雷达,美国国家大气研究中心(NCAR)拥有机载的基于连续激光的相干测风激光雷达(LAMS)。国内的哈尔滨工业大学姚勇课题组在2010年搭建了采用1.5μm波长连续波激光器的相干测风激光雷达。中国海洋大学在2014年报道了其研制的用于风能研究和开发利用的1.55μm相干测风激光雷达。中国电子科技集团公司第二十七研究所2010年报道了采用1.5μm连续波零差频的激光雷达,并在2013年报道了一套全光纤化的相干测风激光雷达。中国科学院上海光学精密机械研究所在2012年研制了1.064μm的相干测风激光雷达,在2014年又报道了用于边界层风廓线探测的1.54μm全光纤相干测风激光雷达。但是,以上相干测风激光雷达的接收机都使用FPGA或者DSP进行风场数据实时反演,存在以下问题:(1)通常相干激光雷达中AOM调制频率υM=80MHz,在考虑υd动态范围之后,IF电信号将达到120MHz量级。根据奈奎斯特采样定理,采样频率达到IF电信号的2倍以上,才能完整地对信号进行还原,因此相干激光雷达中,采样率通常达到250MHz以上。假设采样率Fs=500MS/s,距离分辨率为60m,每秒需进行5M个1024点的FFT计算。在计算机中,基2的1024点实数FFT理论上需要约260k次运算,在不考虑内存分配,功率谱计算,数据累积等运算,仅考虑FFT运算的情况下,后续电路数据处理速度最少应达到1.2T次浮点每秒运算能力。以TI的高端DSP芯片TMS320C6678的160G次浮点每秒的运算能力,需要8颗并行才能满足运算要求;目前最高性能的FPGA运算能力与TMS320C6678处于同一量级,因此相干接收机编程难度大,电路结构复杂。(2)TMS320C6678型号的DSP和FPGA芯片都非常昂贵,单核TMS320C6678板卡约为5000元。因此,相干接收机电路成本高昂。(3)如果提高相干激光雷达的距离分辨率,需要减小出射激光脉冲宽度,根据脉冲宽度与光谱展宽的关系,会导致回波信号功率谱的展宽。为了避免光谱重叠,需要增加AOM频移量,从而需要更高采样率的和更大计算能力的接收机。DSP或FPGA的计算能力将成为相干激光雷达发展的瓶颈。
技术实现思路
本专利技术的目的是提供一种基于GPU的相干激光雷达信号处理方法,通过使用GPU并行运算对相干拍频信号进行解调,降低了相干接收机的成本,提高了相干测风激光雷达接收机的计算能力,可以实现实时风速反演或实时时频变换,同时,使用CPU对GPU输出的功率谱进行处理,便于后续信号的深度处理,获取更多有用信息。本专利技术的目的是通过以下技术方案实现的:一种基于GPU的相干激光雷达信号处理方法,包括:步骤S1、使用cudaMalloc在GPU的显存中分配固定的输入输出数据储存空间;步骤S2、将采集卡采集的数据通过PCIE接口,使用DMA方式直接输入显存中所分配的固定的输入输出数据储存空间;步骤S3、将显存中的数据按照激光雷达的探测距离门进行预处理;步骤S4、使用CUDA中的cuFFT库创建FFT变换策略,使用GPU多线程对预处理后的数据进行并行FFT变换;步骤S5、在GPU中对变换结果取功率谱,并进行功率谱累加;步骤S6、到达累积阈值后,使用cudaHostMalloc在计算机内存中分配固定储存空间,通过PCIE接口,使用DMA方式将累加的功率谱传回至计算机分配的固定储存空间中,使用计算机内的CPU对功率谱进行处理,求得最终风场结果。由上述本专利技术提供的技术方案可以看出,使用GPU代替DSP和FPGA对相干激光雷达信号进行处理,提高了相干接收机的运算能力,降低了相干接收机的成本。同时,使用经过优化的CUDA库函数,降低了相干接收机的开发难度,此外,使用CPU对功率谱进行进一步处理,便于更多有用风场信息的提取。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。图1为本专利技术实施例提供的一种基于GPU的相干激光雷达信号处理方法的流程图;图2为本专利技术实施例提供的基于GPU的相干激光雷达系统的结构示意图。具体实施方式下面结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术的保护范围。2007年英伟达NVIDIA公司推出了统一计算设备架构(CUDA),将显卡(GPU)变成可以用作数据并行计算的设备。经过近10年的发展,CUDA技术已经大规模商用,完全兼容C/C++等常见编程语言,具有高级而完备的软件开发工具和环境,且GPU广泛用于娱乐、高性能计算领域,容易采购且性价比高。目前民用级别的GTX1080显卡,单块不足5000元,可实现9T次每秒的浮点运算能力,比TMS320C6678运算能力高50倍以上,因此,基于GPU的相干激光雷达信号处理方法具有很大优势。本专利技术实施例提供一种基于GPU的相干激光雷达信号处理方法,其特征在于,包括:步骤S1、使用cudaMalloc在显卡的显存中分配固定的输入输出数据储存空间。本专利技术实施例中,显存中分配固定的输入输出数据储存空间至少为两块,以实现采集卡高速数据流的“乒乓操作”,实现数据流的无缝传输和处理。步骤S本文档来自技高网
...

【技术保护点】
1.一种基于GPU的相干激光雷达信号处理方法,其特征在于,包括:步骤S1、使用cudaMalloc在GPU的显存中分配固定的输入输出数据储存空间;步骤S2、将采集卡采集的数据通过PCIE接口,使用DMA方式直接输入显存中所分配的固定的输入输出数据储存空间;步骤S3、将显存中的数据按照激光雷达的探测距离门进行预处理;步骤S4、使用CUDA中的cuFFT库创建FFT变换策略,使用GPU多线程对预处理后的数据进行并行FFT变换;步骤S5、在GPU中对变换结果取功率谱,并进行功率谱累加;步骤S6、到达累积阈值后,使用cudaHostMalloc在计算机内存中分配固定储存空间,通过PCIE接口,使用DMA方式将累加的功率谱传回至计算机分配的固定储存空间中,使用计算机内的CPU对功率谱进行处理,求得最终风场结果。

【技术特征摘要】
1.一种基于GPU的相干激光雷达信号处理方法,其特征在于,包括:步骤S1、使用cudaMalloc在GPU的显存中分配固定的输入输出数据储存空间;步骤S2、将采集卡采集的数据通过PCIE接口,使用DMA方式直接输入显存中所分配的固定的输入输出数据储存空间;步骤S3、将显存中的数据按照激光雷达的探测距离门进行预处理;步骤S4、使用CUDA中的cuFFT库创建FFT变换策略,使用GPU多线程对预处理后的数据进行并行FFT变换;步骤S5、在GPU中对变换结果取功率谱,并进行功率...

【专利技术属性】
技术研发人员:王冲吴云斌夏海云窦贤康
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1