基于并行运算的非下采样轮廓波变换优化方法技术

技术编号：19592993 阅读：19 留言：0更新日期：2018-11-28 04:45

本发明专利技术公开了一种基于并行运算的非下采样轮廓波变换优化方法，包括以下步骤(1)根据GPU和CPU配置情况，计算执行NSCT算法中多尺度分解与不同级别方向分解所需要启用的GPU数目和开启的CPU线程数，以及分配给每个GPU的实际计算量；(2)对NSCT分解与重构过程进行并行性分析，发现可以将图像数据移动至GPU，计算卷积，计算结果回存等过程进行并行处理；(3)使用OpenMP和CUDA并行执行NSCT分解和重构过程。本发明专利技术方法可以通过并行执行数据移动、像素级并行计算卷积等过程，显著提高NSCT运算速度，降低运行时间，提高NSCT算法的实用性。

全部详细技术资料下载

【技术实现步骤摘要】
基于并行运算的非下采样轮廓波变换优化方法
本专利技术涉及一种图像的多尺度几何分析方法尤其涉及一种基于并行运算的非下采样轮廓波变换优化的方法，属于图像图像处理

技术介绍
随着数字图像处理技术，多尺度几何分析等方法的广泛研究，多种基于多尺度几何分析的变换方法相继发展起来。其中最具代表性的变换为Contourlet变换(轮廓波变换)，该变换的优势是其基函数分布在多尺度、多方向上，用少量的变换系数就可以有效地捕捉图像的边缘轮廓，弥补了小波变换无法高效地表示图像边缘信息的缺陷。因此，Contourlet变换在图像去噪、图像融合、图像压缩、图像特征提取等方面都有了进一步地应用。但是由于Contourlet变换的过程中进行下采样，导致图像的连续性被破坏。在重构的过程中会出现Gibbs效应，并且Contourlet变换中的拉普拉斯金字塔滤波器分解过程中采用的下采样步骤也会导致图像低频频谱泄漏，在方向滤波器分解过程中的下采样步骤会导致方向频谱混叠，使得方向子带中夹杂其他噪声频谱。同时，下采样还会导致无法精确分析同尺度下方向子带之间的关系。因此Contourlet变换不具有平移不变性。为此，研究学者们提出了非下采样Contourlet变换，即NSCT(TheNonsubsampledContourletTransform)。通过引入非下采样塔式滤波器组(NonsubsampledPyramidFilterBanks，NSPFB)和非下采样方向滤波器组(NonsubsampledDirectionalFilterBanks,NSDFB)替代Contourlet变换中原...

【技术保护点】
1.基于并行运算的非下采样轮廓波变换优化方法，其特征在于：包括以下步骤：(1)将NSCT算法的matlab源码通过matlab2cpp工具，使用Armadillo库和OpenBLAS库，工具翻译转换为C++代码；(2)对步骤(1)中使用工具翻译转换得到的C++代码进行人工修正，包括计算精度的修正等；(3)根据GPU和CPU配置情况，计算执行NSCT算法中多尺度分解与不同级别方向分解所需要启用的GPU数目和开启的CPU线程数，以及分配给每个GPU的实际计算量；(4)对NSCT分解与重构过程进行并行性分析；(5)使用OpenMP和CUDA并行执行NSCT分解过程；(6)使用OpenMP和CUDA并行执行NSCT重构过程。

【技术特征摘要】
1.基于并行运算的非下采样轮廓波变换优化方法，其特征在于：包括以下步骤：(1)将NSCT算法的matlab源码通过matlab2cpp工具，使用Armadillo库和OpenBLAS库，工具翻译转换为C++代码；(2)对步骤(1)中使用工具翻译转换得到的C++代码进行人工修正，包括计算精度的修正等；(3)根据GPU和CPU配置情况，计算执行NSCT算法中多尺度分解与不同级别方向分解所需要启用的GPU数目和开启的CPU线程数，以及分配给每个GPU的实际计算量；(4)对NSCT分解与重构过程进行并行性分析；(5)使用OpenMP和CUDA并行执行NSCT分解过程；(6)使用OpenMP和CUDA并行执行NSCT重构过程。2.根据权利要求1所述的基于并行运算的非下采样轮廓波变换优化方法，其特征在于：所述步骤(3)中：(i)根据已有的GPU计算能力大小，对其进行排序；(ii)若执行多尺度分解，则选取计算能力最强的两个GPU分别计算与低通塔式滤波器H0(z)和带通塔式滤波器H1(z)的卷积；(iii)若执行1级和2级方向分解，选取计算能力最强的两个GPU分别计算与第1级的方向滤波器组的U0(z)和U1(z)的卷积；(iv)若执行3级及更高级方向分解：首先确定启用GPU数量：按照计算能力排序的GPU队列；假设启用GPU数量为1，只开启计算能力最强的GPU，即队列中0号GPU，依次用1号，2号，3号……GPU的计算能力与总任务数减1得到的定值进行乘积，结果和0号GPU计算能力值比较；若小于0号GPU计算能力值，则不开启该GPU；若大于0号GPU计算能力值，则开启该GPU；接着将已开启的GPU数量与CPU核数比较，如果已开启GPU数量大于CPU核数，则只开启同CPU核数相等数量的GPU；分配给已开启GPU任务数：将已开启的GPU的队列末尾的GPU的计算能力设为1，按比例设置各个GPU的计算能力数值，若出现小数的数值则进行上取整；此时的GPU队列中各个GPU计算能力数值为整数，且最末的G...

【专利技术属性】
技术研发人员：滕奇志，张耀，王润涵，何小海，卿粼波，熊淑华，
申请(专利权)人：四川大学，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人