【技术实现步骤摘要】
一种基于GPU并行加速的三维块匹配降噪方法
本专利技术涉及图像处理
,具体公开了一种基于GPU并行加速的三维块匹配降噪方法。
技术介绍
数字图像在获取和传输过程中由于受到成像设备和外部环境的影响常常含有大量噪声,影响图像质量。尤其是在医学应用上,由于受低剂量电压电流的影响,CT图像中往往会引入大量的噪声,致使图像质量退化,影响医生的临床病症诊断。常见的三维块匹配(BM3D)算法凭借其自身结合局部、非局部、多尺度稀疏、自适应的滤波降噪特点,被认为是目前最好的图像去噪算法,但是该算法基于相似图像块协同滤波,算法复杂度高,计算量大,处理大尺寸的CT图像数据时,耗时较长,处理效率较低,无法满足实际工作需求。因此,需要一种能解决上述问题的方法。
技术实现思路
为了克服现有技术中存在的缺点和不足,本专利技术的目的在于提供一种基于GPU并行加速的三维块匹配降噪方法。为实现上述目的,本专利技术采用如下方案。一种基于GPU并行加速的三维块匹配降噪方法,包括:在CPU端将待处理的图像进行边界对称扩展预处理;将预处理后的图像数据从CPU主机端发送至GPU的全局存储器中;创建线程网络grid,采用全局存储器合并访问的模式及共享存储器多次循环利用的加速策略,对相似图像块匹配分组进行并行加速处理;采用硬阈值协同滤波内核函数并行加速策略获取三维相似矩阵的第一步降噪估计数据;以第一步降噪估计数据为参考,联合维纳协同滤波内核函数并行加速策略获取第二步降噪估计数据;将第二步降噪估计数据从GPU发送至CPU主机端,并剔除扩展边界像素以获取降噪后的图像。进一步地,所述创建线程网络grid,包括 ...
【技术保护点】
1.一种基于GPU并行加速的三维块匹配降噪方法,其特征在于,包括:在CPU端将待处理的图像进行边界对称扩展预处理;将预处理后的图像数据从CPU主机端发送至GPU的全局存储器中;创建线程网络grid,采用全局存储器合并访问的模式及共享存储器多次循环利用的加速策略,对相似图像块匹配分组进行并行加速处理;采用硬阈值协同滤波内核函数并行加速策略获取三维相似矩阵的第一步降噪估计数据;以第一步降噪估计数据为参考,联合维纳协同滤波内核函数并行加速策略获取第二步降噪估计数据;将第二步降噪估计数据从GPU发送至CPU主机端,并剔除扩展边界像素以获取降噪后的图像。
【技术特征摘要】
1.一种基于GPU并行加速的三维块匹配降噪方法,其特征在于,包括:在CPU端将待处理的图像进行边界对称扩展预处理;将预处理后的图像数据从CPU主机端发送至GPU的全局存储器中;创建线程网络grid,采用全局存储器合并访问的模式及共享存储器多次循环利用的加速策略,对相似图像块匹配分组进行并行加速处理;采用硬阈值协同滤波内核函数并行加速策略获取三维相似矩阵的第一步降噪估计数据;以第一步降噪估计数据为参考,联合维纳协同滤波内核函数并行加速策略获取第二步降噪估计数据;将第二步降噪估计数据从GPU发送至CPU主机端,并剔除扩展边界像素以获取降噪后的图像。2.根据权利要求1所述的一种基于GPU并行加速的三维块匹配降噪方法,其特征在于,所述创建线程网络grid,包括:以图像每个参考块的图像块匹配过程为一个线程块block,搜索窗内每个检测图像块与参考块的相似性匹配过程为每个线程thread进行线程分配;以一定像素的步长分别从行列方向依次递增选取参考图像块,并根据图像中参考图像块个数确定线程网grid的大小,根据参考图像块搜索窗的图像块个数确定线程block的大小。3.据权利要求1所述的一种基于GPU并行加速的三维块匹配降噪方法,其特征在于,所述采用全局存储器合并访问的模式及共享存储器多次循环利用的加速策略,对相似图像块匹配分组进行并行加速处理,包括:将同一个warp中的所有线程thread执行同一条指令访问全局存储器中连续单元,以获得合并访问模式;将搜索窗分成大小为32*32的4个分块,并在每个分块中以block(16,16)的线程进行相似性计算获取相似块,其中d为图像块间的距离,定义为两个图像块对应元素数值差的模除以图像块的大小,τthreod为选取的适合的距离阈值;将搜索窗中像元数据分块循环共享存储器中,并设置threadIdx.x<16且threaIdx.y<16;采用最小值归约并行的策略寻找规定数目的最相似图像块。4.据权利要求3所述的一种基于GPU并行加速的三维块匹配降噪方法,其特征在于,所述采用最小值归约并行的策略寻找规定数目的最相似图像块,包括:将参考图像块的相似图像块按照相似距离由小到大排序聚集成三维矩阵;启用n个线程分别与相似性计算得到的n个距离值D[n]对应;将第i个线程的值与第(i+n/2)个线程的距离值进行比较并将较小值放在左部分中,较大值放在右部分,则左部分区间为D[0]至D[n/2],右部分区间为D[n/2]至D[n];完成线程并行比较后,将比较线程数减半,对左部分区间距离值进行上述比较,直至多次比较线程数减半比较后左部分区间值缩至D[0];以D[0]作为距离值中的最小值,将D[n]起始访问位置后移一位并重复上述步骤寻找最小值,直至找到距离最小的规定数目的相似图像块。5.根据权利要求1所述的一种基于GPU并行加速...
【专利技术属性】
技术研发人员:韩玉,李磊,闫镔,荣利会,陈健,席晓琦,梁宁宁,孙艳敏,王敬雨,
申请(专利权)人:东莞信大融合创新研究院,中国人民解放军战略支援部队信息工程大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。