一种用于多标签问题的硬件高效引导滤波方法技术

技术编号:21631584 阅读:25 留言:0更新日期:2019-07-17 11:56
本发明专利技术提供了一种用于多标签问题的硬件高效引导滤波方法,包括以下步骤:输入多标签图像的输入指导;定义硬件高效引导滤波模型HGF;通过定制的矩阵逆运算计算向量;输入指导通过映射程序将每个通道产生的结果相加组成多项式指导,将非线性引入线性模型;通过逐元计算和盒式过滤以硬件高效的方式得到滤波结果。

A Hardware Efficient Guided Filtering Method for Multi-Label Problem

【技术实现步骤摘要】
一种用于多标签问题的硬件高效引导滤波方法
本专利技术涉及一种计算机视觉领域中的多通道引导过滤图像的技术,特别是一种用于多标签问题的硬件高效引导滤波方法。
技术介绍
自2010年以来,GF已应用于许多计算机视觉和图形问题,如图像重定向,颜色转移和视频去雾。其中,多标签系统可能是GF最适合其充分利用其效率和效果的应用之一,因为多标签系统中的繁重计算迫切需要一种快速过滤工具。由于线性复杂性和边缘保持能力,GF被认为是多标签系统的所有候选滤波器中的最佳选择。然而,GF的缺陷是彩色图像引导过滤算法效率不高,我们观察到运行时间随着矩阵的大小而显著增加。具体地来说,矩阵求逆是耗时的操作,因此,将GF应用于具有多通道引导的多标签系统是低效的,尤其是对于大通道数。为了减少执行时间,GF最直接的方法是启动一组线程来同时反转矩阵。但是,这种策略在当前的硬件上效率不高。这是因为:(1)CPU和GPU都依赖SIMD(单指令多数据)架构来提升性能;(2)分支指令对于LU算法等传统矩阵求逆方法是不可避免的;(3)SIMD架构无法以最快的速度运行分支指令,因为这些指令需要将每个矢量分解为元素并在架构上顺序处理它们。为了避免分支指令,我们可以根据矩阵逆的解析解来反转矩阵。GF采用最快的OpenCV实现这种策略来反转3×3矩阵,并成功地将反转106个矩阵的运行时间减少到小于100ms。但是分析解决方案的实现复杂性随着矩阵大小的增加而增加。当矩阵的大小变大时,该方法不再可以手动实现。
技术实现思路
本专利技术的目的在于提供一种用于多标签问题的硬件高效引导滤波方法,包括以下步骤:步骤1,输入多标签图像的输入指导;步骤2,定义硬件高效引导滤波模型HGF;步骤3,通过定制的矩阵逆运算计算向量步骤4,输入指导通过映射程序将每个通道产生的结果相加组成多项式指导,将非线性引入线性模型;步骤5,通过逐元计算和盒式过滤以硬件高效的方式得到滤波结果。本专利技术采用逐元算术计算和盒式过滤,具有以下优点:(1)通过输入合成多项式多通道引导来为GF引入非线性,以克服GF线性模型的缺点;(2)线性模型由于其简单性而通常不适合输入的数据,因此易于产生过度平滑的结果;(3)通过我们的硬件高效矩阵逆算法,可以将伴随非线性模型的额外运行时间降低到可接受的水平。下面结合说明书附图对本专利技术作进一步描述。附图说明图1是本专利技术的流程图。图2是HGF使用来自多标签系统的输入过滤的流程图。具体实施方式结合图1,一种用于多标签问题的硬件高效引导滤波器,包括:(1)对HGF的定义;(2)计算向量(3)合成多项式指导;(4)硬件高效实施,共四个过程。(1)定义HGF包括以下步骤:步骤1,多点估计:计算本地支持中一组点的估计。具体地,HGF通过最小化线性脊回归(2)来估计滤波器模型(1)的系数其中Y表示输入图像。步骤2,聚合:融合每个点可用的多点估计。将通过式(2)优化方程(1)得到的最小化投入HGF,并获得给定窗口Ωp的一组值HGF将这些值聚合在一起,并将它们的平均值视为最终滤波结果Z(q)。(2)计算向量包括以下步骤:步骤3,根据包含矩阵逆运算的等式(4)计算向量这里E表示单位矩阵,输入图像像素p的矩阵对于P的第i个向量我们把加到第k个输出像素的记录值Gi(qk),其中qk∈Ωp,Ωp表示以像素P为中心的邻域,|Ωp|表示Ωp中的像素总数,Gi是图像。步骤4)、将替换为公式(4)重新表示为公式(5)。步骤5,若步骤4中可逆,则(6)成立。其中且可以通过(7)迭代计算得到,k从1到n,其中步骤6,将公式(6)置于方程(5)中,我们能够将的第k个元素转换为线性组合Gij,p如公式(8)。步骤7,我们有p点向量内积结果和盒式滤波结果所以如果p的邻域Ωp是一个盒子窗口,我们有Gij,p=Gij(p),将盒式滤波器应用于元素生成图像产生Gij,根据Gij的线性组合计算组成上述步骤4)、5)、6)、7)计算过程仅由算术计算和盒式过滤组成,在计算过程中完全消除了矩阵逆运算。(3)合成多项式指导包含以下步骤:结合图2,步骤8,公式(9)显示具有灰色输入的多项式模型指导I,其中d是多项式函数的次数。假设Gi=Ii,可以找到线性模型(1)和多项式模型(9)之间的等价,在输入指导是多通道的情况下,可以直接将映射程序独立地应用于每个通道,其中Ii表示多通道引导I的第i个通道,n是通道数。在此之后,我们叠加输入多通道引导I的每个通道的产生结果以合成我们的多项式指导。在数学上,这种情况下的线性模型(1)等效于非线性多项式模型(10)。因此,我们成功地将非线性赋予在HGF的广义线性模型(1)上。(4)硬件高效实施包含以下步骤:步骤9,公式(8)揭示了计算的硬件有效方法,因为它保证的第k个元素是盒式滤波结果Gij(p)的线性组合。具体来说,用B(X)表示图像X的盒式滤波结果,Wi和αij记录图像域中任意p的和αij,p的值(即αij(p)=αij,p)。步骤10,将公式(8)推广到如下盒式滤波结果Gij(11)和逐元算术计算(12),这里的G0表示全1矩阵,Gi(1≤i≤n)表示合成多项式n通道引导的G的第i个通道,Gn+1是输入图像Y的另一种表示方法。同样更新的公式也可以修改为矩阵(13)的逐元算术计算,其中和步骤11,HGF根据系数的平均值计算滤波结果Z。定义平均算子我们可以将方程(3)的逐元算术计算形式表示为(14)。步骤12,观察方程(11)(12)(13)(14),我们发现所有方程只涉及两种计算类型:一个是矩阵的逐元算术计算,另一个是图像的盒式过滤,逐元算术计算是典型的数据并行任务,它将元素函数应用于输入数据的实际集合,算术计算可以直接分配给CPU的核心或GPU的线程以用于并行计算。许多软件或库是支持逐元算术计算的,例如Matlab,ViennaCL和Arrayfire。步骤13,盒式过滤产生的平滑图像的值等于输入图像中其相邻像素的总和。我们不需要手动实现盒式过滤,英特尔的两个库OpenCV和Nvidia的NPP已经提供了。本文档来自技高网...

【技术保护点】
1.一种用于多标签问题的硬件高效引导滤波方法,其特征在于,包括以下步骤:步骤1,输入多标签图像的输入指导;步骤2,定义硬件高效引导滤波模型HGF;步骤3,通过定制的矩阵逆运算计算向量

【技术特征摘要】
1.一种用于多标签问题的硬件高效引导滤波方法,其特征在于,包括以下步骤:步骤1,输入多标签图像的输入指导;步骤2,定义硬件高效引导滤波模型HGF;步骤3,通过定制的矩阵逆运算计算向量步骤4,输入指导通过映射程序将每个通道产生的结果相加组成多项式指导,将非线性引入线性模型;步骤5,通过逐元计算和盒式过滤以硬件高效的方式得到滤波结果。2.根据权利要求1所述的方法,其特征在于,步骤2具体包括如下步骤:步骤201,定义HGF其中,为第i个系数,为初值系数,Gi(q)为像素q的记录值;步骤202,通过最小化线性脊回归(2)估计式(1)得到HGF的系数其中,Y(q)为输入图像,λ为正则化参数,Ωp表示以像素P为中心的邻域,;步骤203,获得Ωp的一组值Z'p(q),将这些像素的滤波结果加在一起,并将它们的平均值视为最终滤波结果Z(q),其中其中,为像素p的第i个系数,为像素p的初值系数,为在Ωq内的均值。3.根据权利要求1所述的方法,其特征在于,步骤3具体包括如下步骤:步骤301,根据式(4)包含矩阵逆运算的等式计算向量其中,E为单位矩阵,为输入图像像素p的矩阵,为像素p的第n个向量。对于p的第i个向量由第k个输出像素q的记录值Gi(qk)组成,其中qk∈Ωp,Ωp表示以像素P为中心的邻域,|Ωp|表示Ωp中的像素总数;步骤302,将替换为得到式(5),若该式可逆则式(6)成立其中,k、i、j、m、n表示...

【专利技术属性】
技术研发人员:代龙泉王静如唐金辉
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1