【技术实现步骤摘要】
用于图像和视频处理的条件核预测网络和自适应深度预测
[0001]实施例总体上涉及数据处理,并且更具体地涉及经由通用图形处理单元的图像和视频处理。
技术介绍
[0002]当前的并行图形数据处理包括被开发为用于对图形数据执行特定操作的系统和方法,这些特定操作诸如例如,线性插值、曲面细分、栅格化、纹理映射、深度测试等。传统上,图形处理器使用固定功能计算单元来处理图形数据;然而,最近,图形处理器的多个部分已经变得可编程,使得此类处理器能够支持用于处理顶点和片段数据的更广泛种类的操作。
[0003]为了进一步提高性能,图形处理器典型地实现诸如流水线操作之类的处理技术,这些处理技术尝试贯穿图形流水线的不同部分并行地处理尽可能多的图形数据。具有单指令多线程(SIMT)架构的并行图形处理器被设计成使图形流水线中的并行处理的量最大化。在SIMT架构中,成组的并行线程尝试尽可能频繁地一起同步地执行程序指令,以提高处理效率。可以在Shane Cook的CUDA编程(CUDA Programming)第三章,第37
‑
51页(2013年)中找到对SIMT架构的软件和硬件的总体概述。
附图说明
[0004]为了以能够详细理解本实施例的以上记载特征的方式,可通过参考实施例来对以上简要概括的实施例进行更具体的描述,这些实施例中的一些在所附附图中被图示。然而,应当注意,所附附图仅图示出典型实施例,并且因此不应被认为是对其范围的限制。
[0005]图1是图示配置成用于实现本文中所描述的实施例的一个或多 ...
【技术保护点】
【技术特征摘要】
1.一种通过在计算引擎上实现的卷积神经网络对图像去噪声的方法,所述图像包括多个像素,所述方法包括:对于所述图像的所述多个像素中的每一个,对于所述像素生成具有多个核权重的卷积核,多个核权重分别对应于包围该像素的区域内的多个像素;基于对于包围所述像素的区域内的相应多个像素分别生成的多个卷积核来调整用于所述像素的卷积核的多个核权重;以及利用经调整的所述多个核权重和包围所述像素的区域内的相应多个像素的像素值来对所述像素滤波,以获得去噪声的像素。2.如权利要求1所述的方法,其特征在于,基于对于包围所述像素的区域内的相应多个像素生成的多个卷积核来调整用于所述像素的多个核权重是基于:所述像素的卷积核与对于包围所述像素的区域内的相应多个像素生成的多个卷积核的每一个之间的关联,以及所述像素相对于包围所述像素的区域内的相应多个像素中的每一个的相对位置。3.如权利要求2所述的方法,其特征在于,基于对于包围所述像素的区域内的相应多个像素生成的多个卷积核来调整用于所述像素的多个核权重是根据以下公式:其中:Ω(i)表示包围像素i的k
×
k区域,其中像素i是该k
×
k区域的中心像素,f
i
是对于像素i生成的具有多个核权重的卷积核的矩阵表示,并且具有k2×
1的维度,f
j
是对于包围像素i的k
×
k区域内的像素j生成的具有多个核权重的卷积核的矩阵表示,并且具有k2×
1的维度,K(f
i
,f
j
)表示将卷积核f
i
与用于包围像素i的k
×
k区域内的像素j的卷积核f
j
相关联的联合函数,w
j
是指示包围像素i的k
×
k区域内的像素j的位置的位置标量,以及是用于像素i的经调节的卷积核的矩阵表示,并且具有k2×
1的维度。4.如权利要求3所述的方法,其特征在于,所述联合函数K(f
i
,f
j
)和位置标量w
j
是由所述卷积神经网络通过学习获得。5.如权利要求3所述的方法,其特征在于,所述联合函数K(f
i
,f
j
)是的形式,并且所述经调节的核权重是根据以下公式计算得出的:其中:Ω(i)表示包围像素i的k
×
k区域,其中像素i是该k
×
k区域的中心像素,是卷积核f
i
的转置矩阵表示,并且具有1
×
k2的维度,g
j
是具有维度k2×
1的独热向量,其中第j行的元素是1而其它行是0,是对于包围像素i的区域内的多个像素分别生成的卷积核f
j
的转置矩
阵表示的横向拼接,所述转置矩阵表示具有k2×
1的维度,具有k2×
k2的维度,diag(f
i
)是包含卷积核f
i
的多个核权重作为对角矩阵元素的对角矩阵,并且具有k2×
k2的维度,是位置标量w
j
的向量表示,并且具有k2×
1的维度,以及是用于像素i的经调节的卷积核的矩阵表示,并且具有k2×
1的维度。6.如权利要求1所述的方法,其特征在于,利用经调节的所述多个核权重和包围所述像素的区域内的相应多个像素的像素值来对所述像素滤波包括:计算包围所述像素的区域内的所述多个像素的像素值中的每一个与经调节的所述多个核权重中的相应一个相乘之后的和。7.如权利要求1所述的方法,其特征在于,对于所述像素生成具有多个核权重的卷积核进一步包括:确定用于生成用于所述像素的卷积核的卷积神经网络的目标深度,所确定的目标深度小于或等于所述卷积神经网络的完全深度;以及利用所述卷积神经网络的所确定的目标深度来推断所述卷积核。8.如权利要求7所述的方法,其特征在于,由所述卷积神经网络对于所述图像的每个像素单独地确定所述目标深度。9.如权利要求7所述的方法,其特征在于,在训练的每次迭代中,可利用基于随机采样的目标深度和预测的目标深度计算的损失来训练所述卷积神经网络。10.一种用于对图像去噪声的装置,包括:计算引擎,所述计算引擎用于通过卷积神经网络对图像去噪声,所述图像包括多个像素,所述计算引擎用于:对于所述图像的所述多个像素中的每一个,对于...
【专利技术属性】
技术研发人员:姚安邦,陆鸣,王一凯,陈玉荣,A,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。