【技术实现步骤摘要】
多尺度互相关注意力网络的H.266/VVC色度预测编码方法
[0001]本专利技术涉及图像和视频编码领域,尤其是一种可有效建模色度和亮度分量之间的相关关系,能充分提取色度和亮度分量的通道内、通道间的全局/局部相关性特征,预测准确性高、稳健性好、具备尺度自适应能力、编码性能优、多尺度互相关注意力网络的H.266/VVC色度预测编码方法。
技术介绍
[0002]视频编码是多媒体通信领域的关键基础技术之一,而近年来视频业务数据量的急剧增加,视频流量已经占到互联网流量的80%左右,并且仍呈现稳步上升的趋势,这对视频编码效率提出了越来越高的要求。为了进一步提高压缩比,最新一代国际视频编码标准H.266/VVC在I帧上采用了亮度、色度独立块划分结构,允许亮度和色度分量相互独立地选择最优编码参数,使各个颜色分量的编码机制变得更加灵活。在这种情况下,如何充分利用不同颜色分量之间的相关性,并联合使用亮度分量和已重建的色度分量对当前待处理的色度分量进行跨分量预测编码,已经成为H.266/VVC帧内编码环节的关键技术之一。
[0003]根据预测模型的不同,现有基于跨分量预测策略的色度预测编码方法大致分为三类,即基于线性模型的色度预测编码方法、基于复合线性模型的色度预测编码方法、基于深度学习的色度预测编码方法。
[0004]第一,基于线性模型的色度预测编码方法假定当前待处理像素的亮度和色度分量之间服从线性分布,进而利用线性模型对两个分量之间的相关性进行建模,并通过该线性模型和已重建的亮度分量预测当前待处理像素的色度分量。Le ...
【技术保护点】
【技术特征摘要】
1.一种多尺度互相关注意力网络的H.266/VVC色度预测编码方法,其特征在于按照如下步骤进行:步骤1.建立并初始化用于帧内色度预测的深度卷积神经网络N
YUV
‑
LBBAF
,包含1个特征提取子网络N
feature
和1个信息融合子网络N
inf
‑
fus
;步骤1.1建立并初始化特征提取子网络N
feature
,包含1个相邻边界像素分支B
boundary
和1个当前亮度块分支B
luma
,其中,相邻边界像素分支B
boundary
用于计算与当前待编码块直接相邻的、已经获得重建的上边界和左边界像素的通道间相关性特征,当前亮度块分支B
luma
用于计算当前待编码块的亮度通道中所有像素的局部和全局相关性特征;步骤1.1.1建立并初始化相邻边界像素分支B
boundary
,包含2组卷积层和1个四并联可分离卷积的通道注意力模块,分别为Conv1、Conv2、QPSCA;所述Conv1包含1层卷积操作和1层激活操作,其中,卷积层以大小为1
×
1的卷积核,以随机初始化方式进行初始化,以padding=0的填充模式进行卷积运算,卷积核的输入通道数为3,输出通道数为32,步长为1个像素;所述Conv2包含1层卷积操作和1层激活操作,其中,卷积层以大小为1
×
1的卷积核,以随机初始化方式进行初始化,以padding=0的填充模式进行卷积运算,卷积核的输入通道数为32,输出通道数为32,步长为1个像素;所述QPSCA包含1个通道注意力模块QPSCA_CA和4组并行排列的卷积层,分别为QPSCA_Conv1、QPSCA_Conv2、QPSCA_Conv3、QPSCA_Conv4;所述QPSCA_CA包含1组池化层和2组卷积层,其中,池化层执行自适应平均池化运算,第1个卷积层以大小为1
×
1、激活函数为ReLU、随机初始化方式进行初始化的卷积核,以1个像素为步长进行卷积运算,卷积核的输入通道数为32,输出通道数为4,第2个卷积层以大小为1
×
1、激活函数为Sigmoid、随机初始化方式进行初始化的卷积核,以1个像素为步长进行卷积运算,卷积核的输入通道数为4,输出通道数为32;所述QPSCA_Conv1包含1层卷积操作,以大小为1
×
3的卷积核,以随机初始化方式进行初始化,以padding=0的填充模式和group=1的分组模式进行卷积运算,卷积核的输入通道数为32,输出通道数为8,步长为1个像素;所述QPSCA_Conv2包含1层卷积操作,以大小为1
×
5的卷积核,以随机初始化方式进行初始化,以padding=2的填充模式和group=2的分组模式进行卷积运算,卷积核的输入通道数为32,输出通道数为8,步长为1个像素;所述QPSCA_Conv3包含1层卷积操作,以大小为1
×
7的卷积核,以随机初始化方式进行初始化,以padding=3的填充模式和group=4的分组模式进行卷积运算,卷积核的输入通道数为32,输出通道数为8,步长为1个像素;所述QPSCA_Conv4包含1层卷积操作,以大小为1
×
9的卷积核,以随机初始化方式进行初始化,以padding=4的填充模式和group=8的分组模式进行卷积运算,卷积核的输入通道数为32,输出通道数为8,步长为1个像素;步骤1.1.2建立并初始化当前亮度块分支B
luma
,包含1组卷积层和2组十字交叉注意力模块,分别为Conv3、CAM1、CAM2;所述Conv3包含1层卷积操作,以大小为5
×
5的卷积核,以ReLU为激活函数,以随机初始化方式进行初始化,以padding=2的填充模式进行卷积运算,卷积核的输入通道数为1,输
出通道数为64,步长为1个像素;所述CAM1的1
×
1卷积层的输入通道数为64,输出通道数为64,其余参数为默认设置;所述CAM2的1
×
1卷积层的输入通道数为64,输出通道数为64,其余参数为默认设置;步骤1.2建立并初始化信息融合子网络N
inf
‑
fus
,包含5组卷积层,分别为Conv4、Conv5、Conv6、Conv7、Conv8;所述Conv4包含1层卷积操作和1层激活操作,其中,卷积层以大小为1
×
1的卷积核,以随机初始化方式进行初始化,以padding=0的填充模式进行卷积运算,卷积核的输入通道数为32,输出通道数为16,步长为1个像素,激活函数为ReLU;所述Conv5包含1层卷积操作和1层激活操作,其中,卷积层以大小为1
×
1的卷积核,以随机初始化方式进行初始化,以padding=0的填充模式进行卷积运算,卷积核的输入通道数为64,输出通道数为16,步长为1个像素,激活函数为ReLU;所述Conv6包含1层卷积操作和1层激活操作,其中,卷积层以大小为1
×
1的卷积核,以随机初始化方式进行初始化,以padding=0的填充模式进行卷积运算,卷积核的输入通道数为64,输出通道数为32,步长为1个像素,激活函数为ReLU;所述Conv7包含1层卷积操作和1层激活操作,其中,卷积层以大小为3
×
3的卷积核,以随机初始化方式进行初始化,以padding=1的填充模式进行卷积运算,卷积核的输入通道数为32,输出通道数为32,步长为1个像素,激活函数为ReLU;所述Conv8包含1层卷积操作和1层激活操作,其中,卷积层以大小为1
×
1的卷积核,以随机初始化方式进行初始化,以padding=0的填充模式进行卷积运算,卷积核的输入通道数为32,输出通道数为2,步长为1个像素,激活函数为Identity;步骤2.输入DIV2K数据集中的训练集图像,对其进行分块处理,得到大小分别为4
×
4、8
×
8、16
×
16的图像块集合,进而构造深度卷积神经网络N
YUV
‑
LBBAF
的输入训练向量;步骤2.1对于训练集的每幅图像,将其颜色空间从RGB转换为YCbCr,并将其分别划分成大小为4
×
4、8
×
8、16
×
16的不重叠的块,组成训练图像块集合S
tb
,令S
tb
中的图像块数量为N
tb
;步骤2.2分别令向量S
←
0、向量X
←
0、向量X
Cb
←
0、向量X
Cr
←
0,并令计数器i
←
1;步骤2.3对于训练图像块集合S
tb
的第i个图像块令其宽度和高度均为取出其亮度通道的个像素值组成亮度通道像素值向量X
i
,并令所述表示连接运算;步骤2.4取出图像块的Cb通道的全部像素值组成向量并令步骤2.5取出图像块的Cr通道的全部像素值组成向量并令步骤2.6在所在的原图像内取出个相邻的因果邻域像素,包括与的左边界直接相邻的个像素、与的上边界直接相邻的个像素以及与的左上角顶点直接相邻的1个像素,并将该个像素的Y、Cb和Cr三个颜色通道的像素值组成因果邻域像素值向量S
i
,令步骤2.7如果i>N
tb
,那么转入步骤3,否则令i
←
i+1,并返回步骤2.3;步骤3.输入向量S、X、X
Cb
和X
Cr
,对深度卷积神经网络N
YUV
‑
LBBAF
进行训练,令迭代次数
iter1;步骤3.1令计数器i
←
1;步骤3.2取出向量S中第i个图像块的因果邻域像素值向量S
i
,将其输入相邻边界像素分支B
boundary
,利用卷积层Conv1对S
i
进行计算,得到卷积特征图SF1;步骤3.3利用卷积层Conv2对SF1进行计算,得到卷积特征图SF2;步骤3.4利用四并联可分离卷积的通道注意力模块QPSCA对SF2进行处理,得到卷积特征图Y;步骤3.4.1利用卷积层QPSCA_Conv1对SF2进行计算,得到卷积特征图Y1;步骤3.4.2利用卷积层QPSCA_Conv2对SF2进行计算,得到卷积特征图Y2;步骤3.4.3利用卷积层QPSCA_Conv3对SF2进行计算,得到卷积特征图Y3;步骤3.4.4利用卷积层QPSCA_Conv4对SF2进行计算,得到卷积特征图Y4;步骤3.4.5令步骤3.5利用通道注意力模块QPSCA_CA对Y1、Y2、Y3、Y4进行处理,得到特征...
【专利技术属性】
技术研发人员:宋传鸣,武惠娟,段晟颐,王相海,
申请(专利权)人:辽宁师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。