【技术实现步骤摘要】
本专利技术涉及深度学习、视频编码领域,尤其涉及一种基于深度学习的帧内编码方法。
技术介绍
1、随着互联网信息技术的快速发展和智能移动终端广泛普及,多媒体视频服务已经渗透到现代社会的方方面面,例如:数字电视、视频会议、在线课程、网络直播、沉静式体验等。为了高效压缩视频数据,itu-t和iso/iec联合推出了通用视频编码(versatile videocoding,vvc)标准。
2、对于彩色视频来说,同一帧图像内亮度分量和色度分量三个通道之间具有高度相关性。为了高效去除分量间冗余,vvc在传统角度预测模式的基础上新引入了分量间线性模型(cross component liner model,cclm)预测技术,并取得了较好的编码性能提升。然而,基于cclm技术的色度帧内预测方法均假设亮度分量和色度分量之间满足线性关系,对于包含复杂纹理的编码块,由于线性拟合的方法难以准确表示分量间的复杂关系,因此色度预测的准确性受限。
3、近年来,深度学习技术在计算机视觉领域取得巨大成功。受此启发,一些研究人员开始探索深度学习技术
...【技术保护点】
1.一种基于深度学习的帧内编码方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种基于深度学习的帧内编码方法,其特征在于,所述基于位置信息辅助的颜色迁移预测模块包括:多尺度卷积块、位置编码单元和颜色统计量对齐单元,
3.根据权利要求2所述的一种基于深度学习的帧内编码方法,其特征在于,所述多尺度卷积块由1个1×1和1个3×3卷积并联构成,卷积核个数均为128,利用不同尺度的卷积使得提取到的特征包含更丰富的信息,如下:
4.根据权利要求2所述的一种基于深度学习的帧内编码方法,其特征在于,所述获取像素间位置信息辅助颜色迁移预测过
...
【技术特征摘要】
1.一种基于深度学习的帧内编码方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种基于深度学习的帧内编码方法,其特征在于,所述基于位置信息辅助的颜色迁移预测模块包括:多尺度卷积块、位置编码单元和颜色统计量对齐单元,
3.根据权利要求2所述的一种基于深度学习的帧内编码方法,其特征在于,所述多尺度卷积块由1个1×1和1个3×3卷积并联构成,卷积核个数均为128,利用不同尺度的卷积使...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。