一种基于深度学习的帧内编码方法技术

技术编号：41291702 阅读：23 留言：0更新日期：2024-05-13 14:42

本发明专利技术公开了一种基于深度学习的帧内编码方法，包括：构建基于颜色迁移的色度帧内预测网络，输入为当前编码单元亮度分量和边界参考像素，输出为当前编码单元的色度分量预测结果；设计基于位置信息辅助的颜色迁移预测模块，利用多尺度卷积块分别从两个输入中提取特征，并通过位置编码单元和颜色统计量对齐单元获得颜色迁移后的精细化预测特征；设计基于颜色统计量约束的重建模块，通过构建颜色直方图一致性损失，使得重建模块更加关注于生成具有准确纹理边缘的色度预测结果。本发明专利技术借助深度学习的特征提取与表达能力，通过充分利用当前编码单元亮度信息和边界参考信息，准确预测当前编码单元的色度分量，进一步提高视频帧内编码性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及深度学习、视频编码领域，尤其涉及一种基于深度学习的帧内编码方法。

技术介绍

1、随着互联网信息技术的快速发展和智能移动终端广泛普及，多媒体视频服务已经渗透到现代社会的方方面面，例如：数字电视、视频会议、在线课程、网络直播、沉静式体验等。为了高效压缩视频数据，itu-t和iso/iec联合推出了通用视频编码(versatile videocoding，vvc)标准。

2、对于彩色视频来说，同一帧图像内亮度分量和色度分量三个通道之间具有高度相关性。为了高效去除分量间冗余，vvc在传统角度预测模式的基础上新引入了分量间线性模型(cross component liner model，cclm)预测技术，并取得了较好的编码性能提升。然而，基于cclm技术的色度帧内预测方法均假设亮度分量和色度分量之间满足线性关系，对于包含复杂纹理的编码块，由于线性拟合的方法难以准确表示分量间的复杂关系，因此色度预测的准确性受限。

3、近年来，深度学习技术在计算机视觉领域取得巨大成功。受此启发，一些研究人员开始探索深度学习技术...

【技术保护点】

1.一种基于深度学习的帧内编码方法，其特征在于，所述方法包括：

2.根据权利要求1所述的一种基于深度学习的帧内编码方法，其特征在于，所述基于位置信息辅助的颜色迁移预测模块包括：多尺度卷积块、位置编码单元和颜色统计量对齐单元，

3.根据权利要求2所述的一种基于深度学习的帧内编码方法，其特征在于，所述多尺度卷积块由1个1×1和1个3×3卷积并联构成，卷积核个数均为128，利用不同尺度的卷积使得提取到的特征包含更丰富的信息，如下：

4.根据权利要求2所述的一种基于深度学习的帧内编码方法，其特征在于，所述获取像素间位置信息辅助颜色迁移预测过程为：

...

【技术特征摘要】

1.一种基于深度学习的帧内编码方法，其特征在于，所述方法包括：

3.根据权利要求2所述的一种基于深度学习的帧内编码方法，其特征在于，所述多尺度卷积块由1个1×1和1个3×3卷积并联构成，卷积核个数均为128，利用不同尺度的卷积使...

【专利技术属性】
技术研发人员：章文，汪清，彭勃，李戈，雷建军，
申请(专利权)人：天津大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人