一种视频编码方法、装置、电子设备及介质制造方法及图纸

技术编号：37331323 阅读：25 留言：0更新日期：2023-04-21 23:08

本公开提供了一种视频编码方法、装置、电子设备及介质，涉及人工智能领域，具体涉及云计算、视频编码、媒体云技术，可应用在智能云场景下。具体实现方案为：获取对待编码视频帧进行视频帧预测，得到的待编码残差帧。然后获取待编码视频帧的最大划分深度；其中，最大划分深度为待编码视频帧的复杂度等级对应的划分深度；复杂度等级基于相同对象在待编码视频帧与参考帧之间的位置偏移量确定；复杂度最高等级对应的划分深度大于或等于复杂度最低等级对应的划分深度。之后基于最大划分深度，将待编码残差帧划分为多个变换单元，并对每个变换单元进行变换处理。实现了在保证视频编码质量基础上，减小视频编码的运算量。减小视频编码的运算量。减小视频编码的运算量。

全部详细技术资料下载

【技术实现步骤摘要】
一种视频编码方法、装置、电子设备及介质

[0001]本公开涉及人工智能领域，具体涉及云计算、视频编码、媒体云技术，可应用在智能云场景下。

技术介绍

[0002]高效率视频编码(High Efficiency Video Coding，HEVC)是新一代的视频编码压缩标准，与前一代H.264高级视频编码(H.264/Advanced video coding，H.264/AVC)标准相比，HEVC在保证解码后的视频为同等清晰度的情况下，可节省将近50％的码率。HEVC可广泛应用于各种视频压缩相关的领域，如视频直播和视频点播等。
[0003]基于HEVC的视频编码过程中，需要对视频帧进行预测、变换、量化、环路滤波和熵编码等处理。其中，变换处理是一个重要的处理过程，变换单元(transform unit，TU)是变换处理的基本单元，变换处理的主要作用是将视频帧的信号从空域转换到频域，并将频域信号的能量集中到频域右上角，使其他频域区域的能量较少，甚至将能量较少的区域中的能量置为零。

技术实现思路

[0004]...

【技术保护点】

【技术特征摘要】
1.一种视频编码方法，包括：获取对待编码视频帧进行视频帧预测，得到的待编码残差帧，所述待编码残差帧表示所述待编码视频帧与视频帧预测结果之间的误差；获取所述待编码视频帧的最大划分深度；其中，所述最大划分深度用于表示最多允许划分的变换单元层级数，所述最大划分深度为所述待编码视频帧的复杂度等级对应的划分深度；所述复杂度等级基于相同对象在所述待编码视频帧与参考帧之间的位置偏移量确定；复杂度最高等级对应的划分深度大于或等于复杂度最低等级对应的划分深度；基于所述最大划分深度，将所述待编码残差帧划分为多个变换单元，并对每个变换单元进行变换处理。2.根据权利要求1所述的方法，在所述获取对待编码视频帧进行视频帧预测，得到的待编码残差帧之前，所述方法还包括：获取待编码视频帧；根据各对象在所述待编码视频帧中与在所述参考帧中的位置偏移量，确定所述待编码视频帧的复杂度等级；根据各复杂度等级与划分深度之间的预设对应关系，确定所述待编码视频帧的复杂度等级对应的最大划分深度。3.根据权利要求2所述的方法，其中，所述根据各对象在所述待编码视频帧中与在所述参考帧中的位置偏移量，确定所述待编码视频帧的复杂度等级，包括：将所述待编码视频帧划分为多个目标编码块；其中，各目标编码块的并集为所述待编码视频帧，且各目标编码块之间没有交集；确定每个目标编码块的运动向量，所述运动向量为目标编码块包括的各对象在所述待编码视频帧中与在所述参考帧中的位置偏移向量；根据各目标编码块的运动向量，确定所述待编码视频帧的复杂度等级。4.根据权利要求3所述的方法，其中，所述根据各目标编码块的运动向量，确定所述待编码视频帧的复杂度等级，包括：确定各目标编码块的运动向量的绝对值的方差；若所述方差小于第一预设门限值，则确定所述待编码视频帧的复杂度等级为最低等级；若所述方差大于或等于所述第一预设门限值，且小于或等于第二预设门限值，则确定所述待编码视频帧的复杂度等级为中间等级；其中，所述第二预设门限值大于所述第一预设门限值；若所述方差大于所述第二预设门限值，则确定所述待编码视频帧的复杂度等级为最高等级。5.根据权利要求3所述的方法，其中，所述将所述待编码视频帧划分为多个目标编码块，包括：对所述待编码视频帧进行下采样，得到下采样帧；将所述下采样帧划分为多个目标编码块。6.根据权利要求4所述的方法，在所述根据各对象在所述待编码视频帧中与在所述参考帧中的位置偏移量，确定所述待编码视频帧的复杂度等级之前，所述方法还包括：
获取测试视频的测试视频帧；分别将每个测试视频帧划分为多个测试编码块；其中，各测试编码块的并集为所述测试视频帧，且各测试编码块之间没有交集；分别确定每个测试视频帧包括的各测试编码块的运动向量，并确定所述各测试编码块的运动向量的绝对值的方差；按照预设比例，将所述测试视频的各测试视频帧对应的方差，划分为最小方差集合、中间方差集合和最大方差集合；所述中间方差集合的最大值小于所述最大方差集合的最小值，所述中间方差集合的最小值大于所述最小方差集合的最大值；根据所述中间方差集合的最大值，确定所述第二预设门限值，并根据所述中间方差集合的最小值，确定所述第一预设门限值。7.根据权利要求6所述的方法，其中，所述测试视频存在多个；所述根据所述中间方差集合的最大值，确定所述第二预设门限值，包括：获取针对每个测试视频得到的中间方差集合的最大值；将获取的各最大值的平均值，作为所述第二预设门限值；所述根据所述中间方差集合的最小值，确定所述第一预设门限值，包括：获取针对每个测试视频得到的中间方差集合的最小值；将获取的各最小值的平均值，作为所述第一预设门限值。8.根据权利要求2
‑
7任一项所述的方法，其中，所述根据各复杂度等级与划分深度之间的预设对应关系，确定所述待编码视频帧的复杂度等级对应的最大划分深度，包括：根据各复杂度等级、预测类型与最大划分深度三者之间的预设对应关系，确定所述待编码视频帧的复杂度等级和预测类型对应的最大划分深度。9.一种视频编码装置，包括：获取模块，用于获取对待编码视频帧进行视频帧预测，得到的待编码残差帧，所述待编码残差帧表示所述待编码视频帧与视频帧预测结果之间的误差；所述获取模块，还用于获取所述待编码视频帧的最大划分深度；其中，所述最大划分深度用于表示最多允许...

【专利技术属性】
技术研发人员：邹箭，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人