运动矢量的预测方法、装置、电子设备及存储介质制造方法及图纸

技术编号：36523802 阅读：16 留言：0更新日期：2023-02-01 16:01

本公开提供了一种运动矢量的预测方法、装置、电子设备及存储介质，涉及人工智能领域，具体涉及云计算、视频编解码以及媒体云技术等技术领域，可应用在智能云场景下。具体实现方案为：获取待编码的视频帧的复杂度表征值；基于所述复杂度表征值，配置所述视频帧对应的候选运动矢量数量，使得所述视频帧的所述复杂度表征值越小，配置的对应的所述候选运动矢量的数量越少；基于所述候选运动矢量数量，预测所述视频帧中各图像块的运动矢量。本公开的技术，能够有效地提高运动矢量的预测的灵活性，提高运动矢量的预测效率。运动矢量的预测效率。运动矢量的预测效率。

全部详细技术资料下载

【技术实现步骤摘要】
运动矢量的预测方法、装置、电子设备及存储介质

[0001]本公开涉及人工智能领域，具体涉及云计算、视频编解码以及媒体云技术等
，可应用在智能云场景下。尤其涉及一种运动矢量的预测方法、装置、电子设备及存储介质。

技术介绍

[0002]高效视频编码(High Efficiency Video Coding；HEVC)是新一代的视频编码压缩标准，与前一代H.264/AVC标准相比，在同等清晰度下，可以节省将近50％的码率。它可以广泛应用于与视频压缩相关的领域，比如直播、点播等。
[0003]HEVC主要由预测、变换、量化、环路滤波、熵编码等主要技术组成。例如，预测是HEVC的编码器中的一个重要模块，它可以分为帧内预测和帧间预测。其中，帧内预测是指利用同一帧图像中已编码的图像块的重构像素值，按一定的方式来进行待编码图像块的预测的方法。帧间预测是指利用已编码的前向或后向考帧中的图像块来进行待编码图像块的预测的方法。帧间预测会采用逐块匹配的方式，获取参考帧中与当前待编码图像块匹配的最佳匹配块，进而基于当前待编码图像块与最佳匹配块的位置，得到该待编码图像块的运动向量，也就是MV，这个过程被称为运动估计。不同的图像块的MV在时域和空域上也有一定的相关性。因此，可以利用相邻的图像块的MV进行当前块MV的预测，仅对预测残差进行编码，则能节省MV的编码比特数。

技术实现思路

[0004]本公开提供了一种运动矢量的预测方法、装置、电子设备及存储介质，涉及人工智能领域。
[0005]根据本公开的一方面，提...

【技术保护点】

【技术特征摘要】
1.一种运动矢量的预测方法，包括：获取待编码的视频帧的复杂度表征值；基于所述复杂度表征值，配置所述视频帧对应的候选运动矢量数量；基于所述候选运动矢量数量，预测所述视频帧中各图像块的运动矢量。2.根据权利要求1所述的方法，其中，获取待编码的视频帧的复杂度表征值，包括：获取所述视频帧中各图像块的运动矢量；基于所述视频帧中各所述图像块的运动矢量，计算所述视频帧中所有图像块的运动矢量的绝对值的方差的总和，作为所述视频帧的复杂度表征值。3.根据权利要求1所述的方法，其中，基于所述复杂度表征值，配置所述视频帧对应的候选运动矢量数量，包括：基于所述复杂度表征值、第一预设表征值和第二预设表征值，确定所述视频帧的复杂程度类型；所述第二预设表征值大于所述第一预设表征值；基于所述视频帧的复杂程度类型，配置所述视频帧对应的候选运动矢量数量。4.根据权利要求3所述的方法，其中，基于所述复杂度表征值、第一预设表征值和第二预设表征值，确定所述视频帧的复杂程度类型，包括：若所述复杂度表征值大于或者等于所述第二预设表征值，确定所述视频帧的复杂程度类型为复杂；若所述复杂度表征值小于所述第一预设表征值，确定所述视频帧的复杂程度类型为简单；或者若所述复杂度表征值大于或者等于所述第一预设表征值，且小于所述第二预设表征值，确定所述视频的复杂程度类型为中等。5.根据权利要求3所述的方法，其中，基于所述视频帧的复杂程度类型，配置所述视频帧对应的候选运动矢量数量，包括：若所述视频帧的复杂程度类型为复杂时，配置所述视频帧对应的候选运动矢量数量为五个；若所述视频帧的复杂程度类型为简单时，配置所述视频帧对应的候选运动矢量数量为两个；或者若所述视频帧的复杂程度类型为中等时，配置所述视频帧对应的候选运动矢量数量为三个或者四个。6.根据权利要求3
‑
5任一所述的方法，其中，基于所述复杂度表征值、第一预设表征值和第二预设表征值，确定所述视频帧的复杂程度类型之前，所述方法还包括：获取多个视频帧测试序列中各所述视频帧测试序列对应的第一表征值和第二表征值；基于所述多个视频帧测试序列中各所述视频帧测试序列的第一表征值和所述第二表征值，获取所述第一预设表征值和所述第二预设表征值。7.根据权利要求6所述的方法，其中，获取多个视频帧测试序列中各所述视频帧测试序列对应的第一表征值和第二表征值，包括：对于各所述视频帧测试序列，对所述视频帧测试序列中的各所述视频帧进行下采样，得到对应的下采样帧；对于各所述下采样帧，获取所述下采样帧中的各编码块；
对于各所述下采样帧，计算所述下采样帧中的各所述编码块的运动矢量；对于各所述下采样帧，基于所述下采样帧中各所述编码块的运动矢量，计算所述下采样帧中所有的所述编码块的运动矢量的绝对值的方差，作为所述下采样帧的复杂度表征值；基于所述视频帧测试序列的各所述下采样帧的复杂度表征值，按照预设的各种复杂程度类型的视频帧的数量占比，配置所述第一表征值和所述第二表征值。8.根据权利要求6或7所述的方法，其中，基于所述多个视频帧测试序列中各所述视频帧测试序列的第一表征值和所述第二表征值，获取所述第一预设表征值和所述第二预设表征值，包括：取所述多个视频帧测试序列中的各所述视频帧测试序列的第一表征值的平均，作为所述第一预设表征值；取所述多个视频帧测试序列中的各所述视频帧测试序列的第二表征值的平均，作为所述第二预设表征值。9.一种运动矢量的预测装置，包括：第一获取模块，用于获取待编码的视频帧的复杂度表征值；配置模块，用于基于所述复杂度表征值，配置所...

【专利技术属性】
技术研发人员：邹箭，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人