用于视频处理的方法、设备和介质技术

技术编号：41378493 阅读：3 留言：0更新日期：2024-05-20 10:21

本公开的实施例提供了一种用于视频处理的解决方案。提出了一种视频处理方法。该方法包括：获取用于处理视频的机器学习模型的选择的第一粒度以及应用机器学习模型的第二粒度；以及基于第一粒度和第二粒度，在当前视频块与视频的比特流之间执行转换。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

本公开的实施例总体上涉及视频编解码技术，并且更具体地涉及使用机器学习模型来处理视频。

技术介绍

1、当今，数字视频能力正被应用于人们生活的方方面面。针对视频编码/解码，已经提出了多种类型的视频压缩技术，诸如mpeg-2、mpeg-4、itu-t h.263、itu-t h.264/mpeg-4第10部分高级视频编解码(avc)、itu-t h.265高效视频编解码(hevc)标准、通用视频编解码(vvc)标准。然而，通常期望能够进一步提高常规视频编解码技术的编解码效率。

技术实现思路

1、本公开的实施例提供了一种用于视频处理的解决方案。

2、在第一方面，提出了一种用于视频处理的方法。该方法包括：获取用于处理视频的机器学习模型的选择的第一粒度以及应用机器学习模型的第二粒度；以及基于第一粒度和第二粒度，在视频的当前视频块与视频的比特流之间执行转换。根据本公开的第一方面的方法利用机器学习模型来对视频进行编码。以此方式，可以进一步提高编码性能。

3、在第二方面，提出了一种用于处理视频数据的装置。该用于处理视频数据的装置包括处理器和其上具有指令的非暂态存储器。该指令在由处理器执行时使处理器执行根据本公开的第一方面的方法。

4、在第三方面，提出了一种非暂态计算机可读存储介质。该非暂态计算机可读存储介质存储有使处理器执行根据本公开第一方面的方法的指令。

5、在第四方面，提出了另一种非暂态计算机可读记录介质。该非暂态计算机可读记录介质存储有视频的由视

6、在第五方面，提出了一种用于存储视频的比特流的方法。该方法包括：获取用于处理视频的机器学习模型的选择的第一粒度以及应用机器学习模型的第二粒度；基于第一粒度和第二粒度，在视频的当前视频块与视频的比特流之间执行转换；以及将比特流存储在非暂态计算机可读记录介质中。

7、提供本
技术实现思路
是为了以简化的形式介绍一些概念，下面以具体实施方式进一步描述这些概念。本
技术实现思路
无意于识别所要求保护的主题的关键特征或基本特征，也无意于用于限制所要求保护的主题的范围。

本文档来自技高网...

【技术保护点】

1.一种用于视频处理的方法，包括：

2.根据权利要求1所述的方法，其中所述第一粒度与所述第二粒度相同或不同。

3.根据权利要求1-2中任一项所述的方法，其中所述第一粒度和所述第二粒度中的至少一项在所述比特流中被指示。

4.根据权利要求1-3中任一项所述的方法，其中所述第一粒度和所述第二粒度中的至少一项在所述视频的处理期间被导出。

5.根据权利要求1-4中任一项所述的方法，其中所述第二粒度在所述比特流中被指示或者在所述视频的处理期间被导出，并且所述第一粒度被确定为与所述第二粒度相同。

6.根据权利要求1-4中任一项所述的方法，其中所述第一粒度在所述比特流中被指示或者在所述视频的处理期间被导出，并且所述第二粒度被确定为与所述第一粒度相同。

7.根据权利要求1-6中任一项所述的方法，其中所述第一粒度包括从一组机器学习模型中选择所述机器学习模型的第三粒度和启用机器学习模型的使用的第四粒度，并且所述第三粒度与所述第四粒度相同或不同。

8.根据权利要求1-7中任一项所述的方法，其中关于从一组机器学习模型中选择

9.根据权利要求8所述的方法，其中针对CTU的所述第一信息在针对下个CTU的所述第一信息之前被编解码，以及/或者

10.根据权利要求9所述的方法，其中z扫描顺序被用于对针对所述CTU和/或所述CTB的所述第一信息进行编解码。

11.根据权利要求9-10中任一项所述的方法，其中所述第二粒度不大于所述CTU和/或所述CTB。

12.根据权利要求8所述的方法，其中针对对应于所述第二粒度的单元的所述第一信息与由所述单元覆盖的所述CTU和/或所述CTB中的一项一起被呈现。

13.根据权利要求12所述的方法，其中所述第一信息与由所述单元覆盖的第一CTU和/或第一CTB一起被呈现。

14.根据权利要求12-13中任一项所述的方法，其中所述第二粒度大于所述CTU和/或所述CTB。

15.根据权利要求1-14中任一项所述的方法，其中关于从一组机器学习模型中选择所述机器学习模型和/或是所述机器学习模型的使用是否被启用的第一信息独立于所述CTU和/或CTB的编解码而在所述比特流中被指示。

16.根据权利要求15所述的方法，其中针对分别与所述第二粒度相对应的多个单元的所述第一信息被一起执行编解码。

17.根据权利要求15-16中任一项所述的方法，其中，光栅扫描顺序被用于对针对与所述第二粒度相对应的每个单元的所述第一信息进行编解码。

18.根据权利要求8-17中任一项所述的方法，其中，对所述第一信息进行编解码的方案取决于所述CTU和/或所述CTB的大小与对应于所述第二粒度的单元的大小之间的关系。

19.根据权利要求18所述的方法，其中如果所述单元的大小小于所述CTU和/或所述CTB的大小，则针对所述单元的所述第一信息被执行编解码。

20.根据权利要求18所述的方法，其中如果针对CTU或CTB内的所有单元的大小都不大于所述CTU和/或所述CTB的大小，则针对所述所有单元的所述第一信息被执行编解码。

21.根据权利要求1-20中任一项所述的方法，其中关于从一组机器学习模型中选择所述机器学习模型和/或是所述机器学习模型的使用是否被启用的第一信息在以下至少一项中被指示：序列头、图片头、条带头、序列参数集(SPS)、图片参数集(PPS)或自适应参数集(APS)，

22.根据权利要求21所述的方法，其中全部所述第一信息在以下至少一项中被指示：所述序列头、所述图片头、所述条带头、所述SPS、所述PPS、所述APS。

23.根据权利要求21所述的方法，其中所述第一信息的一部分在以下至少一项中被指示：所述序列头、所述图片头、所述条带头、所述SPS、所述PPS、所述APS，并且所述第一信息的另一部分与所述CTU语法一起被指示。

24.根据权利要求21所述的方法，其中全部所述第一信息与所述CTU语法一起被指示。

25.根据权利要求21-24中任一项所述的方法，其中如果所述第一信息的至少一部分与所述CTU语法一起被指示并且所述第一粒度小于所述CTU的大小，则所述第一信息的所述至少一部分以z扫描顺序、与所述CTU语法一起被指示。

26.根据权利要求21-24中任一项所述的方法，其中所述第一信息以光栅扫描顺序、与所述CTU语法一起被指示。

27.根据权利要求1-26中任一...

【技术特征摘要】
【国外来华专利技术】

1.一种用于视频处理的方法，包括：

2.根据权利要求1所述的方法，其中所述第一粒度与所述第二粒度相同或不同。

3.根据权利要求1-2中任一项所述的方法，其中所述第一粒度和所述第二粒度中的至少一项在所述比特流中被指示。

4.根据权利要求1-3中任一项所述的方法，其中所述第一粒度和所述第二粒度中的至少一项在所述视频的处理期间被导出。

8.根据权利要求1-7中任一项所述的方法，其中关于从一组机器学习模型中选择所述机器学习模型和/或所述机器学习模型的使用是否被启用的第一信息在所述比特流中、在以下至少一项中被指示：

9.根据权利要求8所述的方法，其中针对ctu的所述第一信息在针对下个ctu的所述第一信息之前被编解码，以及/或者

10.根据权利要求9所述的方法，其中z扫描顺序被用于对针对所述ctu和/或所述ctb的所述第一信息进行编解码。

11.根据权利要求9-10中任一项所述的方法，其中所述第二粒度不大于所述ctu和/或所述ctb。

12.根据权利要求8所述的方法，其中针对对应于所述第二粒度的单元的所述第一信息与由所述单元覆盖的所述ctu和/或所述ctb中的一项一起被呈现。

13.根据权利要求12所述的方法，其中所述第一信息与由所述单元覆盖的第一ctu和/或第一ctb一起被呈现。

14.根据权利要求12-13中任一项所述的方法，其中所述第二粒度大于所述ctu和/或所述ctb。

15.根据权利要求1-14中任一项所述的方法，其中关于从一组机器学习模型中选择所述机器学习模型和/或是所述机器学习模型的使用是否被启用的第一信息独立于所述ctu和/或ctb的编解码而在所述比特流中被指示。

16.根据权利要求15所述的方法，其中针对分别与所述第二粒度相对应的多个单元的所述第一信息被一起执行编解码。

17.根据权利要求15-16中任一项所述的方法，其中，光栅扫描顺序被用于对针对与所述第二粒度相对应的每个单元的所述第一信息进行编解码。

18.根据权利要求8-17中任一项所述的方法，其中，对所述第一信息进行编解码的方案取决于所述ctu和/或所述ctb的大小与对应于所述第二粒度的单元的大小之间的关系。

19.根据权利要求18所述的方法...

【专利技术属性】
技术研发人员：李跃，张凯，张莉，
申请(专利权)人：字节跳动有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人