对用于视频译码的多假设预测的运动信息进行自适应译码制造技术

技术编号:39643993 阅读:9 留言:0更新日期:2023-12-09 11:11
一种用于对视频数据进行解码的示例设备包括一个或多个处理器,其被配置为:使用基本帧间预测模式来生成用于视频数据的当前块的第一预测块;对用于表示额外预测假设的第二预测块的合并模式语法元素进行译码,合并模式语法元素指示用于第二预测块的运动信息是否是使用合并模式进行译码的;根据合并模式语法元素来对用于第二预测块的运动信息进行译码,其中,为了对运动信息进行译码,一个或多个处理器被配置为:形成包括合并候选的合并候选列表,合并候选表示相应的单预测运动信息集合;使用运动信息来生成用于视频数据的当前块的第二预测块;从第一预测块和第二预测块形成多假设预测块;以及使用多假设预测块来对当前块进行解码

【技术实现步骤摘要】
【国外来华专利技术】对用于视频译码的多假设预测的运动信息进行自适应译码
[0001]本申请要求享受于
2022
年3月
22
日提交的美国专利申请
No.17/655919

2021
年3月
29
日提交的美国临时申请
No.63/167480
的优先权,上述两个申请的每一个的全部内容通过引用形式合并入本文中


2022
年3月
22
日提交的美国专利申请
No.17/655919
要求于
2021
年3月
29
日提交的美国临时申请
No.63/167480
的权益



[0002]本公开内容涉及视频译码,包括视频编码和视频解码


技术介绍

[0003]数字视频能力可以被合并到各种各样的设备中,包括数字电视机

数字直播系统

无线广播系统

个人数字助理
(PDA)、
膝上型计算机或台式计算机

平板计算机

电子书阅读器

数字相机

数字记录设备

数字媒体播放器

视频游戏设备

视频游戏控制台

蜂窝或卫星无线电电话
(
所谓的“智能电话”)、
视频电话会议设备

视频流设备等

数字视频设备实现视频译码技术
(
诸如在由
MPEG

2、MPEG

4、ITU

T H.263、ITU

T H.264/MPEG

4(

10
部分,高级视频译码
(AVC))、ITU

T H.265/
高效率视频译码
(HEVC)、ITU

T H.266/
通用视频译码
(VVC)
所定义的标准和此类标准的扩展以及专有视频编解码器
/
格式
(
诸如开放媒体联盟开发的
AOMedia Video 1(AV1))
中描述的那些技术
)。
通过实现这样的视频译码技术,视频设备可以更加高效地发送

接收

编码

解码和
/
或存储数字视频信息

[0004]视频译码技术包括空间
(
图片内
(intra

picture))
预测和
/
或时间
(
图片间
(inter

picture))
预测以减少或去除在视频序列中固有的冗余

对于基于块的视频译码,视频切片
(
例如,视频图片或视频图片的一部分
)
可以被分割为视频块,视频块也可以被称为译码树单元
(CTU)、
译码单元
(CU)

/
或译码节点

图片的经帧内编码
(I)
的切片中的视频块是使用相对于同一图片中的相邻块中的参考样本的空间预测来编码的

图片的经帧间编码
(P

B)
的切片中的视频块可以使用相对于同一图片中的相邻块中的参考样本的空间预测或者相对于其它参考图片中的参考样本的时间预测

图片可以被称为帧,并且参考图片可以被称为参考帧


技术实现思路

[0005]概括而言,本公开内容描述了用于视频译码期间的多假设帧间预测的技术

视频译码通常包括将一系列图片中的图片分割为相应的块,然后对每个块进行译码
(
编码或解码
)。
对块进行译码通常包括预测块以及对块的残差
(
即,预测块与实际块之间的差集合
)
进行译码

预测可以是图片内
(
即,使用包括块的图片的数据预测当前块
)
或图片间
(
即,使用一个或多个先前译码的图片的数据预测当前块
)。
多假设帧间预测是指在一个或多个先前译码的图片中使用多个参考块来预测当前块

例如,视频译码器可以生成两个或更多个预测块,然后使用平均

加权预测等来组合预测块的值

[0006]可以使用各种译码模式
(
诸如合并模式或高级运动矢量预测
(AMVP)
模式
)
用信号
通知帧间预测

通常,在合并模式下,用信号通知的相邻块的运动信息用作当前块的运动信息,而在
AMVP
模式下,用信号通知的相邻块的运动信息用于预测当前块的运动矢量,并且其它运动信息
(
例如,运动矢量差值和参考图片识别信息
)
被译码以形成当前块的运动信息

除此之外,本公开内容描述了与使用合并模式来用信号通知多假设帧间预测信息相关的技术的各种示例

[0007]在一个示例中,一种对视频数据进行解码的方法包括:使用基本帧间预测模式来生成用于视频数据的当前块的第一预测块;对用于第二预测块的合并模式语法元素进行译码,所述第二预测块表示用于所述当前块的额外预测假设,其中,所述合并模式语法元素指示用于所述第二预测块的运动信息是否是使用合并模式进行译码的;根据所述合并模式语法元素来对用于所述第二预测块的运动信息进行译码,包括:当所述合并模式语法元素指示用于所述第二预测块的所述运动信息是使用合并模式进行译码的时,形成包括一个或多个合并候选的合并候选列表,所述合并候选中的每个合并候选表示相应的单预测运动信息集合;使用所述运动信息来生成用于视频数据的所述当前块的所述第二预测块;形成用于所述当前块的多假设预测块,作为所述第一预测块和所述第二预测块的组合;以及使用所述多假设预测块来对所述当前块进行解码

[0008]在另一示例中,一种用于对视频数据进行解码的设备包括:存储器,其被配置为存储视频数据;以及一个或多个处理器,其在电路中实现并且被配置为:使用基本帧间预测模式来生成用于视频数据的当前块的第一预测块;对用于第二预测块的合并模式语法元素进行译码,所述第二预测块表示用于所述当前块的额外预测假设,其中,所述合并模式语法元素指示用于所述第二预测块的运动信息是否是使用合并模式进行译码的;根据所述合并模式语法元素来本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.
一种对视频数据进行解码的方法,所述方法包括:使用基本帧间预测模式来生成用于视频数据的当前块的第一预测块;对用于第二预测块的合并模式语法元素进行译码,所述第二预测块表示用于所述当前块的额外预测假设,其中,所述合并模式语法元素指示用于所述第二预测块的运动信息是否是使用合并模式进行译码的;根据所述合并模式语法元素来对用于所述第二预测块的运动信息进行译码,包括:当所述合并模式语法元素指示用于所述第二预测块的所述运动信息是使用合并模式进行译码的时,形成包括一个或多个合并候选的合并候选列表,所述合并候选中的每个合并候选表示相应的单预测运动信息集合;使用所述运动信息来生成用于视频数据的所述当前块的所述第二预测块;形成用于所述当前块的多假设预测块,作为所述第一预测块和所述第二预测块的组合;以及使用所述多假设预测块来对所述当前块进行解码
。2.
根据权利要求1所述的方法,其中,当所述合并模式语法元素指示使用合并模式时,对用于所述第二预测块的所述运动信息进行译码包括:对指示从其继承用于所述第二预测块的所述运动信息的合并候选的合并索引进行译码
。3.
根据权利要求1所述的方法,其中,当所述合并模式语法元素指示未使用合并模式时,对用于所述第二预测块的所述运动信息进行译码包括:对用于所述第二预测块的参考图片列表标识符

参考图片索引

运动矢量预测器索引和运动矢量差进行译码
。4.
根据权利要求1所述的方法,其中,形成所述合并候选列表包括:确定所述第二预测块的相邻块是使用第一运动信息和第二运动信息进行双预测的;以及从所述相邻块形成至少一个单预测合并候选,包括:仅为所述至少一个单预测合并候选选择所述第一运动信息或所述第二运动信息中的一项
。5.
根据权利要求4所述的方法,其中,形成所述合并候选列表包括:使用所述第一运动信息来形成第一单预测合并候选;以及使用所述第二运动信息来形成第二单预测合并候选
。6.
根据权利要求1所述的方法,其中,所述第二预测块包括多个额外预测假设中的一个额外预测假设,所述方法还包括:使用相同的合并候选列表来对用于所述额外预测假设中的每个额外预测假设的运动信息进行译码
。7.
根据权利要求1所述的方法,其中,形成所述合并候选列表包括:根据几何分割模式
(GPM)
的合并候选列表构造过程来形成所述合并候选列表
。8.
根据权利要求1所述的方法,其中,所述第二预测块包括多个额外预测假设中的一个额外预测假设,其中,对用于所述第二预测块的所述运动信息进行译码包括:形成包括两个或更多个合并候选的合并候选列表;从所述合并候选列表中为用于所述第二预测块的所述运动信息选择所述合并候选中的一个合并候选;以及使用所述合并候选中的所述一个合并候选来对用于所述第二预测块的所述运动信息进行译码,
所述方法还包括:从所述合并候选列表中移除所述合并候选中的所述一个合并候选,以形成缩减的合并候选列表;以及使用所述缩减的合并候选列表中的剩余合并候选中的一个合并候选来对用于第三预测候选的运动信息进行译码
。9.
根据权利要求8所述的方法,还包括:对用于所述第二预测块的第一合并候选索引进行译码,所述合并候选列表具有
N
个合并候选,
N
是大于1的正整数,所述第一合并候选索引具有最大可能截断二进制值
N
;以及对用于所述第三预测候选的第二合并候选索引进行译码,所述缩减的合并候选列表具有
N
‑1个合并候选,所述第二合并候选索引具有最大可能截断二进制值
N

1。10.
根据权利要求1所述的方法,其中,所述合并模式语法元素包括用于所述第一预测块的所述基本帧间预测模式的合并模式语法元素
。11.
根据权利要求1所述的方法,其中,所述合并模式语法元素包括第二合并模式语法元素,所述方法还包括:对用于所述第一预测块的所述基本帧间预测模式的第一合并模式语法元素进行译码,所述第二合并模式语法元素不同于所述第一合并模式语法元素
。12.
根据权利要求
11
所述的方法,其中,对所述第一合并模式语法元素进行译码包括:使用第一上下文自适应二进制算术译码
(CABAC)
上下文来对所述第一合并模式语法元素进行译码,并且其中,对所述第二合并模式语法元素进行译码包括:响应于已经使用所述第一
CABAC
上下文对所述第一合并模式语法元素进行了译码来使用所述第一
CABAC
上下文对所述第二合并模式语法元素进行译码
。13.
根据权利要求
12
所述的方法,所述第一
CABAC
上下文是用于合并模式的
CABAC
上下文
。14.
根据权利要求
12
所述的方法,所述第一
CABAC
上下文不同于用于合并模式的第二
CABAC
上下文
。15.
根据权利要求
11
所述的方法,其中,对所述第一合并模式语法元素进行译码包括:使用第一上下文自适应二进制算术译码
(CABAC)
上下文来对所述第一合并模式语法元素进行译码,并且其中,对所述第二合并模式语法元素进行译码包括:使用第二
CABAC
上下文来对所述第二合并模式语法元素进行译码
。16.
根据权利要求
15
所述的方法,所述第二
CABAC
上下文不同于所述第一
CABAC
上下文
。17.
根据权利要求1所述的方法,还包括:使用高级运动矢量预测
(AMVP)
模式来对第三预测块的运动信息进行译码,包括:对具有半亮度样本分辨率的运动矢量差
(MVD)
值进行译码,所述第三预测块是所述当前块的相邻块的基本帧间预测块;以及对将所述第三预测块标识为用于所述第二预测块的运动信息候选的候选索引进行译码,其中,生成所述第二预测块包括:使用六抽头插值滤波器来对用于所述第二预测块的参考块的半像素样本进行插值
。18.
根据权利要求1所述的方法,还包括:根据局部照度补偿
(LIC)
是否被应用于所述第一预测块来确定是否将
LIC
应用于所述第二预测块

19.
根据权利要求
18
所述的方法,其中,所述基本帧间预测模式包括单向帧间预测或双向帧间预测中的一项
。20.
根据权利要求
18
所述的方法,还包括:将
LIC
应用于所述第一预测块,其中,确定是否将
LIC
应用于所述第二预测块包括:响应于已经将
LIC
应用于所述第一预测块来确定将
LIC
应用于所述第二预测块
。21.
根据权利要求
18
所述的方法,还包括:将
LIC
应用于所述第一预测块;以及使用高级运动矢量预测
(AMVP)
模式来对用于所述第二预测块的运动信息进行译码,其中,确定是否将
LIC
应用于所述第二预测块包括:响应于将
LIC
应用于所述第一预测块来确定将
LIC
应用于所述第二预测块,以及使用
AMVP
来对用于所述第二预测块的所述运动信息进行译码
。22.
根据权利要求
18
所述的方法,还包括:将
LIC
应用于所述...

【专利技术属性】
技术研发人员:黄晗V
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1