基于人类视觉系统的视频编码方法和装置制造方法及图纸

技术编号:38851153 阅读:12 留言:0更新日期:2023-09-17 09:59
本发明专利技术提供了一种基于人类视觉系统的视频编码方法和装置。其中,该方法包括根据编码器的码控算法获得目标视频帧的帧级量化参数值,以及根据感兴趣区域识别与帧级量化参数值获得内块级量化参数值;根据目标视频帧的原始数据以及编码器的类型,获得与目标视频帧对应的块级主观质量饱和最小量化参数值;然后将感兴趣区域识别模块给出的编码方案与饱和质量模块给出的编码方案进行比较以获得目标编码量化参数值,采用目标编码量化参数值对目标视频帧进行视频编码并输出码流。本发明专利技术所提供的技术方案能够判断视频主观质量达到饱和时的最低量化参数值,从而对量化参数值的调整进行限制,从而避免码率浪费并提升整体的视频质量。量。量。

【技术实现步骤摘要】
基于人类视觉系统的视频编码方法和装置


[0001]本专利技术涉及视频编码
,尤其涉及一种基于人类视觉系统的视频编码方法和装置。

技术介绍

[0002]基于主观感兴趣区域(Region of interest,ROI)编码是一种被广泛使用的提升视频主观质量的编码方案。这种编码方案能够利用人眼主观存在感兴趣区域和非感兴趣区域的特点,对两类区域的码率分配做一定的修正。具体而言,对图像中人眼感兴趣的区域减少量化参数值(Quantization Parameter,QP),分配更多码率以提升画面质量;对人眼不感兴趣的区域增加量化参数值,分配更少码率。基于ROI的视频编码能够在不增加带宽和存储空间的前提下,整体上提升视频的主观质量。
[0003]在实现上,基于感兴趣区域的视频编码通常分为感兴趣区域识别提取主观感兴趣区域与基于主观感兴趣区域进行视频编码两个步骤。
[0004]提取主观感兴趣区域可以通过眼动仪收集实际用户的眼动数据,或者使用基于人工智能的网络模型来判断图像各个区域的重要程度。基于主观感兴趣区域进行视频编码则是通过编码器的自适应量化(Adaptive Quantization,AQ)功能调整各个区域的量化参数值来实现。即,对不同的主观感兴趣区域和非感兴趣区域做不同的量化参数值调整,量化参数值越小,则质量越好,码率也会越高;而量化参数值越大,则宏块得到的码率越小,画质也越差。通过上述调整,能够实现感兴趣区域的权重调整。
[0005]然而,现有技术基于感兴趣区域的视频编码方案中,感兴趣区域识别与视频编码是相互独立的两个过程。感兴趣区域识别仅能够对原始图像进行分析,无法考虑后续编码过程对最终主观质量的影响;而视频编码也仅是简单依据感兴趣区域识别的结果,简单地来提升感兴趣区域质量并降低非感兴趣区域的质量。这就导致,当量化参数值足够低(即视频质量足够高)时,继续降低量化参数值(即提升编码质量)虽然会提升码率但对主观质量的改善十分有限,从而在感兴趣区域浪费了过多码率。

技术实现思路

[0006]鉴于此,本专利技术提供了一种基于人类视觉系统的视频编码方法和装置,以用于解决现有技术中的上述技术问题。
[0007]根据本专利技术的一个方面,提供了一种基于人类视觉系统的视频编码方法,该方法包括将输入视频中的每一帧作为目标视频帧,目标视频帧包括多个预设编码块,依次执行以下步骤:S1:根据编码器的码控算法获得目标视频帧的帧级量化参数值;S2: 根据感兴趣区域识别以及帧级量化参数值获得目标视频帧的内块级量化参数值;S3:根据目标视频帧的原始数据以及编码器类型,获得与目标视频帧对应的块级
主观质量饱和最小量化参数值;S4:采用目标编码量化参数值对目标视频帧进行视频编码并输出码流,其中目标视频帧中每一预设编码块的目标编码量化参数值为以下两个数值中的最大值:帧级量化参数值与内块级量化参数值之和、块级主观质量饱和最小量化参数值。
[0008]根据本专利技术的另一个方面,提供了一种基于人类视觉系统的视频编码装置,该装置包括将输入视频中的每一帧作为目标视频帧,目标视频帧包括多个预设编码块,依次执行以下模块:编码器码率控制模块,被配置为根据编码器的码控算法获得目标视频帧的帧级量化参数值;感兴趣区域识别模块,被配置为根据感兴趣区域识别以及帧级量化参数值获得目标视频帧的内块级量化参数值;饱和质量模块,被配置为根据目标视频帧的原始数据以及编码器类型,获得与目标视频帧对应的块级主观质量饱和最小量化参数值;视频编码模块,被配置为采用目标编码量化参数值对目标视频帧进行视频编码并输出码流,其中目标视频帧中每一编码块的目标编码量化参数值为以下两个数值中的最大值:帧级量化参数值与内块级量化参数值之和、块级主观质量饱和最小量化参数值。
[0009]根据本专利技术的另一个方面,提供了一种基于人类视觉系统的视频编码装置,该装置包括将输入视频中的每一帧作为目标视频帧,目标视频帧包括多个预设编码块,依次执行以下模块:编码器码率控制模块,被配置为根据编码器的码控算法获得目标视频帧的帧级量化参数值;感兴趣区域识别模块,被配置为根据感兴趣区域识别以及帧级量化参数值获得目标视频帧的内块级量化参数值;饱和质量模块,被配置为根据目标视频帧的原始数据以及编码器类型,获得与目标视频帧对应的块级主观质量饱和最小量化参数值;视频编码模块,被配置为采用目标编码量化参数值对目标视频帧进行视频编码并输出码流,其中目标视频帧中每一编码块的目标编码量化参数值为以下两个数值中的最大值:帧级量化参数值与内块级量化参数值之和、块级主观质量饱和最小量化参数值。
[0010]根据本专利技术的再另一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,使处理器执行上述的方法。
[0011]从以上技术方案可以看出,本专利技术所提供的技术方案至少存在以下优点:本专利技术所提供的技术方案能够根据给定的输入视频帧和编码器类型(例如H264/H265/AV1等),判断视频主观质量达到饱和时的最低量化参数值,从而对感兴趣区域量化参数值的调整进行限制,避免了因分配额外码率到主观质量已经接近饱和的区域而导致的码率浪费,也提升了整体的视频质量。
附图说明
[0012]附图用来提供对本专利技术技术方案的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术的技术方案,但并不构成对本专利技术技术方案的限制。
[0013]图1示出了本专利技术示例性实施例所提供的方法的流程图;图2示出了本专利技术示例性实施例所提供的装置的结构框图;图3示出了本专利技术示例性实施例所提供的方法中采用的基于人工智能网络的人类视觉系统模型;图4示出了本专利技术示例性实施例所提供的另一装置的结构框图;图5示出了本专利技术示例性实施例所提供的的电子设备的结构框图。
具体实施方式
[0014]下面将参照附图来详细描述本专利技术的各种示例性实施例。对示例性实施例的描述仅仅是说明性的,并不作为对本专利技术及其应用或使用的任何限制。本专利技术可以以许多不同的形式实现,不限于这里所述的实施例。提供这些实施例是为了使本专利技术透彻且完整,并且向本领域技术人员充分表达本专利技术的范围。
[0015]除非上下文明确表明,如果未特意限定要素的数量,则该要素可以是一个或多个。如本说明书使用的,术语“多个/若干/这些”意指两个或更多,术语“基于/根据”应解释为“至少部分地基于/根据”。此外,术语“和/或”以及
“…
中的至少一个”涵盖所列出的项目中的任何一个以及全部可能的组合方式。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。
[0016]请参考图1,其示出了本专利技术示例性实施例所提供的方法的流程图。
[0017]本专利技术的一个方面提供了一种基于人类视觉系统的视频编码方法,其中,该方法包括将输入视频中的每一帧作为目标视频帧,其中目标视频帧包括多个预设编码块,依次执行以下步骤:S1:根据编码器的码控算法获得目标视频帧的帧级量化参数值;S2: 根据感兴趣区域识别以及帧级量化参数值获得目本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人类视觉系统的视频编码方法,其特征在于,所述方法包括将输入视频中的每一帧作为目标视频帧,所述目标视频帧包括多个预设编码块,依次执行以下步骤:S1:根据编码器的码控算法获得所述目标视频帧的帧级量化参数值;S2: 根据感兴趣区域识别以及所述帧级量化参数值获得所述目标视频帧的内块级量化参数值;S3:根据所述目标视频帧的原始数据以及所述编码器的类型,获得与所述目标视频帧对应的块级主观质量饱和最小量化参数值;S4:采用目标编码量化参数值对所述目标视频帧进行视频编码并输出码流,其中所述目标视频帧中每一预设编码块的目标编码量化参数值为以下两个数值中的最大值:帧级量化参数值与内块级量化参数值之和、 块级主观质量饱和最小量化参数值。2.根据权利要求1所述的基于人类视觉系统的视频编码方法,其特征在于,所述块级主观质量饱和最小量化参数值通过预先训练好的以包括所述目标视频帧的视频帧原始数据、编码器的类型作为输入参数的基于人工智能网络的人类视觉系统模型的训练数据集生成。3.根据权利要求2所述的基于人类视觉系统的视频编码方法,其特征在于,所述训练数据集通过以下方式获得:S30:获得视频帧原始数据以及编码器类型;S31:分别获得所述多个预设编码块中的每一个所对应的预设编码块原始数据,并针对所述多个预设编码块中的每一个分别执行以下步骤:S310:在所述编码器类型下,使用不同的固定量化参数值进行编码,以获得与所述不同的固定量化参数值相对应的多个固定编码结果;S320:对所述多个固定编码结果进行画质比较,找出其中画质不低于人眼主观质量饱和程度时所对应的最小固定量化参数值,并将所述最小固定量化参数值作为块级主观质量饱和最小量化参数值;S330:获得多组包括视频帧原始数据、预设编码块原始数据、编码器类型和块级主观质量饱和最小量化参数值的数据集,作为所述训练数据集。4.根据权利要求3所述的基于人类视觉系统的视频编码方法,其特征在于,S320中所述画质比较的方式包括人眼主观对比方式和/或客观指标对比方式。5.根据权利要求4所述的基于人类视觉系统的视频编码方法,其特征在于,所述内块级量化参数值为根据感兴趣区域...

【专利技术属性】
技术研发人员:邵明凯舒晓李想殷婷
申请(专利权)人:瀚博半导体上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1