插值滤波器的训练方法、装置及视频图像编解码方法、编解码器制造方法及图纸

技术编号:23789668 阅读:69 留言:0更新日期:2020-04-15 02:02
本申请实施例公开了一种插值滤波器的训练方法、装置及视频图像编解码方法、编解码器,该训练方法通过以传统的插值滤波器插值得到的第一分像素图像为标签数据,来训练第二插值滤波器,使得训得到的第二插值滤波器可直接用于插值得到第一分数像素位置的像素值,标签数据更加准确,提升视频图像的编解码性能。该编码方法在进行帧间预测过程中,通过从候选插值滤波器集合中确定用于所述当前编码图像块的目标插值滤波器,实现编码器根据当前编码图像块的内容选择合适的插值滤波器进行插值运算,使得得到的预测块预测准确性更高的预测块,减少码流,提高视频图像的压缩率。

Training method, device, video image codec method and codec of interpolation filter

【技术实现步骤摘要】
插值滤波器的训练方法、装置及视频图像编解码方法、编解码器
本申请涉及视频编解码
,尤其涉及一种插值滤波器的训练方法、装置及视频图像编解码方法、编解码器。
技术介绍
数字视频能力可并入到多种多样的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子图书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话(所谓的“智能电话”)、视频电话会议装置、视频流式传输装置及其类似者。数字视频装置实施视频压缩技术,例如,在由MPEG-2、MPEG-4、ITU-TH.263、ITU-TH.264/MPEG-4第10部分高级视频编码(AVC)定义的标准、视频编码标准H.265/高效视频编码(HEVC)标准以及此类标准的扩展中所描述的视频压缩技术。视频装置可通过实施此类视频压缩技术来更有效率地发射、接收、编码、解码和/或存储数字视频信息。视频压缩技术执行空间(图像内)预测和/或时间(图像间)预测以减少或去除视频序列中固有的冗余。对于基于块的视频编码,视频条带(即,视频帧或视频帧的一部分)可分割成若干图像块,所述图像块也可被称作树块、编码单元(CU)和/或编码节点。使用关于同一图像中的相邻块中的参考样本的空间预测来编码图像的待帧内编码(I)条带中的图像块。图像的待帧间编码(P或B)条带中的图像块可使用相对于同一图像中的相邻块中的参考样本的空间预测或相对于其它参考图像中的参考样本的时间预测。图像可被称作帧,且参考图像可被称作参考帧。其中,包含高效视频编码(HEVC)标准在内的各种视频编码标准提出了用于图像块的预测性编码模式,即基于已经编码的视频数据块来预测当前待编码的块。在帧内预测模式中,基于与当前块在相同的图像中的一或多个先前经解码相邻块来预测当前块;在帧间预测模式中,基于不同图像中的已经解码块来预测当前块。然而,在帧间预测模式中,运动矢量指向分像素时,需要对最优匹配的参考块进行分像素插值,现有技术中通常使用固定系数的插值滤波器进行分像素插值,对于目前多样性和非平稳性的视频信号,预测的准确性差,导致视频图像的编解码性能差。
技术实现思路
本申请实施例提供一种插值滤波器的训练方法、装置及视频图像编解码方法、编解码器,可提高图像块的运动信息的预测准确性,从而提高编解码性能。第一方面,本申请实施例提供了一种插值滤波器的训练方法,包括:计算设备通过第一插值滤波器对样本图像在整数像素位置的像素进行插值,得到所述样本图像在第一分数像素位置的第一分像素图像;将所述样本图像输入到第二插值滤波器中,得到第二分像素图像;进而,通过最小化用于表示所述第一分像素图像与所述第二分像素图像的差值的第一函数确定所述第二插值滤波器的滤波器参数。可见,本申请实施例,以传统的插值滤波器插值得到的第一分像素图像为标签数据,来训练第二插值滤波器,使得训得到的第二插值滤波器可直接用于插值得到第一分数像素位置的像素值,标签数据更加准确,提升视频图像的编解码性能。而且,通过神经网络的第二插值滤波器为非线性滤波器在进行预测时,对于复杂视频信号预测的准确性差,可进一步提升视频图像的编解码性能。第二方面,本申请实施例还提供了一种插值滤波器的训练方法,包括:计算设备通过第一插值滤波器对样本图像在整数像素位置的像素进行插值,得到所述样本图像在第一分数像素位置的第一分像素图像;将所述样本图像输入到第二插值滤波器中,得到第二分像素图像;将所述第二分像素图像经过翻转运算输入到第三插值滤波器中,得到第一图像,并将所述第一图像通过所述翻转运算的逆运算得到第二图像,其中,所述第二插值滤波器和所述第三插值滤波器共享滤波器参数;进而,根据用于表示所述第一分像素图像与所述第二分像素图像的差值的第一函数和用于表示所述样本图像与所述第二图像的差值的第二函数确定所述滤波器参数。可见,本专利技术实施例通过传统插值滤波器对样本图像进行分像素插值,得到第一分像素图像,并作为标签数据,利用分像素的可逆性原理,通过同时最小化用于表示第一分像素图像与第二分像素图像的差值的第一函数和用于表示样本图像与第二图像的差值的第二函数来确定所述滤波器参数,实现了通过监督样本图像来约束第二插值滤波器,提高第二插值滤波器进行分像素插值的准确性,进而提升视频图像的编解码性能。可选地,计算设备根据用于表示所述第一分像素图像与所述第二分像素图像的差值的第一损失函数和用于表示所述样本图像与所述第二图像的差值的第二函数确定所述滤波器参数的可以包括但不限于以下两种实现方式:第一种实现方式:计算设备通过最小化第三函数确定所述滤波器参数,其中,所述第三函数为用于表示所述第一分像素图像与所述第二分像素图像的差值的第一函数和用于表示所述样本图像与所述第二图像的差值的第二函数的加权求和。第二种实现方式:通过交替最小化用于表示所述第一分像素图像与所述第二分像素图像的差值的第一损失函数和用于表示所述样本图像与所述第二图像的差值的第二函数确定所述滤波器参数。应理解,第一方面和第二方面所述的计算设备可以是编码设备或压缩设备,上述设备可以是计算机、服务器或终端(例如,手机、平板电脑等)等具有数据处理功能的设备。第三方面,本申请实施例还提供了一种视频图像编码方法,包括:编码器对所述当前编码图像块进行帧间预测,得到所述当前编码图像块的运动信息,其中,所述当前编码图像块的运动信息指向分数像素位置,所述帧间预测过程包括:从候选插值滤波器集合中确定用于所述当前编码图像块的目标插值滤波器;基于所述当前编码图像块的帧间预测模式和所述当前编码图像块的运动信息对所述当前编码图像块进行编码,得到编码信息,将所述编码信息编入码流,其中,所述编码信息包括目标插值滤波器的指示信息;所述目标插值滤波器的指示信息用于指示通过所述目标插值滤波器进行分像素插值得到所述当前编码图像块对应的分数像素位置的参考块。第四方面,本申请实施例还提供了一种视频图像编码方法,包括:编码器对所述当前编码图像块进行帧间预测,得到所述当前编码图像块的运动信息,其中,所述当前编码图像块的运动信息指向分数像素位置,所述帧间预测过程包括:从候选插值滤波器集合中确定用于所述当前编码图像块的目标插值滤波器;基于所述当前编码图像块的帧间预测模式和所述当前编码图像块的运动信息对所述当前编码图像块进行编码,得到编码信息,将所述编码信息编入到码流,其中,若所述当前编码图像块的帧间预测模式是目标帧间预测模式,所述编码信息不包括所述目标插值滤波器的指示信息;若所述当前编码图像块的帧间预测模式为非目标帧间预测模式,所述编码信息包括所述目标插值滤波器的指示信息,所述目标插值滤波器的指示信息用于指示所述当前编码图像块采用所述目标插值滤波器进行分像素插值。可见,本申请实施例中,编码器在进行帧间预测过程中可以根据当前编码图像块的内容选择插值滤波器进行插值运算,使得得到的预测块预测准确性更高的预测块,减少码流,提高视频图像的压缩率。...

【技术保护点】
1.一种插值滤波器训练方法,其特征在于,包括:/n通过第一插值滤波器对样本图像在整数像素位置的像素进行插值,得到所述样本图像在第一分数像素位置的第一分像素图像;/n将所述样本图像输入到第二插值滤波器中,得到第二分像素图像;/n通过最小化用于表示所述第一分像素图像与所述第二分像素图像的差值的第一函数确定所述第二插值滤波器的滤波器参数。/n

【技术特征摘要】
1.一种插值滤波器训练方法,其特征在于,包括:
通过第一插值滤波器对样本图像在整数像素位置的像素进行插值,得到所述样本图像在第一分数像素位置的第一分像素图像;
将所述样本图像输入到第二插值滤波器中,得到第二分像素图像;
通过最小化用于表示所述第一分像素图像与所述第二分像素图像的差值的第一函数确定所述第二插值滤波器的滤波器参数。


2.一种基于插值滤波器训练方法,其特征在于,包括:
通过第一插值滤波器对样本图像在整数像素位置的像素进行插值,得到所述样本图像在第一分数像素位置的第一分像素图像;
将所述样本图像输入到第二插值滤波器中,得到第二分像素图像;
将所述第二分像素图像经过翻转运算输入到第三插值滤波器中,得到第一图像,并将所述第一图像通过所述翻转运算的逆运算得到第二图像,其中,所述第二插值滤波器和所述第三插值滤波器共享滤波器参数;
根据用于表示所述第一分像素图像与所述第二分像素图像的差值的第一函数和用于表示所述样本图像与所述第二图像的差值的第二函数确定所述滤波器参数。


3.根据权利要求2所述的方法,其特征在于,所述根据用于表示所述第一分像素图像与所述第二分像素图像的差值的第一损失函数和用于表示所述样本图像与所述第二图像的差值的第二函数确定所述滤波器参数,具体包括:
通过最小化第三函数确定所述滤波器参数,其中,所述第三函数为用于表示所述第一分像素图像与所述第二分像素图像的差值的第一函数和用于表示所述样本图像与所述第二图像的差值的第二函数的加权求和。


4.根据权利要求2所述的方法,其特征在于,所述根据用于表示所述第一分像素图像与所述第二分像素图像的差值的第一函数和用于表示所述样本图像与所述第二图像的差值的第二函数确定所述滤波器参数,具体包括:
通过交替最小化用于表示所述第一分像素图像与所述第二分像素图像的差值的第一损失函数和用于表示所述样本图像与所述第二图像的差值的第二函数确定所述滤波器参数。


5.一种视频图像编码方法,其特征在于,包括:
对所述当前编码图像块进行帧间预测,得到所述当前编码图像块的运动信息,其中,所述当前编码图像块的运动信息指向分数像素位置,所述帧间预测过程包括:从候选插值滤波器集合中确定用于所述当前编码图像块的目标插值滤波器;
基于所述当前编码图像块的帧间预测模式和所述当前编码图像块的运动信息对所述当前编码图像块进行编码,得到编码信息,将所述编码信息编入码流,其中,所述编码信息包括目标插值滤波器的指示信息;所述目标插值滤波器的指示信息用于指示通过所述目标插值滤波器进行分像素插值得到所述当前编码图像块对应的分数像素位置的参考块。


6.根据权利要求5所述的方法,其特征在于,所述从候选插值滤波器集合中确定用于所述当前编码图像块的目标插值滤波器,包括:
根据率失真代价准则从候选插值滤波器集合中确定用于所述当前编码图像块的目标插值滤波器。


7.根据权利要求5所述的方法,其特征在于,所述对所述当前编码图像块进行帧间预测,得到所述当前编码图像块的运动信息,包括:
确定与所述当前编码图像块最优匹配的整像素参考图像块;
通过候选插值滤波器集合中每一个插值滤波器对所述整像素参考图像块进行分像素插值,得到N个分像素参考图像块,N为正整数;
在所述整像素参考图像块和所述N个分像素参考图像块中确定与所述当前编码图像块最优匹配的预测块;
基于所述预测块确定所述运动信息,其中,插值得到所述预测块的插值滤波器即为目标插值滤波器。


8.根据权利要求5-7任一项所述的方法,其特征在于,所述候选插值滤波器集合包括通过如权利要求1-4任意权利要求所述插值滤波器的训练方法得到的第二插值滤波器。


9.根据权利要求8所述的方法,其特征在于,若所述目标滤波器为通过所述如权利要求1-4任意权利要求所述的插值滤波器的训练方法得到的第二插值滤波器,则:
所述目标插值滤波器的滤波器参数为预设的滤波器参数;或者,所述目标插值滤波器的滤波器参数为根据权利要求1-4所述的插值滤波器的训练方法得到的滤波器参数。


10.根据权利要求9所述的方法,其特征在于,所述编码信息还包括训练得到的所述目标插值滤波器的滤波器参数;或者,所述编码信息还包括滤波器参数差值,所述滤波器参数差值为训练得到的用于当前图像单元的目标插值滤波器的滤波器参数相对于训练得到的用于在先编码的图像单元的目标插值滤波器的滤波器参数。


11.根据权利要求10所述的方法,其特征在于,所述图像单元包括图像帧、条带(slice)、视频序列子组、编码树单元(CTU)、编码单元(CU)或预测单元(PU)。


12.一种视频图像编码方法,其特征在于,包括:
对所述当前编码图像块进行帧间预测,得到所述当前编码图像块的运动信息,其中,所述当前编码图像块的运动信息指向分数像素位置,所述帧间预测过程包括:从候选插值滤波器集合中确定用于所述当前编码图像块的目标插值滤波器;
基于所述当前编码图像块的帧间预测模式和所述当前编码图像块的运动信息对所述当前编码图像块进行编码,得到编码信息,将所述编码信息编入到码流,其中,若所述当前编码图像块的帧间预测模式是目标帧间预测模式,所述编码信息不包括所述目标插值滤波器的指示信息;若所述当前编码图像块的帧间预测模式为非目标帧间预测模式,所述编码信息包括所述目标插值滤波器的指示信息,所述目标插值滤波器的指示信息用于指示所述当前编码图像块采用所述目标插值滤波器进行分像素插值。


13.根据权利要求12所述的方法,其特征在于,所述从候选插值滤波器集合中确定用于所述当前编码图像块的目标插值滤波器,包括:
根据率失真代价准则从候选插值滤波器集合中确定用于所述当前编码图像块的目标插值滤波器。


14.根据权利要求12所述的方法,其特征在于,所述对所述当前编码图像块进行帧间预测,得到所述当前编码图像块的运动信息,包括:
确定与所述当前编码图像块最优匹配的整像素参考图像块;
通过候选插值滤波器集合中每一个插值滤波器对所述整像素参考图像块进行分像素插值,得到N个分像素参考图像块,N为正整数;
在所述整像素参考图像块和所述N个分像素参考图像块中确定与所述当前编码图像块最优匹配的预测块;
基于所述预测块确定所述运动信息,其中,插值得到所述预测块的插值滤波器即为目标插值滤波器。


15.根据权利要求12-14任一项所述的方法,其特征在于,所述候选插值滤波器集合包括通过如权利要求1-4任意权利要求所述的插值滤波器的训练方法得到的第二插值滤波器。


16.根据权利要求15所述的方法,其特征在于,若所述目标滤波器为通过所述如权利要求1-4任意权利要求所述的插值滤波器的训练方法得到的第二插值滤波器,则:
所述目标插值滤波器的滤波器参数为预设的滤波器参数;或者,所述目标插值滤波器的滤波器参数为根据权利要求1-4所述的插值滤波器的训练方法得到的滤波器参数。


17.根据权利要求16所述的方法,其特征在于,所述编码信息还包括训练得到的所述目标插值滤波器的滤波器参数;或者,所述编码信息还包括滤波器参数差值,所述滤波器参数差值为训练得到的用于当前编码的图像单元的目标插值滤波器的滤波器参数相对于训练得到的用于在先编码的图像单元的目标插值滤波器的滤波器参数。


18.根据权利要求17所述的方法,其特征在于,所述图像单元包括图像帧、条带(slice)、视频序列子组、编码树单元(CTU)、编码单元(CU)或预测单元(PU)。


19.一种视频图像解码方法,其特征在于,包括:
从码流中解析出目标插值滤波器的指示信息;
获取当前解码图像块的运动信息,其中,所述运动信息指向分数像素位置;
基于所述当前解码图像块的运动信息对所述当前解码图像块执行预测过程,其中,所述预测过程包括:根据所述指示信息所指示的目标插值滤波器进行分像素插值,得到所述当前解码图像块的预测块;
基于所述当前解码图像块的预测块,重建所述当前解码图像块的重建块。


20.根据权利要求19所述的方法,其特征在于,所述获取当前解码图像块的运动信息,包括:
从码流中解析出所述当解码图像块的运动信息的索引;
基于所述当解码图像块的运动信息的索引和所述当前解码图像块的候选运动信息列表确定所述当前解码图像块的运动信息。


21.根据权利要求19所述的方法,其特征在于,所述获取当前解码图像块的运动信息,包括:
从码流中解析出所述当解码图像块的运动信息的索引和运动矢量差值;
基于所述当解码图像块的运动信息的索引和所述当前解码图像块的候选运动信息列表确定当前解码图像块的运动矢量预测值;
基于所述运动矢量预测值和所述运动矢量差值,得到所述当前解码图像块的运动矢量。


22.根据权利要求19所述的方法,其特征在于,所述获取当前解码图像块的运动信息包括:
若所述当前解码图像块的帧间预测模式为合并模式(mergemode),获取在所述合并模式下合并到的在先解码的图像块的运动信息,即为当前解码图像块的运动信息。


23.根据权利要求20-22任一项所述的方法,其特征在于,若所述目标滤波器为通过所述如权利要求1-4任意权利要求所述的插值滤波器的训练方法得到的第二插值滤波器,则:
所述目标插值滤波器的滤波器参数为预设的滤波器参数;或者,所述目标插值滤波器的滤波器参数为根据权利要求1-4所述的插值滤波器的训练方法得到的滤波器参数。


24.根据权利要求23所述的方法,其特征在于,所述方法还包括:
从码流中解析出用于当前解码的图像单元的目标插值滤波器的滤波器参数;
通过所述用于当前解码的图像单元的目标插值滤波器的滤波器参数配置所述目标插值滤波器。


25.根据权利要求23所述的方法,其特征在于,所述方法还包括:
从码流中解析出滤波器参数差值,所述滤波器参数差值为用于当前解码的图像单元的目标插值滤波器的滤波器参数相对于用于在先解码的图像单元的目标插值滤波器的滤波器参数用于当前解码的图像单元的目标插值滤波器的滤波器参数;
根据所述在先解码的图像单元的目标插值滤波器的滤波器参数和所述滤波器参数差值得到所述当前解码的图像单元的目标插值滤波器的滤波器参数;
通过所述当前解码的图像单元的目标插值滤波器的滤波器参数配置所述目标插值滤波器。


26.根据权利要求24或25所述的方法,其特征在于,所述图像单元包括图像帧、条带(slice)、视频序列子组、编码树单元(CTU)、编码单元(CU)或预测单元(PU)。


27.一种视频图像解码方法,其特征在于,包括:
从码流中解析出当前解码图像块的用于指示所述当前解码图像块的帧间预测模式的信息;
获取所述当前解码图像块的运动信息,其中,所述运动信息指向分数像素位置;
若所述当前图像块的帧间预测模式为非目标帧间预测模式,基于所述当前解码图像块的运动信息对所述当前解码图像块执行预测过程,其中,所述预测过程包括:根据从所述码流中解析出的目标插值滤波器的指示信息所指示的目标插值滤波器进行分像素插值,得到所述当前解码图像块的预测块;
基于所述当前解码图像块的预测块,对所述当前解码图像块进行重建。


28.根据权利要求27所述的方法,其特征在于,所述获取当前解码图像块的运动信息,包括:
从码流中解析出所述当解码图像块的运动信息的索引;
基于所述当解码图像块的运动信息的索引和所述当前解码图像块的候选运动信息列表确定所述当前解码图像块的运动信息。


29.根据权利要求27所述的方法,其特征在于,所述获取当前解码图像块的运动信息,包括:
从码流中解析出所述当解码图像块的运动信息的索引和运动矢量差值;
基于所述当解码图像块的运动信息的索引和所述当前解码图像块的候选运动信息列表确定所述当前解码图像块的运动矢量预测值;
基于所述运动矢量预测值和所述运动矢量差值,得到所述当前解码图像块的运动矢量。


30.根据权利要求27所述的方法,其特征在于,若所述当前图像块的帧间预测模式是目标帧间预测模式,基于所述当前解码图像块的运动信息对所述当前解码图像块执行预测过程,其中,所述预测过程包括:确定用于所述当前解码图像块的目标插值滤波器;通过所述目标插值滤波器进行分像素插值,得到所述当前解码图像块的预测块。


31.根据权利要求30所述的方法,其特征在于,所述目标帧间预测模式为合并模式,其中,
所述获取所述当前解码图像块的运动信息,包括:获取在所述合并模式下合并到的在先解码的图像块的运动信息;
所述确定用于所述当前解码图像块的目标插值滤波器,包括:确定在所述先解码的图像块在解码过程中使用的插值滤波器为所述用于所述当前解码图像块的目标插值滤波器;或,确定所述用于所述当前解码图像块的目标插值滤波器为从所述码流中解析出的目标插值滤波器的指示信息所指示的目标插值滤波器。


32.根据权利要求27-31任一项所述的方法,其特征在于,若所述目标滤波器为通过所述如权利要求1-4任意权利要求所述的插值滤波器的训练方法得到的第二插值滤波器,则:
所述目标插值滤波器的滤波器参数为预设的滤波器参数;或者,所述目标插值滤波器的滤波器参数为根据权利要求1-4所述的插值滤波器的训练方法得到的滤波器参数。


33.根据权利要求27-32任一项所述的方法,其特征在于,若所述目标滤波器为通过所述如权利要求1-4任意权利要求所述的插值滤波器的训练方法得到的第二插值滤波器,所述方法还包括:
从码流中解析出用于当前解码的图像单元的目标插值滤波器的滤波器参数;
通过所述当前解码的图像单元的目标插值滤波器的滤波器参数配置所述目标插值滤波器。


34.根据权利要求27-32任一项所述的方法,其特征在于,若所述目标滤波器为通过所述如权利要求1-4任意权利要求所述的插值滤波器的训练方法得到的第二插值滤波器,所述方法还包括:
从码流中解析出滤波器参数差值,所述滤波器参数差值为用于当前解码的图像单元的目标插值滤波器的滤波器参数相对于用于在先解码的图像单元的目标插值滤波器的滤波器参数用于当前解码的图像单元的目标插值滤波器的滤波器参数;
根据所述在先解码的图像单元的目标插值滤波器的滤波器参数和所述滤波器参数差值得到所述当前解码的图像单元的目标插值滤波器的滤波器参数;
通过所述当前解码的图像单元的目标插值滤波器的滤波器参数配置所述目标插值滤波器。


35.根据权利要求33或34所述的方法,其特征在于,所述图像单元包括图像帧、条带(slice)、视频序列子组、编码树单元(CTU)、编码单元(CU)或预测单元(PU)。


36.一种插值滤波器训练装置,其特征在于,包括:
标签数据获取模块,用于通过第一插值滤波器对样本图像在整数像素位置的像素进行插值,得到所述样本图像在第一分数像素位置的第一分像素图像;
插值模块,用于将所述样本图像输入到第二插值滤波器中,得到第二分像素图像;
参数确定模块,用于通过最小化用于表示所述第一分像素图像与所述第二分像素图像的差值的第一函数确定所述第二插值滤波器的滤波器参数。


37.一种插值滤波器训练装置,其特征在于,包括:
标签数据获取模块,用于通过第一插值滤波器对样本图像在整数像素位置的像素进行插值,得到所...

【专利技术属性】
技术研发人员:吴枫闫宁刘东李厚强杨海涛
申请(专利权)人:华为技术有限公司中国科学技术大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1