【技术实现步骤摘要】
【国外来华专利技术】使用分离的学习通路和滤波通路的视频代码化
技术介绍
数字视频流可以使用帧或静止图像的序列来表示视频。数字视频能够被用于各种应用,包括例如视频会议、高清晰度视频娱乐、视频广告或用户生成的视频共享。数字视频流能够包含大量数据并且消耗计算设备的大量计算或通信资源以进行视频数据的处理、传输或存储。已经提出各种方法(包括编码或者解码技术)来减少视频流中的数据量。
技术实现思路
根据本公开的实施方式的解码器包括熵解码级、去量化级、逆变换级、重构级、第一后置重构通路和第二后置重构通路。熵解码级对表示来自编码比特流的编码视频帧的语法元素进行熵解码,以产生量化变换系数。去量化级对量化变换系数进行去量化,以产生变换系数。逆变换级对变换系数进行逆变换,以产生预测残差。重构级重构预测残差,以产生重构帧。第一后置重构通路使用一种或多种滤波技术对重构帧的第一副本进行滤波,以产生滤波帧,其中,滤波帧被包括在输出视频流中,以在用户设备上显示。第二后置重构通路使用重构帧的第二副本训练学习模型。与使用滤波帧训练学习模型相比,使用重构帧的第二副本训练学习模型会导致学习模型的分类精度上限更大。根据本公开的实施方式的方法包括对表示编码视频数据的量化变换系数进行去量化,以产生变换系数。方法进一步包括对变换系数进行逆变换,以产生预测残差。方法进一步包括重构预测残差,以产生重构帧。方法进一步包括对重构帧的第一副本进行滤波,以产生滤波帧。方法进一步包括使用学习模型处理重构帧的第二副本,以标识视频内容。根据本公开的实施方式的集成电路包括执行指令的处理器。指令包括 ...
【技术保护点】
1.一种解码器,包括:/n熵解码级,所述熵解码级被配置为对表示来自编码比特流的编码视频帧的语法元素进行熵解码,以产生量化变换系数;/n去量化级,所述去量化级被配置为对所述量化变换系数进行去量化,以产生变换系数;/n逆变换级,所述逆变换级被配置为对所述变换系数进行逆变换,以产生预测残差;/n重构级,所述重构级被配置为重构所述预测残差,以产生重构帧;/n第一后置重构通路,所述第一后置重构通路被配置为使用一种或多种滤波技术对所述重构帧的第一副本进行滤波,以产生滤波帧,其中,所述滤波帧用于被包括在输出视频流中,以在用户设备上显示;以及/n第二后置重构通路,所述第二后置重构通路被配置为使用所述重构帧的第二副本来训练学习模型。/n
【技术特征摘要】
【国外来华专利技术】20180911 US 16/127,6371.一种解码器,包括:
熵解码级,所述熵解码级被配置为对表示来自编码比特流的编码视频帧的语法元素进行熵解码,以产生量化变换系数;
去量化级,所述去量化级被配置为对所述量化变换系数进行去量化,以产生变换系数;
逆变换级,所述逆变换级被配置为对所述变换系数进行逆变换,以产生预测残差;
重构级,所述重构级被配置为重构所述预测残差,以产生重构帧;
第一后置重构通路,所述第一后置重构通路被配置为使用一种或多种滤波技术对所述重构帧的第一副本进行滤波,以产生滤波帧,其中,所述滤波帧用于被包括在输出视频流中,以在用户设备上显示;以及
第二后置重构通路,所述第二后置重构通路被配置为使用所述重构帧的第二副本来训练学习模型。
2.根据权利要求1所述的解码器,其中,所述第二后置重构通路被配置为使用所述重构帧的所述第二副本和从所述第一后置重构通路接收到的滤波器侧信息来训练所述学习模型。
3.根据权利要求1或2所述的解码器,其中,在所述熵解码级、所述去量化级、所述逆变换级、所述重构级和所述第二后置重构通路执行的每个函数都是内射函数,其中,在所述第一后置重构通路执行的至少一个函数是非内射函数。
4.根据权利要求1或2所述的解码器,其中,所述重构帧是第一重构帧,其中,所述重构级被进一步配置为产生第二重构帧,其中,所述第一后置重构通路被配置为对所述第二重构帧的第一副本进行滤波,其中,所述第二后置重构通路被配置为使用经训练的学习模型对所述第二帧的第二副本执行一个或多个推理操作。
5.根据权利要求1至4中任一项所述的解码器,其中,所述一种或多种滤波技术包括使用环内滤波器执行的滤波技术。
6.根据权利要求1至5中任一项所述的解码器,其中,与使用所述滤波帧训练所述学习模型相比,使用所述重构帧的所述第二副本训练所述学习模型导致了所述学习模型的更大分类精度上限。
7.一种方法,包括:
对表示编码视频数据的量化变换系数进行去量化,以产生变换系数;
对所述变换系数进行逆变换,以产生预测残差;
重构所述预测残差,以产生重构帧;
对所述重构帧的第一副本进行滤波,以产生滤波帧;以及
使用学习模型来处理所述重构帧的第二副本,以标识视频内容。
8.根据权利要求7所述的方法,其中,使用所述学习模型来处理所述重构帧的所述第二副本以标识所述视频内容包括:
使用所述重构帧的所述第二副本训练所述学习模型,以标识所述视频内容。
9.根据权利要求8所述的方法,与使用所述滤波帧训练所述学习模型相比,使用所述重构帧的所述第二副本训练所述学习模型导致了所述学习模型的更大分类精度上限。
10.根据权利要求8或9所述的方法,其中,使用所述重构帧的所述第二副本训练所述学习模型以标识所述视频内容包括:
使用滤波器侧信息来训练所述学习模型,其中,所述滤波器侧信息被用于对所述重构帧的所述第一副本进行滤波。
11.根据权利要求7至...
【专利技术属性】
技术研发人员:徐睿杰,达克·何,
申请(专利权)人:谷歌有限责任公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。