一种编码解码方法、装置及相关设备制造方法及图纸

技术编号：37151645 阅读：23 留言：0更新日期：2023-04-06 22:08

本申请实施例公开了一种编码解码方法、装置及相关设备，包括：将第i个视频帧输入预先训练好的目标神经网络中，获取第i个视频帧经过目标神经网络的第j层所输出的参数集合目标神经网络为N层神经网络；判断参数集合中的参数是否满足预设条件；若不满足预设条件，则从目标神经网络的第j层开始，基于参数集合向第j

全部详细技术资料下载

【技术实现步骤摘要】
一种编码解码方法、装置及相关设备

[0001]本申请涉及计算机
，尤其涉及一种编码解码方法、装置及相关设备。

技术介绍

[0002]现有的视频数据是基于连续多帧图像(即视频帧)形成的集合，每一帧图像包含一个高维的静态数据。其中，视频预测的任务是指通过输入过去一段时间的视频(包含多帧图像)，预测未来一段时间的视频(包含多帧图像)，从而可以根据已知的历史信息进行提前预警，预防突发事件，等等。
[0003]传统的视频预测方法是基于每个像素点的历史数据，建立自回归的时序预测模型，依次实现对后续图像帧的预测。然而，这种方法依赖于在高维图像空间的像素级计算，需要消耗大量的计算资源，精度也不能得到保证。近年来，随着深度学习的发展，利用神经网络实现视频的编码、解码、预测等功能已经成为业界的主流方向。基于大量视频数据以及深度神经网络的学习特性，编码和解码过程也可以做到比较准确，但是，现有的神经网络计算复杂，且神经网络中每层的计算更新频率是固定的，无法真正学习到视频中的变化规律，导致视频预测的准确率低。
[0004]因此，如何基于神经网络实现高准确率、低计算量的视频预测是亟待解决的问题。

技术实现思路

[0005]本申请实施例提供一种编码解码方法、装置及相关设备，可以大大减少计算量。
[0006]第一方面，本申请实施例提供了一种编码解码方法，包括：将第i个视频帧输入预先训练好的目标神经网络中，获取所述第i个视频帧经过所述目标神经网络的第j层所输出的参数集合所述目标神经网络为N层神经网络，N为...

【技术保护点】

【技术特征摘要】
1.一种编码解码方法，其特征在于，包括：将第i个视频帧输入预先训练好的目标神经网络中，获取所述第i个视频帧经过所述目标神经网络的第j层所输出的参数集合所述目标神经网络为N层神经网络，N为大于或等于1的整数，j为小于或等于N的正整数；i＝2、3、4
……
；判断所述参数集合中的参数是否满足预设条件；若不满足所述预设条件，则从所述目标神经网络的第j层开始，基于所述参数集合向第j
‑
1、j
‑2……
j
‑
j层依次解码，以获得所述第i个视频帧的解码结果；其中，所述预设条件包括所述参数集合与参数集合中的参数之间的变化量大于第一预设值；所述参数集合为第i
‑
1个视频帧经过所述目标神经网络的第j层所输出的参数集合；所述第i
‑
1个视频帧为在所述第i个视频帧前一时刻的视频帧。2.根据权利要求1所述的方法，其特征在于，所述参数集合包括：所述第i个视频帧经过所述目标神经网络的第j层所输出的编码结果第一隐变量解码结果第二隐变量3.根据权利要求2所述的方法，其特征在于，所述判断所述参数集合中的参数是否满足预设条件，包括：获取所述参数集合所述参数集合包括：所述第i
‑
1个视频帧经过所述目标神经网络的第j层所输出的编码结果第一隐变量解码结果第二隐变量根据所述参数集合与所述参数集合获取所述参数集合与所述参数集合中的参数之间的变化量；根据所述变化量和所述预设值，判断所述参数集合中的参数是否满足预设条件。4.根据权利要求3所述的方法，其特征在于，所述根据所述参数集合与所述参数集合获取所述参数集合与所述参数集合中的参数之间的变化量，包括：根据所述编码结果所述第一隐变量和所述解码结果确定所述第二隐变量的先验分布；根据所述第一隐变量所述解码结果和所述编码结果确定所述第二隐变量的后验分布；根据所述第一隐变量和所述解码结果确定所述第二隐变量的先验分布；根据所述解码结果所述编码结果和所述第一隐变量确定所述第二隐变量的
后验分布；计算所述的先验分布与所述的后验分布之间的第一差异，以及所述的先验分布与所述的后验分布之间的第二差异，并获取所述第二差异与所述第一差异之间的所述变化量。5.根据权利要求1
‑
4任意一项所述的方法，其特征在于，所述方法还包括：若所述参数集合中的参数不满足所述预设条件，则复制参数集合参数集合
……
参数集合并将所述参数集合所述参数集合
……
所述参数集合分别作为所述第i个视频帧经过所述目标神经网络的第j+1层、第j+2层
……
第N层所输出的参数集合；其中，所述参数集合所述参数集合
……
所述参数集合分别为所述第i
‑
1个视频帧经过所述目标神经网络的第j+1层、第j+2层
……
第N层所输出的参数集合。6.根据权利要求1
‑
5任意一项所述的方法，其特征在于，所述第i
‑
1个视频帧为原始视频数据中的最后一帧；所述方法还包括：获取第i
‑
1个视频帧经过所述目标神经网络的第1层所输出的第一隐变量和第二隐变量并基于所述第一隐变量和所述第二隐变量计算得到所述第i个视频帧的初始第一隐变量和初始第二隐变量根据所述初始第一隐变量和所述初始第二隐变量通过所述目标神经网络中的解码器得到所述第i个视频帧；其中，所述第i个视频帧对应的解码结果为对所述第i个视频帧的预测结果。7.根据权利要求1
‑
5任意一项所述的方法，其特征在于，所述第i个视频帧为原始视频数据中的一帧；所述方法还包括：若所述参数集合中的参数满足所述预设条件，则更新所述第i个视频帧当前的索引集合K＝{(i，j)}；若所述K＝{(i，j)}满足视频检测条件，则输出所述第i个视频帧；所述视频检测条件包括所述K＝{(i，j)}中的j大于第二预设值；所述第i个视频帧为所述原始视频数据中的关键帧。8.根据权利要求1
‑
7任意一项所述的方法，其特征在于，所述方法还包括：若所述参数集合中的参数满足所述预设条件，且j小于N，则依次经过所述目标神经网络的第j+1层、第j+2层
……
第N层，并依次输出相应的参数集合；若所述参数集合中的参数满足所述预设条件，且j等于N，则从所述目标神经网络的第j层开始，基于所述参数集合向第j
‑
1、j
‑2……
j
‑
j层依次解码，以获得所述第i个视频帧的解码结果。
9.根据权利要求6所述的方法，其特征在于，所述方法还包括：构建初始神经网络；将视频训练集中的多个视频帧按时间顺序输入至所述初始神经网络，输出所述多个视频帧中的每个视频帧对应的预测结果；计算所述每个视频帧与所述每个视频帧对应的预测结果之间的损失。10.根据权利要求7所述的方法，其特征在于，所述方法还包括：构建初始神经网络；将视频训练集中的多个视频帧按时间顺序输入至所述初始神经网络，输出所述多个视频帧中的关键帧；计算所述关键帧与预设的视频帧之间的损失；所述预设的视频帧为所述多个视频帧中事先定义的关键帧。11.根据权利要求9
‑
10任意一项所述的方法，其特征在于，所述方法还包括：根据所述损失，对所述初始神经网络中的一个或多个权重进行修改，并更新所述初始神经网络，反复循环，直至所述损失小于第三预设值或者训练次数大于第四预设值，则结束训练，得到训练好的所述目标神经网络。12.一种编码解码装置，其特征在于，包括：第一获取单元，用于将第i个视频帧输入预先训练好的目标神经网络中，获取所述第i个视频帧经过所述目标神经网络的第j层所输出的参数集合所述目标神经网络为N层神经网络，N为大于或等于1的整数，j为小于或等于N的正整数；i＝2、3、4
……
；判断执行单元，用于判断所述参数集合中的参数是否满足预设条...

【专利技术属性】
技术研发人员：郭青海，扎菲里奥斯，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人