视频处理方法、视频处理装置及终端设备制造方法及图纸

技术编号：26386019 阅读：18 留言：0更新日期：2020-11-19 23:55

本申请适用于视频处理技术领域，提供了一种视频处理方法、视频处理装置、终端设备及计算机可读存储介质，包括：获取待处理视频；将所述待处理视频分解成多个视频片段；通过基于深度学习的第一编码模型对每个视频片段中的I帧进行编码；获取所述每个视频片段中每层插值的R帧和所述每个视频片段中每层插值的R帧的上下文帧；根据所述每个视频片段中每层插值的R帧的上下文帧和基于深度学习的第二编码模型，对所述每个视频片段中每层插值的R帧进行编码。通过本申请可解决现有技术中视频编码过程较为繁琐，编码效果较差的问题。

全部详细技术资料下载

【技术实现步骤摘要】
视频处理方法、视频处理装置及终端设备
本申请属于视频处理
，尤其涉及一种视频处理方法、视频处理装置、终端设备及计算机可读存储介质。
技术介绍
视频是一个非常重要的信息载体，利用人眼视觉暂留的原理，通过播放一系列的图片，使人眼产生运动的感觉。然而原始视频所占空间较大，不利于存储或传输，视频应用的一项关键技术就是视频压缩，通过视频压缩可以减小视频的大小，使视频占用较少存储空间。传统的视频编解码模块众多，需要依赖大量的含有经验的人工设计与人工优化，编码过程较为繁琐，编码效果较差。
技术实现思路
有鉴于此，本申请实施例提供了一种视频处理方法、视频处理装置、终端设备及计算机可读存储介质，以解决现有技术中视频编码过程较为繁琐，编码效果较差的问题。本申请实施例的第一方面提供了一种视频处理方法，所述视频处理方法包括：获取待处理视频；将所述待处理视频分解成多个视频片段，其中，每个视频片段包括一个I帧和多个R帧，I帧为所述每个视频片段中的关键帧，R帧为所述每个视频片段中除I帧之外的帧；通过基于深度学习的第一编码模型对所述每个视频片段中的I帧进行编码；获取所述每个视频片段中每层插值的R帧和所述每个视频片段中每层插值的R帧的上下文帧；根据所述每个视频片段中每层插值的R帧的上下文帧和基于深度学习的第二编码模型，对所述每个视频片段中每层插值的R帧进行编码。本申请实施例的第二方面提供了一种视频处理装置，所述视频处理装置包括：视频获取模块，用于获取待处理视频；...

【技术保护点】
1.一种视频处理方法，其特征在于，所述视频处理方法包括：/n获取待处理视频；/n将所述待处理视频分解成多个视频片段，其中，每个视频片段包括一个I帧和多个R帧，I帧为所述每个视频片段中的关键帧，R帧为所述每个视频片段中除I帧之外的帧；/n通过基于深度学习的第一编码模型对所述每个视频片段中的I帧进行编码；/n获取所述每个视频片段中每层插值的R帧和所述每个视频片段中每层插值的R帧的上下文帧；/n根据所述每个视频片段中每层插值的R帧的上下文帧和基于深度学习的第二编码模型，对所述每个视频片段中每层插值的R帧进行编码。/n

【技术特征摘要】
1.一种视频处理方法，其特征在于，所述视频处理方法包括：
获取待处理视频；
将所述待处理视频分解成多个视频片段，其中，每个视频片段包括一个I帧和多个R帧，I帧为所述每个视频片段中的关键帧，R帧为所述每个视频片段中除I帧之外的帧；
通过基于深度学习的第一编码模型对所述每个视频片段中的I帧进行编码；
获取所述每个视频片段中每层插值的R帧和所述每个视频片段中每层插值的R帧的上下文帧；
根据所述每个视频片段中每层插值的R帧的上下文帧和基于深度学习的第二编码模型，对所述每个视频片段中每层插值的R帧进行编码。

2.如权利要求1所述的视频处理方法，其特征在于，所述每个视频片段包括N层插值，N为大于1的整数，所述N层插值包括首层插值和非首层插值，针对所述首层插值，所述获取所述每个视频片段中每层插值的R帧和所述每个视频片段中每层插值的R帧的上下文帧包括：
根据当前视频片段的I帧和下一个视频片段的I帧，获取所述当前视频片段中所述首层插值的R帧，其中，所述当前视频片段的I帧和所述下一个视频片段的I帧为所述当前视频片段中所述首层插值的R帧的上下文帧；
针对所述非首层插值中的第M层插值，所述第M层插值为所述非首层插值中的任意一层插值，所述获取所述每个视频片段中每层插值的R帧和所述每个视频片段中每层插值的R帧的上下文帧包括：
根据所述当前视频片段中前M-1层插值分别对应的R帧、所述当前视频片段的I帧和所述下一个视频片段的I帧，获取所述当前视频片段中所述第M层插值的R帧，其中，所述当前视频片段中前M-1层插值的R帧、所述当前视频片段的I帧和所述下一个视频片段的I帧为所述当前视频片段中所述第M层插值的R帧的上下文帧，M为大于1且小于或等于N的整数。

3.如权利要求1所述的视频处理方法，其特征在于，所述根据所述每个视频片段中每层插值的R帧的上下文帧和基于深度学习的第二编码模型，对所述每个视频片段中每层插值的R帧进行编码包括：
将所述每个视频片段中每层插值的R帧的上下文帧输入至基于深度学习的上下文模型，输出所述每个视频片段中每层插值的R帧的上下文帧的上下文特征；
将所述每个视频片段中每层插值的R帧输入至所述第二编码模型，并将所述每个视频片段中每层插值的R帧的上下文帧的上下文特征与所述第二编码模型的指定网络层进行融合，以对所述每个视频片段中每层插值的R帧进行编码。

4.如权利要求3所述的视频处理方法，其特征在于，所述视频处理方法还包括：
获取所述每个视频片段中每层插值的R帧与所述每个视频片段中每层插值的R帧的上下文帧的运动估计信息；
根据所述每个视频片段中每层插值的R帧与所述每个视频片段中每层插...

【专利技术属性】
技术研发人员：樊顺利，
申请(专利权)人：武汉TCL集团工业研究院有限公司，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人