一种基于深度学习的360度视频帧间模式决策方法技术

技术编号:41311538 阅读:16 留言:0更新日期:2024-05-13 14:54
本发明专利技术提供一种基于深度学习的360度视频帧间模式决策方法,包括:当CU的运动状态为静止状态的预测概率大于等于第一设定阈值时跳过MMVD模式、CIIP模式、Affine模式、GPM模式、AMVP模式和Intra模式的率失真检查;当CU的运动状态为静止状态的预测概率大于等于第二设定阈值小于第一设定阈值时跳过MMVD模式、CIIP模式、GPM模式、AMVP模式和Intra模式的率失真检查;反之在编码完Merge模式和Affine模式后进行提前终止预测终止剩余模式的率失真检查,反之进行最优模式预测;当最优模式列表中前几个模式的概率之和大于第四设定阈值时,则终止列表中后续模式的率失真检查。

【技术实现步骤摘要】

本专利技术属于视频编码,特别是涉及一种基于深度学习的360度视频帧间模式决策方法


技术介绍

1、全景视频,也称为360°视频,是沉浸式虚拟现实视频的技术之一,通常由多个摄像机同时对一个场景进行多角度拍摄,然后利用图像拼接算法将不同角度的视频拼接而成;如果用户使用头戴式显示设备,就可以通过转动头部观看全景视频各个角度的视频画面,从而获得最佳的观看体验;360°视频在多个领域有广泛的应用,包括虚拟旅游、实时体育赛事观看、教育培训、虚拟现实电影、虚拟房地产展示等。

2、针对传统平面视频的处理及压缩算法对360°视频进行处理,需要将360°视频转换为平面视频;目前已经有多种映射方式:经纬图等角映射(equi-rectangular projection,erp)、立方体映射(cubemap projection,cmp)、八面体映射(octahedron projection,ohp)、球面条带映射(segmented sphereprojection,ssp)等等。其中,erp是最为常用的映射方式之一,360°视频用erp投影格式投影到2d平面后,本文档来自技高网...

【技术保护点】

1.一种基于深度学习的360度视频帧间模式决策方法,其特征在于,包括:

2.根据权利1所述的一种基于深度学习的360度视频帧间模式决策方法,其特征在于,所述利用CNN神经网络进行运动状态预测包括:

3.根据权利1所述的一种基于深度学习的360度视频帧间模式决策方法,其特征在于,所述确定编码树单元CTU所在的纬度区域包括:根据CTU中心点的像素坐标计算CTU的拉伸因子,根据CTU的拉伸因子将CTU划分为不同的纬度区域;

4.根据权利1所述的一种基于深度学习的360度视频帧间模式决策方法,其特征在于,所述利用第一LNN神经网络进行提前终止预测包括:根据CU...

【技术特征摘要】

1.一种基于深度学习的360度视频帧间模式决策方法,其特征在于,包括:

2.根据权利1所述的一种基于深度学习的360度视频帧间模式决策方法,其特征在于,所述利用cnn神经网络进行运动状态预测包括:

3.根据权利1所述的一种基于深度学习的360度视频帧间模式决策方法,其特征在于,所述确定编码树单元ctu所在的纬度区域包括:根据ctu中心点的像素坐标计算ctu的拉伸因子,根据ctu的拉伸因子将ctu划分为不同的纬度区域;

4.根据权利1所述的一种基于深度学习的360度视频帧间模式决策方法,其特征在于,所述利用第一lnn神经网络进行提前终止预测包括:根据cu的尺寸将cu划分为五个类别,根据cu不同的类别设置提前终止阈值,当cu的提前终止概率大于设定的提前终止阈值时,则终止剩余模式的率失真检查,其中,第一lnn神经网络的输入为cu的纬...

【专利技术属性】
技术研发人员:汪大勇钟宇李洋余俊仪邓乙申徐金玉郑实山
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1