当前位置: 首页 > 专利查询>天津大学专利>正文

基于3D卷积神经网络的虚拟现实视频质量评价方法技术

技术编号:18624000 阅读:82 留言:0更新日期:2018-08-08 01:44
本发明专利技术涉及一种基于3D CNN的立体图像质量评价方法,包括以下步骤:视频预处理:利用VR视频的左视图视频与右视图视频得到VR差分视频,从差分视频中均匀抽帧,给每一帧不重叠的切块,每一帧相同位置的视频块构成一个VR视频补丁,以产生足够多的数据用于3D CNN的训练;建立3D CNN模型;训练3D CNN模型:利用随机梯度下降法,以VR视频补丁为输入,每个补丁配上原视频质量分数作为标签,分批次将其输入网络,经过多次迭代后网络各层权重得到充分优化,最终得到可用于评价虚拟现实视频质量的卷积神经网络模型;得出最终结果。本发明专利技术提高了客观评价方法准确率。

Virtual reality video quality evaluation method based on 3D convolution neural network

The invention relates to a method of quality evaluation of stereoscopic images based on 3D CNN, including the following steps: video preprocessing: using the left view video of the VR video and the right view video to get the VR differential video, pumping the frame evenly from the differential video to each frame that does not overlap, and the video blocks at the same position of each frame constitute a VR view. Frequency patch to generate enough data for 3D CNN training; establish 3D CNN model; train 3D CNN model: use random gradient descent method, use VR video patch as input, each patch match the original video quality score as label, and batch it into network, after many iterations, the weight of each layer of network is filled. Finally, a convolution neural network model for evaluating the quality of virtual reality video is obtained, and the final result is obtained. The invention improves the accuracy of the objective evaluation method.

【技术实现步骤摘要】
基于3D卷积神经网络的虚拟现实视频质量评价方法
本专利技术属视频处理领域,涉及虚拟现实视频质量评价方法。
技术介绍
作为一个新的仿真与交互技术——虚拟现实(VR)技术在许多领域如建筑、游戏与军事中使用,它可以创建一个与现实世界的规则一致的虚拟环境,或者建立一个完全脱离现实的模拟环境,这会带给人们更加真实的视听感受和临场体验[1]。作为虚拟现实的重要载体,当前最接近VR视频定义的为全景立体视频,其发挥着巨大的作用。然而,VR视频在采集、储存和传输的过程中由于设备和处理手段等原因,不可避免的会引入一些失真,进而影响VR视频的质量。因此,研究一种能有效评价虚拟现实视频质量的评价方法至关重要。但是主观评价方法易受多种因素的干扰,且费时费力,评价结果也不够稳定。相对主观评价,客观评价以软件的方式评价图像的质量,同时不需参与者和大量的主观试验,操作简单,且与主观评价高度相关,越来越受到相关研究者的关注。由于虚拟现实技术在近些年刚刚兴起,目前还没有针对VR视频规范标准与客观评价体系[2]。VR视频具有真实感,沉浸感,立体感等特性[3],在传统多媒体类型中立体视频与VR视频的特点最接近,因此,对VR本文档来自技高网...

【技术保护点】
1.一种基于3D CNN的立体图像质量评价方法,评价方法包括以下步骤:1)视频预处理:利用VR视频的左视图视频与右视图视频得到VR差分视频,从差分视频中均匀抽帧,给每一帧不重叠的切块,每一帧相同位置的视频块构成一个VR视频补丁,以产生足够多的数据用于3D CNN的训练;2)建立3D CNN模型:包含两个卷积层,两个池化层与两个全连接层,激活函数采用整流线性单元(ReLU),采用Dropout策略防止过拟合;随后调整网络的层内结构及训练参数以达到更好的分类效果;3)训练3D CNN模型:利用随机梯度下降法,以VR视频补丁为输入,每个补丁配上原视频质量分数作为标签,分批次将其输入网络,经过多次迭代...

【技术特征摘要】
1.一种基于3DCNN的立体图像质量评价方法,评价方法包括以下步骤:1)视频预处理:利用VR视频的左视图视频与右视图视频得到VR差分视频,从差分视频中均匀抽帧,给每一帧不重叠的切块,每一帧相同位置的视频块构成一个VR视频补丁,以产生足够多的数据用于3DCNN的训练;2)建立3DCNN模型:包含两个卷积层,两个池化层与两个全连接层,激活函数采用整流线性单元(ReLU),采用Dropout策略防止过拟合;随后调整网络的层...

【专利技术属性】
技术研发人员:杨嘉琛刘天麟
申请(专利权)人:天津大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1