一种用于识别VR视频格式的方法与设备技术

技术编号:21096323 阅读:37 留言:0更新日期:2019-05-11 12:35
本申请的目的是提供一种用于识别VR视频格式的方法与设备。本申请实现了VR视频格式的自动识别:首先通过预处理操作,去除了视频图像的边缘干扰区域,从而提高了识别准确性;接下来通过两次识别过程,分别识别了待检测的视频的第一视频类型以及第二视频类型,最终能够识别至少9种格式的VR视频,使得VR视频的格式识别快速、高效且全面。此外,本申请的整个识别过程对用户透明,进而播放器能够以正确的播放方式实现VR视频的播放,提高了应用的友好性,改善用户体验。

【技术实现步骤摘要】
一种用于识别VR视频格式的方法与设备
本申请涉及虚拟现实
,尤其涉及一种用于识别VR视频格式的技术。
技术介绍
虚拟现实技术(VR,VirtualReality)的发展激发了人们的观影兴趣,同时对VR影片的质量要求也越来越高。为满足不同用户的观影需求,影片的生产者不断地创造新的VR视频格式;而只有预先知道VR视频的格式,并采用正确的播放方式,才能给用户带来最佳的观影体验。因此,预先识别VR视频格式是非常关键的。VR视频可以分为2D视频和3D视频。2D视频又可以分为普通视频、180度视频以及全景视频。3D视频同样也可以分为普通3D视频、180度3D视频以及360度3D视频。进一步地,3D视频内容的排列又可以分为上下和左右两种方式。综上可知,2D视频共包括三种情况,即普通视频、180度视频以及全景视频,而3D视频共包括六种情况,即普通上下排列视频、普通左右排列视频、180度上下排列视频、180度左右排列视频、全景上下排列视频以及全景左右排列视频。对于某些VR视频,应用程序可以根据服务器接口获取VR视频格式,但是一些用户提交的个人视频却无法确定格式。因此,用户只能先将VR视频播放出来,然后根据个人经验选取一种播放方式进行播放。整个播放过程大大降低了应用的友好性,也产生了负面的用户体验。此外,现有的VR视频格式识别技术所识别的类型覆盖较少,不能满足上述各类VR视频格式的设备情况。此外,还有一些设备方法对于识别全景视频存在缺陷,例如,当视频宽高比为2:1的时候就认定该VR视频为全景视频,实际上宽高比为2:1的视频既可以是普通视频,也可以是3D视频甚至其他视频。还有一些办法认为如果VR视频左右两侧可以拼接在一起就认定为全景视频,这种方法也是有缺陷的,例如有些视频源的左右或者上下是带有黑边的,这样势必会导致拼接成功而被错误的认定为全景视频。
技术实现思路
本申请的目的是提供一种用于识别VR视频格式的方法与设备。根据本申请的一个实施例,提供了一种用于识别VR视频格式的方法,其中,该方法包括以下步骤:a获取待检测的视频中的至少一帧初始视频图像;b对所述初始视频图像进行预处理,以去除边缘干扰区域并获得处理后的视频图像;c根据所述处理后的视频图像的上下部分和/或左右部分的特征点的匹配信息,判断所述待检测的视频的第一视频类型,其中,所述第一视频类型包括3D类型或非3D类型;d根据所述第一视频类型,确定所述处理后的视频图像所对应的处理区域;e根据所述处理区域中首行像素值的离散程度信息、尾行像素值的离散程度信息、首列以及尾列所对应的像素值的离散程度信息,判断所述待检测的视频的第二视频类型,其中,所述第二视频类型包括普通内容视频、180度内容视频或全景内容视频;f根据所述第一视频类型以及所述第二视频类型,确定所述待检测的视频的视频格式。可选地,所述步骤b包括:b1将所述初始视频图像转换为灰度图;对所述灰度图进行边缘检测,并对所述边缘检测的结果进行积分处理;根据所述积分处理结果,确定所述初始视频图像所对应的边缘干扰区域;去除所述边缘干扰区域并获得处理后的视频图像。可选地,该方法还包括:将所述初始视频图像缩放至预定大小;其中,所述步骤b1包括:将所述缩放后的初始视频图像转换为灰度图。可选地,所述步骤c包括:确定所述处理后的视频图像的上下部分和/或左右部分的特征点的匹配信息;c1若有任意一个所述匹配信息大于预定阈值,则判断所述待检测的视频的第一视频类型为3D类型,反之,则为非3D类型。可选地,所述步骤c1包括:若所述处理后的视频图像的上下部分的特征点的匹配信息大于第一特征阈值,则判断所述待检测的视频的第一视频类型为上下3D类型;和/或若所述处理后的视频图像的左右部分的特征点的匹配信息大于第二特征阈值,则判断所述待检测的视频的第一视频类型为左右3D类型;若所述处理后的视频图像的上下部分的特征点的匹配信息并未大于第一特征阈值,且所述处理后的视频图像的左右部分的特征点的匹配信息并未大于第二特征阈值,则判断所述待检测的视频的第一视频类型为非3D类型。可选地,所述步骤e包括:确定所述处理区域中首行像素值的离散程度信息、尾行像素值的离散程度信息、首列以及尾列所对应的像素值的离散程度信息;若所述首行像素值的离散程度信息小于第一离散阈值、所述尾行像素值离散程度信息小于第二离散阈值且所述首列以及尾列所对应的像素值的离散程度信息小于第三离散阈值,则所述第二视频类型为全景内容视频;若所述首行像素值的离散程度信息小于第一离散阈值、所述尾行像素值离散程度信息小于第二离散阈值且所述首列以及尾列所对应的像素值的离散程度信息大于等于第三离散阈值,则所述第二视频类型为180度内容视频;若所述首行像素值的离散程度信息大于等于第一离散阈值和/或所述尾行像素值离散程度信息大于等于第二离散阈值,且所述首列以及尾列所对应的像素值的离散程度信息大于等于第三离散阈值,则所述第二视频类型为普通内容视频。可选地,所述离散程度信息包括方差或每个样本值与全体样本值的平均数之差的和。根据本申请的另一个实施例,还提供了一种计算机设备,所述计算机设备包括:一个或多个处理器;存储器,用于存储一个或多个计算机程序;当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述任一项所述的方法。根据本申请的另一个实施例,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序可被处理器执行如上述任一项所述的方法。根据本申请的另一个实施例,还提供了一种用于识别VR视频格式的识别设备,其中,所述识别设备包括:第一装置,用于获取待检测的视频中的至少一帧初始视频图像;第二装置,用于对所述初始视频图像进行预处理,以去除边缘干扰区域并获得处理后的视频图像;第三装置,用于根据所述处理后的视频图像的上下部分和/或左右部分的特征点的匹配信息,判断所述待检测的视频的第一视频类型,其中,所述第一视频类型包括3D类型或非3D类型;第四装置,用于根据所述第一视频类型,确定所述处理后的视频图像所对应的处理区域;第五装置,用于根据所述处理区域中首行像素值的离散程度信息、尾行像素值的离散程度信息、首列以及尾列所对应的像素值的离散程度信息,判断所述待检测的视频的第二视频类型,其中,所述第二视频类型包括普通内容视频、180度内容视频或全景内容视频;第六装置,用于根据所述第一视频类型以及所述第二视频类型,确定所述待检测的视频的视频格式。可选地,所述第二装置用于:将所述初始视频图像转换为灰度图;对所述灰度图进行边缘检测,并对所述边缘检测的结果进行积分处理;根据所述积分处理结果,确定所述初始视频图像所对应的边缘干扰区域;去除所述边缘干扰区域并获得处理后的视频图像。可选地,所述识别设备还包括:第七装置,用于将所述初始视频图像缩放至预定大小;其中,所述第二装置用于:将所述缩放后的初始视频图像转换为灰度图;对所述灰度图进行边缘检测,并对所述边缘检测的结果进行积分处理;根据所述积分处理结果,确定所述初始视频图像所对应的边缘干扰区域;去除所述边缘干扰区域并获得处理后的视频图像。可选地,所述第三装置包括:三一单元,用于确定所述处理后的视频图像的上下部分和/或左右部分的特征点的匹配信息;三二单元,用于若本文档来自技高网
...

【技术保护点】
1.一种用于识别VR视频格式的方法,其中,该方法包括以下步骤:a获取待检测的视频中的至少一帧初始视频图像;b对所述初始视频图像进行预处理,以去除边缘干扰区域并获得处理后的视频图像;c根据所述处理后的视频图像的上下部分和/或左右部分的特征点的匹配信息,判断所述待检测的视频的第一视频类型,其中,所述第一视频类型包括3D类型或非3D类型;d根据所述第一视频类型,确定所述处理后的视频图像所对应的处理区域;e根据所述处理区域中首行像素值的离散程度信息、尾行像素值的离散程度信息、首列以及尾列所对应的像素值的离散程度信息,判断所述待检测的视频的第二视频类型,其中,所述第二视频类型包括普通内容视频、180度内容视频或全景内容视频;f根据所述第一视频类型以及所述第二视频类型,确定所述待检测的视频的视频格式。

【技术特征摘要】
1.一种用于识别VR视频格式的方法,其中,该方法包括以下步骤:a获取待检测的视频中的至少一帧初始视频图像;b对所述初始视频图像进行预处理,以去除边缘干扰区域并获得处理后的视频图像;c根据所述处理后的视频图像的上下部分和/或左右部分的特征点的匹配信息,判断所述待检测的视频的第一视频类型,其中,所述第一视频类型包括3D类型或非3D类型;d根据所述第一视频类型,确定所述处理后的视频图像所对应的处理区域;e根据所述处理区域中首行像素值的离散程度信息、尾行像素值的离散程度信息、首列以及尾列所对应的像素值的离散程度信息,判断所述待检测的视频的第二视频类型,其中,所述第二视频类型包括普通内容视频、180度内容视频或全景内容视频;f根据所述第一视频类型以及所述第二视频类型,确定所述待检测的视频的视频格式。2.根据权利要求1所述的方法,其中,所述步骤b包括:b1将所述初始视频图像转换为灰度图;对所述灰度图进行边缘检测,并对所述边缘检测的结果进行积分处理;根据所述积分处理结果,确定所述初始视频图像所对应的边缘干扰区域;去除所述边缘干扰区域并获得处理后的视频图像。3.根据权利要求2所述的方法,其中,该方法还包括:将所述初始视频图像缩放至预定大小;其中,所述步骤b1包括:将所述缩放后的初始视频图像转换为灰度图。4.根据权利要求1至3中任一项所述的方法,其中,所述步骤c包括:确定所述处理后的视频图像的上下部分和/或左右部分的特征点的匹配信息;c1若有任意一个所述匹配信息大于预定阈值,则判断所述待检测的视频的第一视频类型为3D类型,反之,则为非3D类型。5.根据权利要求4所述的方法,其中,所述步骤c1包括:若所述处理后的视频图像的上下部分的特征点的匹配信息大于第一特征阈值,则判断所述待检测的视频的第一视频类型为上下3D类型;和/或若所述处理后的视频图像的左右部分的特征点的匹配信息大于第二特征阈值,则判断所述待检测的视频的第一视频类型为左右3D类型;若所述处理后的视频图像的上下部分的特征点的匹配信息并未大于第一特征阈值,且所述处理后的视频图像的左右部分的特征点的匹配信息并未大于第二特征阈值,则判断所述待检测的视频的第一视频类型为非3D类型。6.根据权利要求1至5中任一项所述的方法,其中,所述步骤e包括:确定所述处理区域中首行像素值的离散程度信息、尾行像素值的离散程度信息、首列以及尾列所对应的像素值的离散程度信息;若所述首行像素值的离散程度信息小于第一离散阈值、所述尾行像素值离散程度信息小于第二离散阈值且所述首列以及尾列所对应的像素值的离散程度信息小于第三离散阈值,则所述第二视频类型为全景内容视频;若所述首行像素值的离散程度信息小于第一离散阈值、所述尾行像素值离散程度信息小于第二离散阈值且所述首列以及尾列所对应的像素值的离散程度信息大于等于第三离散阈值,则所述第二视频类型为180度内容视频;若所述首行像素值的离散程度信息大于等于第一离散阈值和/或所述尾行像素值离散程度信息大于等于第二离散阈值,且所述首列以及尾列所对应的像素值的离散程度信息大于等于第三离散阈值,则所述第二视频类型为普通内容视频。7.根据权利要求1至6中任一项所述的方法,其中,所述离散程度信息包括方差或每个样本值与全体样本值的平均数之差的和。8.一种用于识别VR视频格式的识别设备,其中,所述识别设备包括:第一装置,用于获取待检测的视频中的至少一帧初始视频图像;第二装置,用于对所述初始视频图像进行预处理,以去除边缘干扰区域并获得处理后的视频图像;第三装置,用于根据所述处理后的视频图像的上下部分和/或左右部分的特征点的匹配信息,判断所述待检测的视频的第一视频类型,其中,所...

【专利技术属性】
技术研发人员:史明王西颖
申请(专利权)人:重庆爱奇艺智能科技有限公司
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1