一种3D视频格式识别方法、装置制造方法及图纸

技术编号:8389288 阅读:264 留言:0更新日期:2013-03-07 21:24
本发明专利技术适用于视频技术领域,提供了一种3D视频格式识别方法、装置,所述方法包括:从3D视频中提取一图像帧;计算所述图像帧的特征向量;输入所述特征向量至预先训练好的3D视频格式分类器中;所述3D视频格式分类器根据所述特征向量对所述3D视频的格式进行识别。本发明专利技术,计算输入的3D视频的图像帧的特征向量,并输入该特征向量至预先训练好的3D视频格式分类器中,以由所述3D视频格式分类器对待识别3D视频进行格式识别,得到所述3D视频的视频格式,后续播放器即可根据该格式对视频帧数据进行正确的拆分和重组,以播放正常的3D画面。

【技术实现步骤摘要】

本专利技术属于视频
,尤其涉及一种3D视频格式识别方法、装置
技术介绍
人以左右眼看同样的物体,因两眼观察角度不同,在视网膜上形成的成像并不完全相同,这两个成像经过大脑综合以后就能区分物体的前后、远近,从而产生立体视觉。立体3D显示就是根据这一原理,将同一景象的左眼图像和右眼图像分别送入观看者的左眼和右眼,让观察者产生立体观看感觉。目前,常见的3D片源格式有:frame sequence:连续交替发送左眼和右眼画面。full-side-by-side:将左、右眼图像压进一帧画面中,左半帧画面为左眼图像,右半帧画面为右眼图像。half-side-by-side:类似于full-side-by-side,但左、右眼图像的分辨率均在水平方向上压缩一半。top-and-bottom:在这种格式中,左、右眼画面按上下排列方式压缩到一帧图像中,左、右眼图像的分辨率均在垂直方向上压缩为一半。Frame Packing:为了保证数据完整性,将左、右眼画面按上下方式排列Frame Packing标准规定为区别左、右眼画面,在左、右眼画面之间包含一个空白区域。隔行:将左、右眼画面在垂直方向上按行交错排列。隔列:将左、右眼画面在水平方向上按列交错排列。CheckBoard:在CheckBoard 3D格式中,左眼和右眼的图像被交织,也就是每相隔一个像素存放左眼或右眼图像。这种格式和国际象棋棋盘的方格相<br>似,因此叫做CheckBoard格式。3D视频格式众多,然而,目前还没有一种有效的方法能够自动识别各种3D视频格式,这给播放器对各种格式的3D视频进行自动解析造成了困难。
技术实现思路
本专利技术实施例提供了一种3D视频格式识别方法、装置,旨在解决现有技术无法自动识别3D视频格式,给播放器对各种格式的3D视频进行自动解析造成了困难的问题。一方面,提供一种3D视频格式识别方法,所述方法包括:从3D视频中提取一图像帧;计算所述图像帧的特征向量;输入所述特征向量至预先训练好的3D视频格式分类器中;所述3D视频格式分类器根据所述特征向量对所述3D视频的格式进行识别。另一方面,提供一种3D视频格式识别装置,所述装置包括:图像帧提取单元,用于从3D视频中提取一图像帧;特征向量计算单元,用于计算所述图像帧的特征向量;特征向量输入单元,用于输入所述特征向量至预先训练好的3D视频格式分类器中;训练好的3D视频格式分类器,用于根据所述特征向量对所述3D视频的格式进行识别。在本专利技术实施例中,计算输入的3D视频的图像帧的特征向量,并输入该特征向量至预先训练好的3D视频格式分类器中,以由所述3D视频格式分类器对待识别3D视频进行格式识别,得到所述3D视频的视频格式,后续播放器即可根据该格式对视频帧数据进行正确的拆分和重组,以播放正常的3D画面。附图说明图1是本专利技术实施例一提供的3D视频格式识别方法的实现流程图;图2是本专利技术实施例一提供的按照预设规则对灰度图像进行的区域划分示意图;图3是本专利技术实施例一提供的对频谱图进行的区域划分示意图;图4是本专利技术实施例二提供的3D视频格式识别装置的结构框图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。在本专利技术实施例中,计算输入的3D视频的图像帧的特征向量,并输入该特征向量至预先训练好的3D视频格式分类器中,以由所述3D视频格式分类器对待识别3D视频进行格式识别,得到所述3D视频的视频格式,后续播放器即可根据该格式对视频帧数据进行正确的拆分和重组,以播放正常的3D画面。以下结合具体实施例对本专利技术的实现进行详细描述:实施例一图1示出了本专利技术实施例一提供的3D视频格式识别方法的实现流程图,为了便于说明,仅示出了与本专利技术实施例相关的部分,详述如下:在步骤S101中,从3D视频中提取一图像帧。在本专利技术实施例中,从输入的3D视频中随机提取一帧图像帧。在步骤S102中,计算所述图像帧的特征向量。在本专利技术实施例中,首先从输入的3D视频中随机提取一帧图像帧,再计算该图像帧的特征向量,其中,该特征向量的计算步骤包括:步骤1、将所述图像帧转换为灰度图像。在本实施例中,将提取的彩色图像帧转换成灰度图像。步骤2、按预设规则对所述灰度图像进行区域划分,得到预设组数左右眼图像对。在本实施例中,对步骤1中得到的灰度图像进行区域划分,以得到预设组数的左右眼图像对,在本实施例中,预设的组数为两组。图2为按照预设规则进行的区域划分示意图。在图2中,将灰度图像划分为A、B、C、D四个大小相等的区域,并将区域A和区域B作为一组左右眼图像对,将区域A和区域C作为另一组左右眼图像对。除上述的基本区域划分方法外,为了降低后续步骤的计算量,可以对图2所示的区域划分方法进行优化改进:如图2所示,截取区域A、B、C、D中的子区域A1、B1、C1、D1,然后可以选择区域A1、区域B1为一组左右眼图像对,选择区域A1、区域C1为另一组左右眼图像对;或先对所截取的区域进行组合构成一幅图像,如将A1、B1组合成AB1,C1、D1组合成CD1,将A1、C1组合成AC1,B1、D1组合成BD1,然后将组合构成的图像两两分为一组,比如,将AB1、CD1分为一组,那么AB1、CD1即为一组左右眼图像对,将AC1、BD1分为一组,则AC1、BD1即为另外一组左右眼图像对。需要注意的是,A1、B 1、C1、D1为大小相同的区域,且它们在A、B、C、D四个区域中的相对位置也一致。步骤3、计算所述预设组数左右眼图像对的相似度特征。在本实施例中,在步骤2中已经得到两组左右眼图像对,则可分别计算该两组左右眼图像对的相似度特征。每组图像的相似度可由归一化互相关系数(Normalized Correlation Coefficient,NCC)来表征,此外还可以选择绝对差值的总和(Sum of Absolute Difference,SAD)或差值平方和(Sum of Squared Difference,SSD)来对相似度进行表征,上述相似度特征的计算方法为本领域公知技术,此处不再赘述。需要说明的是,为了提高对3D视频格式的识别率,可以增加左右眼图像对的组数,这样就增加了左右眼图像对相似度的个数,也<本文档来自技高网
...

【技术保护点】
一种3D视频格式识别方法,其特征在于,所述方法包括:从3D视频中提取一图像帧;计算所述图像帧的特征向量;输入所述特征向量至预先训练好的3D视频格式分类器中;所述3D视频格式分类器根据所述特征向量对所述3D视频的格式进行识别。

【技术特征摘要】
1.一种3D视频格式识别方法,其特征在于,所述方法包括:
从3D视频中提取一图像帧;
计算所述图像帧的特征向量;
输入所述特征向量至预先训练好的3D视频格式分类器中;
所述3D视频格式分类器根据所述特征向量对所述3D视频的格式进行识
别。
2.如权利要求1所述的方法,其特征在于,在所述输入所述特征向量至预
先训练好的3D视频格式分类器中之前,所述方法还包括:
建立3D视频格式分类器的训练样本库;
利用所述训练样本库对3D视频格式分类器进行训练,生成训练好的3D视
频格式分类器。
3.如权利要求2所述的方法,其特征在于,所述建立3D视频格式分类器
的训练样本库具体为:
计算各种格式的3D视频中的不同图像帧所对应的特征向量,由这些特征
向量的集合构成所述3D视频格式分类器的训练样本库。
4.如权利要求1所述的方法,其特征在于,所述计算所述图像帧的特征向
量具体为:
将所述图像帧转换为灰度图像;
按预设规则对所述灰度图像进行区域划分,得到预设组数左右眼图像对;
计算所述预设组数左右眼图像对的相似度特征;
计算所述图像帧的频谱特征;
所述相似度特征和所述频谱特征组成所述图像帧的特征向量。
5.如权利要求4所述的方法,其特征在于,所述计算所述图像帧的频谱特
征具体为:
对所述图像帧进行二维快速傅里叶变换,得到频谱图;
对所述频谱图进行区域划分;
统计低频段区域以及所述低频段区域垂直方向上、水平方向上以及对角方
向上的高频段区域的能量均值,将所述能量均值作为所述图像帧的频谱特征。
6.一种3D视频格式识别装置,其特征在于,所述装置包括:
图像帧提取单元,用于从3D视...

【专利技术属性】
技术研发人员:吴美芬陈永洒邵诗强
申请(专利权)人:TCL集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1