一种无镜立体视频处理方法技术

技术编号:13608423 阅读:74 留言:0更新日期:2016-08-29 01:16
本发明专利技术提出一种无镜立体视频处理方法:用户只需要在步骤a中导入各路视差图的视频、根据需求设定编码参数,剩下的过程都是系统自动完成。系统会根据视频个数和总分辨率确定拼接方式、各个视频分辨率等,从而实现缩放、叠加、拼接等操作,最后通过编码输出目标的多宫格无镜立体视频。满足商用广告机裸无镜立体播放的内容需求。该方法具备处理时过程简单、处理时间较短的特点,包含了无镜立体视频的字幕、Logo的处理,同时考虑了处理后视频对不同无镜立体广告机的兼容性。

【技术实现步骤摘要】

本专利技术涉及一种立体视频处理方法,尤其涉及一种无镜立体视频处理方法
技术介绍
在视频
中,主要的发展趋势是追求对自然景物更加真实、清晰、立体的特征,因此二维平面视频在表示自然场景深度信息方法的局限性已使其不能满足人们对场景真实和自然再现的需求。双眼在观察物体时,物体在双眼视网膜上的成像位置上略有差异,称为双目视差。双目视差经过大脑视觉皮层的融合,让人感知图像内景物的深度信息,使得欣赏到的图像具有强烈的深度感和逼真感。目前,无镜立体显示产品存在内容匮乏、机器成本高、不能与2D完美结合等瓶颈仅适用于商用领域。在商用领域,眼镜式3D因为需要佩戴眼镜等操作不方便而存在很大的局限性,无镜立体的出现是必然趋势。无镜立体广告机实现广告运营,无镜立体视频是必须的。目前无镜立体视频主要有多宫格(将各个视差图按照一定的方式拼接)、多流复用(多个视频轨道,每个轨道包含一路视差图)、V+D(原图+深度图拼接)等几种类型,但是针对商用的广告机考虑存储空间、带宽、硬件运算性能、立体效果等因素都使用的是多宫格的无镜立体视频。针对多宫格无镜立体视频处理,目前还没有完善和统一的方法。
技术实现思路
本专利技术提出一种无镜立体视频处理方法,满足商用广告机无镜立体播放的内容需求。该方法具备处理时过程简单、处理时间较短的特点,包含了无镜立体视频的字幕、Logo的处理,同时考虑了处理后视频对不同无镜立体广告机的兼容性。本专利技术的目的可以通过以下技术方案来实现:一种无镜立体视频处理方法包括:a. 导入各路视差图的视频、Logo文件、字幕文件、音频等,并根据不同裸眼3D广告机的要求设定待转码视频的分辨率、帧率、码率、编码模式、参考帧数等参数;b. 根据输入视差图的视频个数确定无镜立体视频的视点数,并按照行业内默认的拼接标准确认当前的拼接方式,同时确定各路视差图视频的分辨率;c. 将步骤a中的各路视差图的视频和Logo文件、字幕文件按照步骤b中确定的分辨率进行缩放,并将缩放后的logo和字幕叠加到各路视频上;d. 按照步骤b中确定的拼接方式,将步骤c中得到的处理后的各路视差图的视频进行拼接;e. 将步骤d中输出的拼接后的视频和音频文件进行混合;f. 调用音视频编码库对步骤e中的内容进行编码,直到编码结束。所述步骤a中,帧率、码率、分辨率、编码模式、参考帧数等参数根据立体显示终端、带宽、用户需求等限定条件进行设定。所述步骤b中,目前行业内主流的无镜立体广告机主要有4、5、8、9等视点的光栅,拼接的方式以最大限度提高横向分辨率为目标(该拼接的方式虽然未正式制定成标准,而是无镜立体行业内默认都通用的拼接方式标准)。各种视点拼接方式图见附图的图1-4。所述步骤b中,根据视点数n、总的分辨率W*H和拼接方式(横向x个,纵向y个),得到各路视差图像的分辨率w*h。w = W/x,h = H/y。所述步骤c中,为了实现logo和字幕的立体效果,通过各路字幕在各路视频中的水平偏移量设定不同实现视差。计算方法如下:待转换视频图像某对象最凸出立体显示设备的距离为Dx时,须对待转换对象的水平偏移量设置为像素。其中,为成年人的双眼瞳孔距离、D为观看者站在离立体显示设备的距离、M为视频的水平分辨率(单位像素)。所述步骤f中,将e中合并后的视频送入编码器,调用音视频编码库进行编码,直到编码完成时输出目标文件为止。以上所述各步骤是顺序执行的,前面步骤的输出将会作为后面步骤的输入,以上步骤描述的都是正确情况会逐步直到最后输出目标文件位置,采取的容错处理是若某一步骤执行失败则直接退出整个处理过程。本专利技术采用上述方法,用户只需要在步骤a中导入各路视差图的视频、根据需求设定编码参数,剩下的过程都是系统自动完成。因此,采用上述步骤的方法,本专利技术运用了简单的操作、短时间处理的方法实现了多宫格无镜立体视频的处理。附图说明本专利技术奖通过例子并参考附图的方式说明,其中:图1为4视点拼接方式;图2为5视点拼接方式;图3为8视点拼接方式;图4为9视点拼接方式;图5为本专利技术的流程示意图。具体实施方式下面结合具体实施例和附图对本专利技术做进一步的说明。如图5所示,上述方法的具体过程是:a. 常见立体显示终端:帧率的取值为23.976、24、25、29.97、30、60fps等(很多设备都不支持变帧率的模式),码率的取值为10000-80000Kbps,分辨率的取值为3840*2160、1920*1080、1280*720等;b. 若输出目标分辨率为3840*2160的4视点视频,则各个视差图的分辨率为1920*1080;c. 虽然左右路字幕、Logo视差越大凸出(内嵌)的效果越明显,但视差如果过大最终编码输出的视频观看时会有眩晕的感觉,视差的经验值一般为16;c.给视频添加字幕和Logo时,字幕、Logo的左上角坐标都是相对坐标,坐标系的原点是视频左上角;f.音视频编码调用编码库进行的,最好不要调用目前市面上很多已经集成好的有界面的编码软件。本说明书中公开的任一特性,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤之外,均可以以任何方式组合。本说明书(包括任何附加权利要求、摘要和附图)中公开的任一特征,除非特别叙述,均可被其他等效或具类似目的的替代特征加以替代。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。本专利技术并不局限于前述的具体实施方式。本专利技术扩展到任何在本说明书中披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何新的组合。本文档来自技高网...

【技术保护点】
一种多宫格无镜立体视频处理方法,其特征在于,包括a. 导入各路视差图的视频、Logo文件、字幕文件、音频等,并根据不同裸眼3D广告机的要求设定待转码视频的分辨率、帧率、码率、编码模式、参考帧数等参数;b. 根据输入视差图的视频个数确定裸眼3D视频的视点数,并按照行业内默认的拼接标准确认当前的拼接方式,同时确定各路视差图视频的分辨率;c. 将步骤a中的各路视差图的视频和Logo文件、字幕文件按照步骤b中确定的分辨率进行缩放,并将缩放后的logo和字幕叠加到各路视频上;d. 按照步骤b中确定的拼接方式,将步骤c中得到的处理后的各路视差图的视频进行拼接;e. 将步骤d中输出的拼接后的视频和音频文件进行混合;f. 调用音视频编码库对步骤e中的内容进行编码,直到编码结束。

【技术特征摘要】
1.一种多宫格无镜立体视频处理方法,其特征在于,包括a. 导入各路视差图的视频、Logo文件、字幕文件、音频等,并根据不同裸眼3D广告机的要求设定待转码视频的分辨率、帧率、码率、编码模式、参考帧数等参数;b. 根据输入视差图的视频个数确定裸眼3D视频的视点数,并按照行业内默认的拼接标准确认当前的拼接方式,同时确定各路视差图视频的分辨率;c. 将步骤a中的各路视差图的视频和Logo文件、字幕文件按照步骤b中确定的分辨率进行缩放,并将缩放后的logo和字幕叠加到各路视频上;d. 按照步骤b中确定的拼接方式,将步骤c中得到的处理后的各路视差图的视频进行拼接;e. 将步骤d中输出的拼接后的视频和音频文件进行混合;f. 调用音视频编码库对步骤e中的内容进行编码,直到编码结束。2.如权利要求1所述一种多宫格无镜立体视频处理方法,其特征在于,所述步骤a中,帧率、码率、分辨率、编码模式、参考帧数等参数根据立体显示终端、带宽、用户需求等限定条件进行设定。3.如权利要求2所述一种多宫格无镜立体视频处理方法,其特征在...

【专利技术属性】
技术研发人员:王吉林
申请(专利权)人:徐州维林苑文化传媒有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1