【技术实现步骤摘要】
将静态照片制作成三维效果视频的方法及装置
本专利技术属于图像处理
,具体涉及一种将静态照片制作成三维效果视频的方法及装置。
技术介绍
相关技术中,市面上用静态图片进行三维重建的方案有双目立体视觉三维重建,即通过如双摄像头设备同时拍摄获得两张有显示角度差异的图像,进而通过BM或SGM等立体匹配算法,计算视差图,最终恢复出景深信息。也有使用具有TOF摄像头的设备,或者如苹果、华为厂商等移动设备的人像模式直接拍摄出含有景深信息的图像。但是上述方案都一定程度地依赖设备硬件或者特定系统功能,要求用户使用特定设备进行拍摄或者需要有同一个场景的不同角度的图像,对于用户导入任一已有的图像则难以获得满意的景深信息。而获取到景深信息后,往往是进行三维点云重建等构建面向科研的展示方式,但其并不是面向用户记录生活娱乐需求的友好呈现方式。对大部分用户来说,在手机硬件或系统较为低端的情况下,无法拍摄带有景深信息的图像,不能根据这张图像制作出三维效果的视频,这并不是面向用户记录生活娱乐需求的友好呈现方式。
技术实现思路
...
【技术保护点】
1.一种将静态照片制作成三维效果视频的方法,其特征在于,包括:/n对神经网络进行训练,得到神经网络参数模型;/n将所述神经网络参数模型载入到移动客户端,利用所述移动客户端获取原始图像,并根据所述原始图像,确定待处理图像;/n将所述待处理图像输入所述神经网络参数模型中,所述神经网络参数模型将所述待处理图像转化为景深灰度图像,得到第一图像;/n所述移动客户端进行预渲染操作;/n在预渲染操作后的移动客户端中对所述原始图像和第一图像进行渲染操作,获取具有三维效果的第二图像;/n利用视频编码器和视频合成器对第二图像进行处理,输出具有三维效果的视频。/n
【技术特征摘要】
1.一种将静态照片制作成三维效果视频的方法,其特征在于,包括:
对神经网络进行训练,得到神经网络参数模型;
将所述神经网络参数模型载入到移动客户端,利用所述移动客户端获取原始图像,并根据所述原始图像,确定待处理图像;
将所述待处理图像输入所述神经网络参数模型中,所述神经网络参数模型将所述待处理图像转化为景深灰度图像,得到第一图像;
所述移动客户端进行预渲染操作;
在预渲染操作后的移动客户端中对所述原始图像和第一图像进行渲染操作,获取具有三维效果的第二图像;
利用视频编码器和视频合成器对第二图像进行处理,输出具有三维效果的视频。
2.根据权利要求1所述的方法,其特征在于,所述对神经网络进行训练,得到神经网络参数模型,包括:
获取多个场景的图片以及景深信息,对所述景深信息进行处理获取景深灰度图;
将所述图片、景深灰度图进行缩放至预设尺寸以构成训练数据;
将所述训练数据输入到神经网络中进行训练;
在训练过程中动态调节学习率并进行多次训练,直至神经网络收敛,在所述神经网络预测结果真实表示所述景深信息时存储神经网络参数,获取神经网络参数模型。
3.根据权利要求1所述的方法,其特征在于,所述根据所述原始图像,确定待处理图像,包括:
对原始图像进行尺寸调整,缩放至预设尺寸,将所述调整为预设尺寸的图像确定为待处理图像;
所述原始图像为通过摄像头拍摄的图片。
4.根据权利要求1所述的方法,其特征在于,所述移动客户端进行预渲染操作,包括:
配置启用OpenGLES以及与其关联的移动界面组件,设置视口大小为输出尺寸;
初始化并设置帧缓存,绑定帧缓存纹理,设置帧缓存纹理的颜色模式为GL_RGBA,大小为所述输出尺寸,格式为GL_UNSIGNED_BYTE,设置帧缓存纹理的环绕模式为GL_CLAMP_TO_EDGE,过滤模式为GL_LINEAR;
设置启用深度测试;
载入顶点着色器和片段着色器代码文件,编译链接着色器程序,获得着色器句柄;
通过所述着色器句柄,启用着色器程序;
为所述着色器程序设置一组顶点坐标,一组纹理坐标;其中,顶点坐标取值范围[-1,1],纹理坐标取值范围[0,1],两组坐标均以一维浮点型数组表示且数组长度一致;
为着色器程序设置当前时间参数;
计算正交投影转换矩阵PM以及根据所述时间参数计算视见转换矩阵VM;
设置模型矩阵MM为单位矩阵;
将视见转换矩阵VM和所述模型矩阵MM相乘得到MV矩阵,再将MV矩阵和正交投影转换矩阵PM相乘得到MVP矩阵;
为所述着色器程序设置所述MVP矩阵。
5.根据权利要求4所述的方法,其特征在于,
根据输出尺寸调整顶点坐标和纹理坐标的数量。
6.根据权利要求4所述的方法,其特征在于,所...
【专利技术属性】
技术研发人员:林青山,
申请(专利权)人:广州光锥元信息科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。