图像融合模型的训练方法、图像生成方法及其装置制造方法及图纸

技术编号：33876031 阅读：13 留言：0更新日期：2022-06-22 17:04

本公开涉及图像融合模型的训练方法、图像生成方法及其装置。提供了一种基于神经网络的图像融合模型的训练方法，包括：接收特定场景的M个输入图像，其中M为大于或等于3的整数；基于M个输入图像生成场景的三维全局网格；选择M个输入图像中的一个输入图像，作为参考图像；使用M个输入图像中的M

全部详细技术资料下载

【技术实现步骤摘要】
图像融合模型的训练方法、图像生成方法及其装置

[0001]本公开总体上涉及图像融合模型的训练方法、图像生成方法及其装置和介质。

技术介绍

[0002]对实时、逼真、易于捕获、适用于自由视角、交互式导航的3D 内容的需求越来越大。在已经获得场景的多个视角(或视点)的图像的情况下，期望容易地获得与该多个视角不同的视角的图像。

技术实现思路

[0003]在下文中给出了关于本公开的简要概述，以便提供关于本公开的一些方面的基本理解。但是，应当理解，这个概述并不是关于本公开的穷举性概述。它并不是意图用来确定本公开的关键性部分或重要部分，也不是意图用来限定本公开的范围。其目的仅仅是以简化的形式给出关于本公开的某些概念，以此作为稍后给出的更详细描述的前序。
[0004]根据本公开的一个方面，提供一种基于神经网络的图像融合模型的训练方法，包括：接收特定场景的M个输入图像，其中M为大于或等于3的整数；基于所述M个输入图像生成所述场景的三维全局网格；选择所述M个输入图像中的一个输入图像，作为参考图像；使用所述M个输入图像中的M
‑
1个非参考图像，生成针对所述参考图像的视角的n个马赛克图像，其中n为大于或等于2的整数并且n小于或等于M
‑
1；将所述三维全局网格和n个马赛克图像作为训练图像输入所述融合模型，生成与所述参考图像的视角相同的视角的预测图像；使用代价函数计算所述预测图像和所述参考图像之间的误差；以及使用所述误差调整所述图像融合模型的融合权重，以...

【技术保护点】

【技术特征摘要】
1.一种基于神经网络的图像融合模型的训练方法，包括：接收特定场景的M个输入图像，其中M为大于或等于3的整数；基于所述M个输入图像生成所述场景的三维全局网格；选择所述M个输入图像中的一个输入图像，作为参考图像；使用所述M个输入图像中的M
‑
1个非参考图像，生成针对所述参考图像的视角的n个马赛克图像，其中n为大于或等于2的整数并且n小于或等于M
‑
1；将所述三维全局网格和n个马赛克图像作为训练图像输入所述图像融合模型，生成与所述参考图像的视角相同的视角的预测图像；使用代价函数计算所述预测图像和所述参考图像之间的误差；以及使用所述误差调整所述融合模型的融合权重，以减小所述误差。2.根据权利要求1所述的训练方法，其中，生成针对所述参考图像的视角的n个马赛克图像包括：针对所述三维全局网格中的每个网格：计算所述M
‑
1个非参考图像在该网格上的权重；选择权重较高的n个非参考图像；获得所述n个非参考图像在该网格上的扭曲投影；和使用每个网格的所述扭曲投影，生成所述n个马赛克图像，其中，所述n个马赛克图像中的第一马赛克图像中的每个网格处的像素是通过对在该网格上的权重最高的非参考图像的与该网格对应的像素进行扭曲投影而获得的，所述n个马赛克图像中的第二马赛克图像中的每个网格处的像素是通过对在该网格上的权重第二高的非参考图像的与该网格对应的像素进行扭曲投影而获得的，依此类推。3.根据权利要求2所述的训练方法，其中，使用获得非参考图像的相机的镜头的法线和三维全局网格中的网格的法线之间的夹角的余弦值，作为该非参考图像在该网格上的权重。4.根据权利要求1所述的训练方法，其中，所述神经网络是卷积神经网络，以及与输入图像相比，所述预测图像和所述参考图像的四周都被裁...

【专利技术属性】
技术研发人员：周永翔，干宏华，杨蕊，吴增德，
申请(专利权)人：浙江省公众信息产业有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人