基于全局语义信息和局部几何感知的神经渲染方法及系统技术方案

技术编号:42620201 阅读:34 留言:0更新日期:2024-09-06 01:24
本发明专利技术提供一种基于全局语义信息和局部几何感知的神经渲染方法及系统,其中的方法包括:从多张输入图像中提取多尺度图像特征;利用所述多尺度图像特征和采样点的三维空间坐标,分别得到所述采样点对应的局部特征和全局特征;将所述局部特征、全局特征和所述采样点的位置编码送入预设的视图合成模块进行视图渲染,生成新视角下的图像。本发明专利技术通过具有多层级结构的视图合成模型架构,使用多尺度特征图训练模型在不同尺度上捕获场景信息,并通过全局特征辅助局部特征,有助于提高合成图像的质量,尤其是在复杂场景或存在多尺度结构的情况下,能够更好的确保场景的视图一致性以及在不同场景间的泛化。

【技术实现步骤摘要】

本专利技术涉及人工智能下的计算机视觉,更为具体地,涉及一种基于全局语义信息和局部几何感知的神经渲染方法及系统


技术介绍

1、神经渲染技术是一种利用深度神经网络解决新视图合成问题的技术。在三维重建、虚拟现实和增强现实等领域都有着广泛的应用,例如:全景舞台、元宇宙的场景搭建。其中,新视图合成任务是指根据给定源图像、源姿态以及目标姿态,渲染生成目标姿态对应图片的过程。传统的视图合成技术通常需要大量手工工程和参数调整,且在处理复杂场景和深度感知等方面存在一定局限性。随着多媒体技术不断发展,人们对视频质量和内容的要求越来越高,并且越来越关注视频的交互和视觉感官体验,二维的平面视频缺乏自然界中物体的深度信息,会使人的视觉缺乏立体深度从而产生失真感。因此,在实际应用中迫切需要可泛化的神经渲染方法,以低成本高质量地实现新视图生成。

2、现有的用于视图合成的神经渲染方法的研究,主要从以下三个方向进行提升:图像渲染的速度、渲染的图像质量和模型的泛化能力。其中,对于实时或交互性应用,一些神经渲染技术的运行时延迟可能会较高,导致用户体验下降,因此,图像的渲染速度对于本文档来自技高网...

【技术保护点】

1.一种基于全局语义信息和局部几何感知的神经渲染方法,其特征在于,包括如下步骤:

2.如权利要求1所述的基于全局语义信息和局部几何感知的神经渲染方法,其特征在于,所述多尺度图像特征基于预设的多尺度特征提取网络提取;其中,所述多尺度特征提取网络基于下采样层、卷积层、归一化层和激活层的多层网络层级结构搭建;

3.如权利要求1所述的基于全局语义信息和局部几何感知的神经渲染方法,其特征在于,所述采样点的提取方法包括:

4.如权利要求3所述的基于全局语义信息和局部几何感知的神经渲染方法,其特征在于,所述采样点的提取方法包括:

5.如权利要求4所述的基...

【技术特征摘要】

1.一种基于全局语义信息和局部几何感知的神经渲染方法,其特征在于,包括如下步骤:

2.如权利要求1所述的基于全局语义信息和局部几何感知的神经渲染方法,其特征在于,所述多尺度图像特征基于预设的多尺度特征提取网络提取;其中,所述多尺度特征提取网络基于下采样层、卷积层、归一化层和激活层的多层网络层级结构搭建;

3.如权利要求1所述的基于全局语义信息和局部几何感知的神经渲染方法,其特征在于,所述采样点的提取方法包括:

4.如权利要求3所述的基于全局语义信息和局部几何感知的神经渲染方法,其特征在于,所述采样点的提取方法包括:

5.如权利要求4所述的基于全局语义信息和局部几何感知的神经渲染方法,其特征在于,所述分别利用所述中尺度、小尺度下的图像特征和采样点的三维空间坐标,依据极线几何约束得到所述采样点对应的中尺度和小尺度下的局部特征,包括:

6.如权利要求4所述的基于全局语义...

【专利技术属性】
技术研发人员:方力王优胡飞叶龙
申请(专利权)人:中国传媒大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1