基于多级光流估计和神经渲染的人体全息视点生成方法技术

技术编号：40973516 阅读：20 留言：0更新日期：2024-04-18 21:22

本发明专利技术提供了一种基于多级光流估计和神经渲染的人体全息视点生成方法，通过多级光流的方法，利用视差较小的图像进行估计，得到相对稳定的初值，利用初值进行辅助，估计大视差图像的光流，从而显著提高估计得到的光流以及后续生成的全息视点图像的鲁棒性；同时利用神经渲染技术，增强生成图像的质量，利于后续的展示和观看。本发明专利技术适用于稀疏多RGB传感器布置下的高质量实时人体半身全息视点生成。通过本发明专利技术，能够对于大视差图像实现稳定、鲁棒的计算。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及三维重建和计算机视觉，尤其涉及一种基于多级光流估计和神经渲染的人体全息视点生成方法。

技术介绍

1、新视点图像生成是计算机视觉领域长久以来的重点和热点问题之一。如何利用现有的输入图像得到新视点的图像，在影视娱乐、远程教育、全息会议等各个领域都有着广泛而深远的应用前景。而这其中，如何高效、高质量地实现实时人体全息新视点的生成，是其中一个最重要，也是难度最高的分支。现有的系统一般需要利用比较复杂的输入设备，如稠密相机阵列，或者输入中包含深度相机等，成本较高，难以普及。而使用稀疏rgb相机作为输入的系统，面临着包括输入信息的缺失在内的多种限制，往往鲁棒性较差，无法达到较高的重建质量，在进行观看时无法达到较强的沉浸感。同时，很多现有系统只能进行离线的重建和渲染，这对于对实时性有要求的视频会议、全息通讯等应用场景是不可接受的。利用立体校正后的图像进行特征匹配、求解光流是常见的三维视觉方法，对于一般场景已经可以做到较为鲁棒地进行求解。但是对于稀疏视点、大视差的场景仍有所不足。

技术实现思路

...

【技术保护点】

1.一种基于多级光流估计和神经渲染的人体全息视点生成方法，其特征在于，包括：

2.根据权利要求1所述的基于多级光流估计和神经渲染的人体全息视点生成方法，其特征在于，利用标定好的多相机系统采集人体的多视角RGB图像，包括：

3.根据权利要求1所述的基于多级光流估计和神经渲染的人体全息视点生成方法，其特征在于，还包括训练针对人体上半身场景的多级光流估计模型和神经渲染网络的步骤，包括：

4.根据权利要求3所述的基于多级光流估计和神经渲染的人体全息视点生成方法，其特征在于，训练所述多级光流估计模型的步骤包括：

5.根据权利要求4所述的基于多级光流估...

【技术特征摘要】

1.一种基于多级光流估计和神经渲染的人体全息视点生成方法，其特征在于，包括：

2.根据权利要求1所述的基于多级光流估计和神经渲染的人体全息视点生成方法，其特征在于，利用标定好的多相机系统采集人体的多视角rgb图像，包括：

4.根据权利要求3所述的基于多级光流估计和神经渲染的人体全息视点生成方法，其特征在于，训练所述多级光流估计模型的步骤包括：

5.根据权利要求4所述的基于多级光流估计和神经渲染的人体全息视点生成方法，其特征在于，利用所...

【专利技术属性】
技术研发人员：刘烨斌，涂汉璋，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人