当前位置: 首页 > 专利查询>清华大学专利>正文

基于隐式场的十亿像素场景人群三维重建方法和装置制造方法及图纸

技术编号:28709080 阅读:41 留言:0更新日期:2021-06-05 23:25
本发明专利技术提出一种基于隐式场的十亿像素场景人群三维重建方法和装置,其中,方法包括:获取十亿像素场景图像;检测出十亿像素场景中的人和并将其分割出来;对于分割出的场景图片,使用深度神经网络进行特征提取,并估计出人的形状和姿态;使用高精度扫描的人体模型渲染出观察人体不同视角的图片作为训练数据;训练遮挡情况下的人体重建;使用基于可见性的重要性采样,对三维人体可见部分加强采样点密度并提高权重,加强模型的细节。使用卷积神经网络提取训练图片的特征,并使用注意力机制关联三维人体先验与隐式场模型,在遮挡情况下完成对人体的高精度重建。将十亿像素场景中得到的三维人体与隐式场模型结合,生成高分辨率的人群三维重建模型。维重建模型。维重建模型。

【技术实现步骤摘要】
基于隐式场的十亿像素场景人群三维重建方法和装置


[0001]本专利技术涉及计算机视觉中的三维重建
,尤其涉及一种基于隐式场的十亿像素场景人群三维重建方法和装置。

技术介绍

[0002]近年来随着计算机视觉技术的发展与计算硬件性能的提高,计算机视觉中三维重建领域发展迅速,其中人体三维重建是一个研究热点。高精度准确的人体三维重建在智能通讯、安防监控、娱乐服务等领域有着重大应用价值。
[0003]随着隐式场的提出与深度学习的发展,单RGB图片人体三维重建技术已取得了重大进步。然而隐式场方法的精确性受到分辨率的限制,对于多人、密集人群场景等也难以应用,在不同光照环境下也难以得到稳定的重建结果,存在很多局限性。

技术实现思路

[0004]本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005]为此,本专利技术的第一个目的在于提出一种基于隐式场的十亿像素场景人群三维重建方法,以实现系统采用长焦和短焦相机阵列,长焦相机用于获取局部细节图像,短焦相机用于获取全局图像。在此基础上使用跨分辨率拼接技术将局部细本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于隐式场的十亿像素场景人群三维重建方法,其特征在于,包括以下步骤:利用长焦局部相机和短焦全局相机构成的相机阵列获取十亿像素的场景图像;分割所述场景图像中的人体区域;获取所述人体区域的形状和姿态参数;根据预设的卷积神经网络提取所述人体区域的几何特征;根据所述形状和姿态参数、所述几何特征构建所述场景图像对应的人群三维模型。2.如权利要求1所述的方法,其特征在于,所述分割所述场景图像中的人体区域,包括:利用人体检测和分割模型检测出所述场景图像中的人体区域。3.如权利要求1所述的方法,其特征在于,所述长焦局部相机的长焦焦距为135mm,所述短焦全局相机的短焦为25mm。4.如权利要求1所述的方法,其特征在于,所述获取所述人体区域的形状和姿态参数,包括:根据迭代求解算法获取所述人体区域的形状和姿态参数。5.一种基于隐式场的十亿像素场景人群三维重建装置,其特征在于,包括:第一获取模块,用于利用长焦局部相机和短焦全局相机构成的相机阵列获取十亿像素的场景图像;分割模块,用于分割所述场景图像中的人体区域;第二获取模块...

【专利技术属性】
技术研发人员:刘烨斌邵睿智于涛戴琼海
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1