【技术实现步骤摘要】
【国外来华专利技术】通过渲染许多3D视图来学习重构3D形状
技术介绍
三维(Three-dimensional,3D)渲染是从3D对象的数据表示中生成具有景深(depthoffield)的图像(在此被称为视图)的过程。例如,3D对象可以由描述3D对象的外表面的形式的3D形状数据和描述3D对象的外表面的特性的纹理数据来表示。3D渲染使用3D形状和纹理来生成3D对象的视图。该视图可以表示3D对象的特定视点(viewpoint),诸如3D对象的平面图或等距视图,以及3D对象的特定光照,诸如从特定视点的3D对象的背光、侧光或环境光视图。3D渲染可以由多种系统完成。一个这样的系统是神经网络。神经网络是采用一层或多层来为所接收的输入创建输出(例如分类)机器学习模型。一些神经网络除了输出层之外还包括一个或多个隐藏层。每个隐藏层的输出作为输入被提供给神经网络中的下一层,即神经网络的下一隐藏层或输出层。神经网络的每个层根据相应参数集的当前值从所接收的输入生成输出。神经网络可以经受训练以提高神经网络输出的准确性。
技术实现思路
本说明书中描述的主题的创新方面可以具体体现在方法、系统和存储指令的计算机可读设备中,所述指令被配置为执行以下动作:从对象识别引擎获得说明(specify)从对象的图像导出的第一图像特征的数据;将第一图像特征提供给三维估计器神经网络;从三维估计器神经网络获得数据,该数据说明(i)估计的三维形状和(ii)估计的纹理,它们每个都基于第一图像特征;将说明(i)估计的三维形状和(ii)估计的纹理的数据提供给三维渲染引擎;从三维渲染引擎获得说明对 ...
【技术保护点】
1.一种计算机实施的方法,包括:/n从对象识别引擎获得说明从对象的图像导出的第一图像特征的数据;/n将第一图像特征提供给三维估计器神经网络;/n从所述三维估计器神经网络获得数据,所述数据说明(i)估计的三维形状和(ii)估计的纹理,所述(i)估计的三维形状和(ii)估计的纹理中的每一个基于第一图像特征;/n将说明(i)估计的三维形状和(ii)估计的纹理的数据提供给三维渲染引擎;/n从所述三维渲染引擎获得说明所述对象的多个三维视图的数据,每一个三维视图基于说明(i)估计的三维形状和(ii)估计的纹理的数据生成;/n将说明所述多个三维视图中的每一个的数据提供给所述对象识别引擎;/n从所述对象识别引擎并且针对由所述数据说明的多个三维视图中的每一个,获得说明从说明所述三维视图的数据导出的第二图像特征的数据;/n至少基于说明第一图像特征的数据和说明第二图像特征的数据,基于第一损失函数计算第一损失;和/n至少基于计算出的第一损失来训练所述三维估计器神经网络。/n
【技术特征摘要】
【国外来华专利技术】20171115 US 15/813,3381.一种计算机实施的方法,包括:
从对象识别引擎获得说明从对象的图像导出的第一图像特征的数据;
将第一图像特征提供给三维估计器神经网络;
从所述三维估计器神经网络获得数据,所述数据说明(i)估计的三维形状和(ii)估计的纹理,所述(i)估计的三维形状和(ii)估计的纹理中的每一个基于第一图像特征;
将说明(i)估计的三维形状和(ii)估计的纹理的数据提供给三维渲染引擎;
从所述三维渲染引擎获得说明所述对象的多个三维视图的数据,每一个三维视图基于说明(i)估计的三维形状和(ii)估计的纹理的数据生成;
将说明所述多个三维视图中的每一个的数据提供给所述对象识别引擎;
从所述对象识别引擎并且针对由所述数据说明的多个三维视图中的每一个,获得说明从说明所述三维视图的数据导出的第二图像特征的数据;
至少基于说明第一图像特征的数据和说明第二图像特征的数据,基于第一损失函数计算第一损失;和
至少基于计算出的第一损失来训练所述三维估计器神经网络。
2.根据权利要求1所述的计算机实施的方法,其中,所述对象是人的面部。
3.根据权利要求1或权利要求2所述的计算机实施的方法,其中,所述对象的图像是基于说明(i)合成的三维形状和(ii)合成的纹理的数据生成的合成图像。
4.根据权利要求3所述的计算机实施的方法,包括:
至少基于(i)说明合成的三维形状和合成的纹理的数据和(ii)说明估计的三维形状和估计的纹理的数据,基于第二损失函数计算第二损失;和
至少基于计算出的第一损失和计算出的第二损失来训练所述三维估计器神经网络。
5.根据权利要求3或权利要求4所述的计算机实施的方法,其中,基于说明(i)合成的三维形状和(ii)合成的纹理的数据生成所述对象的合成图像包括:
生成基于(i)合成的三维形状的特定姿势和特定光照以及(ii)合成的纹理的渲染。
6.根据权利要求3至5中任一项所述的计算机实施的方法,其中,计算出的第二损失指示(i)基于合成的三维形状和合成的纹理确定的顶点和(ii)基于估计的三维形状和估计的纹理确定的顶点之间的差异实质。
7.根据前述权利要求中任一项所述的计算机实施的方法,其中,计算出的第一损失指示第一图像特征和第二图像特征之间的差异实质。
8.根据前述权利要求中任一项所述的计算机实施的方法,其中,所述对象识别引擎是面部识别神经网络。
9.根据前述权利要求中任一项所述的计算机实施的方法,其中,所述三维渲染引擎是三维渲染神经网络或三维光栅化引擎中的一个。
10.根据前述权利要求中任一项所述的计算机实施的方法,其中,所述多个三维视图中的每一个是基于不同于其它三维视图中的每一个的姿势和光照的各自的姿势和各自的光照来生成的。
11.一种系统,包括:
处理器,被配置为执行计算机程序指令;和
编码有计算机程序的计算机存储介质,当由处理器执行时,所述计算机程序使得系统执行包括以下各项的操作:
从对象识别引擎获得说明从对象的图像导出的第一图像特征的数据;
将第一图像特征提供给三维估计器神经网络;
从所述三维估计器神经网络获得数据,所述数据说明(i)估计的三维形状和(ii)估计的纹理,所述(i)估计的三维形状和(ii)估计的纹理中的每一个基于第一图像特征;
将说明(i)估计的三维形状和(ii)估计的纹理的数据提供给三维渲染引擎;
从所述三维渲染引擎获得说明所述对象的多个三维视图的数据,每一个三维视图基于说明(i)估计的三维形状和(ii)估计的纹理的数据生成;
将说明所述多个三维视图中的每一个的数据提供给所述对...
【专利技术属性】
技术研发人员:FH科尔,K吉诺瓦,
申请(专利权)人:谷歌有限责任公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。