System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种编码器的训练方法和相关装置制造方法及图纸_技高网

一种编码器的训练方法和相关装置制造方法及图纸

技术编号:40207005 阅读:5 留言:0更新日期:2024-02-02 22:18
本申请实施例公开了一种编码器的训练方法和相关装置,可应用于云技术、人工智能、智慧交通、辅助驾驶、数字人、虚拟人、游戏、虚拟现实、扩展现实等场景。在提取三面体样本包括的各个投影平面的像素点的图像特征后,通过初始编码器将属于不同投影图像的像素点的图像特征在物理意义上对齐,得到三维模型样本的表面上各个位置的子特征向量。根据各个位置的子特征向量,得到三面体样本的第一特征向量。由此,在初始训练编码器的过程中,通过将属于不同投影图像的像素点的图像特征在物理意义上对齐,不仅没有引入噪声,还实现了不同投影平面的特征之间的感知,提高了通过编码器特征提取得到的第一特征向量的准确性,进而提高后续三维重建的准确性。

【技术实现步骤摘要】

本申请涉及人工智能,特别是涉及一种编码器的训练方法和相关装置


技术介绍

1、在3d计算机图形和图像处理领域,位于空间中的三维模型分别向三个互相垂直的平面进行投影,得到三个投影图像,从而得到该三维模型对应的三面体(triplane)。三面体可以表示三维模型的表面的形状,通过三面体可以更容易地进行渲染、纹理映射、碰撞检测和其他图形处理操作。

2、相关技术中,通过训练得到的编码器,对三面体的特征提取。但是特征提取得到的特征向量的准确性较低。


技术实现思路

1、为了解决上述技术问题,本申请提供了一种编码器的训练方法和相关装置,用于提高通过编码器特征提取得到的特征向量的准确性。

2、本申请实施例公开了如下技术方案:

3、一方面,本申请实施例提供一种编码器的训练方法,所述方法包括:

4、获取三维模型样本对应的三面体样本,所述三面体样本为所述三维模型样本分别在三个平面上的投影图像,所述三个平面在空间中相互垂直;

5、提取各个所述投影图像中各个像素点的图像特征,以及所述各个像素点在对应投影图像中的像素位置;

6、根据所述各个像素点在对应投影图像中的像素位置,通过初始编码器确定属于第一投影图像的第一像素点、属于第二投影图像的第二像素点,以及属于第三投影图像的第三像素点,所述第一像素点表征所述三维模型样本的表面上的位置与目标表面位置之间的距离小于预设距离阈值,所述第二像素点表征所述三维模型样本的表面上的位置与所述目标表面位置之间的距离小于所述预设距离阈值,所述第三像素点表征所述三维模型样本的表面上的位置与所述目标表面位置之间的距离小于所述预设距离阈值,所述目标表面位置为所述三维模型样本的表面上的一个位置;

7、根据所述第一像素点的图像特征、所述第二像素点的图像特征和所述第三像素点的图像特征,确定针对所述目标表面位置的子特征向量;

8、根据所述子特征向量,确定针对所述三面体样本的第一特征向量;

9、通过解码器对所述第一特征向量进行解码,得到第一预测三面体;

10、根据所述三面体样本和所述第一预测三面体之间的差异,调整所述初始编码器的参数,得到编码器。

11、另一方面,本申请实施例提供一种编码器的训练装置,所述装置包括:获取单元、提取单元、第一确定单元、第二确定单元、第三确定单元、解码单元和调参单元;

12、所述获取单元,用于获取三维模型样本对应的三面体样本,所述三面体样本为所述三维模型样本分别在三个平面上的投影图像,所述三个平面在空间中相互垂直;

13、所述提取单元,用于提取各个所述投影图像中各个像素点的图像特征,以及所述各个像素点在对应投影图像中的像素位置;

14、所述第一确定单元,用于根据所述各个像素点在对应投影图像中的像素位置,通过初始编码器确定属于第一投影图像的第一像素点、属于第二投影图像的第二像素点,以及属于第三投影图像的第三像素点,所述第一像素点表征所述三维模型样本的表面上的位置与目标表面位置之间的距离小于预设距离阈值,所述第二像素点表征所述三维模型样本的表面上的位置与所述目标表面位置之间的距离小于所述预设距离阈值,所述第三像素点表征所述三维模型样本的表面上的位置与所述目标表面位置之间的距离小于所述预设距离阈值,所述目标表面位置为所述三维模型样本的表面上的一个位置;

15、所述第二确定单元,用于根据所述第一像素点的图像特征、所述第二像素点的图像特征和所述第三像素点的图像特征,确定针对所述目标表面位置的子特征向量;

16、所述第三确定单元,用于根据所述子特征向量,确定针对所述三面体样本的第一特征向量;

17、所述解码单元,用于通过解码器对所述第一特征向量进行解码,得到第一预测三面体;

18、所述调参单元,用于所述根据所述三面体样本和所述第一预测三面体之间的差异,调整所述初始编码器的参数,得到编码器。

19、另一方面,本申请实施例提供一种计算机设备,所述计算机设备包括处理器以及存储器:

20、所述存储器用于存储计算机程序,并将所述计算机程序传输给所述处理器;

21、所述处理器用于根据所述计算机程序中的指令执行上述方面所述的方法。

22、另一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述方面所述的方法。

23、另一方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面所述的方法。

24、由上述技术方案可以看出,获取三维模型样本对应的三面体样本,三面体样本是三维模型样本分别在三个互相垂直的平面上的投影图像,通过三个投影图像能够描述三维模型样本的表面形状。提取各个投影图像中各个像素点的图像特征,以及各个像素点在对应投影图像中的像素位置。根据各个像素点在对应投影图像中的像素位置,通过初始编码器确定第一像素点、第二像素点和第三像素点。其中,三个像素点分别属于三个投影平面,而且三个像素点分别表征三维模型样本的表面上的三个位置,这三个位置分别与三维模型样本的表面上的目标表面位置之间的距离均小于预设距离阈值,说明三个像素点分别表征的三维模型样本的表面上的三个位置相距较近。根据第一像素点的图像特征、第二像素点的图像特征和第三像素点的图像特征,确定针对目标表面位置的子特征向量,由于子特征向量是根据根据物理意义上相距较近的三个图像特征确定的,故根据子特征向量得到的针对三面体样本的第一特征向量尽可能对齐了三个投影图像的图像特征,提高了第一特征向量的准确性。通过解码器对该第一特征向量进行解码,得到第一预测三面体,根据第一预测三面体和三面体样本之间的差异,调整初始编码器的参数,得到编码器,使得编码器确定的三个像素点越来越准确,即对三个投影图像的图像特征对齐的更准确,从而子特征向量和第一特征向量更为准确,提高了通过编码器特征提取得到的第一特征向量的准确性。

25、由此,在提取各个投影平面的像素点的图像特征后,通过编码器将像素点的图像特征在物理意义上对齐,得到三维模型样本的表面上各个位置的子特征向量,从而得到三面体样本的第一特征向量。在训练编码器的过程中,没有引入噪声的同时,实现了不同投影平面的特征之间的感知,提高了通过编码器特征提取得到的第一特征向量的准确性。

本文档来自技高网...

【技术保护点】

1.一种编码器的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述初始编码器包括特征提取子模块和特征索引子模块;所述提取各个所述投影图像中各个像素点的图像特征,以及所述各个像素点在对应投影图像中的像素位置,包括:

3.根据权利要求2所述的方法,其特征在于,所述第一特征向量的维度小于预设维度阈值。

4.根据权利要求3所述的方法,其特征在于,所述通过所述特征提取子模块提取各个所述投影图像中各个像素点的图像特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述第三特征向量的分布符合预设概率分布,所述通过初始特征提取模型对所述描述样本进行特征提取,得到所述描述样本对应的第二特征向量,包括:

7.根据权利要求5所述的方法,其特征在于,所述获取所述三维模型样本对应的描述样本,包括:

8.根据权利要求5所述的方法,其特征在于,所述方法还包括:

9.根据权利要求1所述的方法,其特征在于,所述通过解码器对所述第一特征向量进行解码,得到第一预测三面体,包括:

10.根据权利要求1所述的方法,其特征在于,所述根据所述各个像素点在对应投影图像中的像素位置,通过初始编码器确定属于第一投影图像的第一像素点、属于第二投影图像的第二像素点,以及属于第三投影图像的第三像素点,包括:

11.根据权利要求1所述的方法,其特征在于,所述根据所述各个像素点在对应投影图像中的像素位置,通过初始编码器确定属于第一投影图像的第一像素点、属于第二投影图像的第二像素点,以及属于第三投影图像的第三像素点,包括:

12.一种编码器的训练装置,其特征在于,所述装置包括:获取单元、提取单元、第一确定单元、第二确定单元、第三确定单元、解码单元和调参单元;

13.一种计算机设备,其特征在于,所述计算机设备包括处理器以及存储器:

14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行权利要求1-11中任意一项所述的方法。

15.一种包括计算机程序的计算机程序产品,其特征在于,当其在计算机设备上运行时,使得所述计算机设备执行权利要求1-11中任意一项所述的方法。

...

【技术特征摘要】

1.一种编码器的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述初始编码器包括特征提取子模块和特征索引子模块;所述提取各个所述投影图像中各个像素点的图像特征,以及所述各个像素点在对应投影图像中的像素位置,包括:

3.根据权利要求2所述的方法,其特征在于,所述第一特征向量的维度小于预设维度阈值。

4.根据权利要求3所述的方法,其特征在于,所述通过所述特征提取子模块提取各个所述投影图像中各个像素点的图像特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述第三特征向量的分布符合预设概率分布,所述通过初始特征提取模型对所述描述样本进行特征提取,得到所述描述样本对应的第二特征向量,包括:

7.根据权利要求5所述的方法,其特征在于,所述获取所述三维模型样本对应的描述样本,包括:

8.根据权利要求5所述的方法,其特征在于,所述方法还包括:

9.根据权利要求1所述的方法,其特征在于,所述通过解码器对所述第一特征向量进行解码,得...

【专利技术属性】
技术研发人员:尚太章陈申周刘伟哲嵇盼李宏东
申请(专利权)人:中霸集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1