当前位置: 首页 > 专利查询>辉达公司专利>正文

基于网格的卷积神经网络技术制造技术

技术编号:37425925 阅读:20 留言:0更新日期:2023-04-30 09:47
三角形网格的卷积算子被确定用于构建一个或更多个神经网络。在至少一个实施例中,卷积算子、池化算子和去池化算子被确定用于构建一个或更多个神经网络,其中来自一个或更多个神经网络的相同经学习的权重可以进一步用于具有不同的拓扑的三角形网格。具有不同的拓扑的三角形网格。具有不同的拓扑的三角形网格。

【技术实现步骤摘要】
【国外来华专利技术】基于网格的卷积神经网络技术
[0001]相关申请的交叉引用
[0002]本申请要求2020年8月14日提交的题为“基于网格的卷积神经网络技术(MESH

BASED CONVOLUTIONAL NEURAL NETWORK TECHNIQUES)”的美国专利申请第16994499号的优先权,出于所有目的该申请的全部内容通过引用全部并入本文。


[0003]在至少一个实施例中,处理器包括一个或更多个算术逻辑单元(ALU),以使用神经网络执行训练和/或推理。在至少一个实施例中,一个或更多个神经网络被用来解决定义在三角形网格上的问题,其中来自训练一个或更多个神经网络的相同经学习的权重可用于不同拓扑的三角形网格。

技术介绍

[0004]布料和可变形体模拟已经被用于许多游戏应用和电影中。然而,随着分辨率和对象数量的增加,模拟的成本也在增加。因此,深度学习(DL)已经成为许多领域的宝贵工具,例如,它在物理模拟中的应用已经大大增加。然而,最常见的DL类型是全连接(FCN)或常规栅格上的卷积(CNN)。FCN至少需要O(NM)个权重,其中N是输入的大小,M是输出的大小,这限制了该方法的可扩展性。大多数CNN在网格上操作,而大多数布和可变形体模拟是由流形三角形网格表示的。为了让基于图像的CNN在三角形网格上运算,需要进行参数化,而参数化的获得可能很麻烦,而且会产生失真问题。基于图的CNN很常见,但它们被设计为在一般的图上工作,而不是专门在三角形网格上工作。
附图说明
[0005]图1示出了根据至少一个实施例的构建神经网络以在流形三角形网格上运算的系统的图;
[0006]图2示出了根据至少一个实施例为顶点确定卷积算子以构建神经网络的图;
[0007]图3示出了根据至少一个实施例如何确定边界顶点的一环、二环和三环相邻曲线的示意图;
[0008]图4示出了根据至少一个实施例构建池化和去池化算子的图;
[0009]图5示出了根据至少一个实施例的在流形三角形网格上运算的神经网络的组件的图;
[0010]图6示出了根据至少一个实施例的当输入和输出都定义在三角形网格的顶点上时的编码器

解码器网络的图;
[0011]图7示出了根据至少一个实施例的当输入是实数向量并且输出被定义在三角形网格的顶点上时的解码器网络的图;
[0012]图8示出了根据至少一个实施例的用于构建神经网络以在三角形网格上执行卷积的过程;
[0013]图9示出了根据至少一个实施例的用于构建具有用于三角形网格的池化和去池化算子的神经网络的过程;
[0014]图10示出了根据至少一个实施例的用于布料上采样问题的实现神经网络的实验视觉结果的图;
[0015]图11示出了根据至少一个实施例的利用各种损失函数的选择实现神经网络的实验视觉结果的图;
[0016]图12示出了根据至少一个实施例的从实现身体姿势到布料变形问题的神经网络的实验视觉结果的图;
[0017]图13示出了根据至少一个实施例的从实现用于主成分分析(PCA)系数的神经网络到用于各种数量的PCA系数的布料变形问题的实验视觉结果的图;
[0018]图14示出了根据至少一个实施例的从实现用于手关节角度到手皮肤变形问题的神经网络的实验视觉结果的图;
[0019]图15示出了根据至少一个实施例的用于布料上采样问题的神经网络的实现的实验视觉结果的图;
[0020]图16A示出了根据至少一个实施例的推理和/或训练逻辑;
[0021]图16B示出了根据至少一个实施例的推理和/或训练逻辑;
[0022]图17示出了根据至少一个实施例的神经网络的训练和部署;
[0023]图18示出了根据至少一个实施例的示例数据中心系统;
[0024]图19A示出了根据至少一个实施例的自主车辆的示例;
[0025]图19B示出了根据至少一个实施例的图19A的自主车辆的相机位置和视野的示例;
[0026]图19C是根据至少一个实施例的示出图19A的自主车辆的示例系统架构的框图;
[0027]图19D是根据至少一个实施例的示出用于一个或更多个基于云的服务器与图19A的自主车辆之间进行通信的系统的图;
[0028]图20是根据至少一个实施例的示出计算机系统的框图;
[0029]图21是根据至少一个实施例的示出计算机系统的框图;
[0030]图22示出了根据至少一个实施例的计算机系统;
[0031]图23示出了根据至少一个实施例的计算机系统;
[0032]图24A示出了根据至少一个实施例的计算机系统;
[0033]图24B示出了根据至少一个实施例的计算机系统;
[0034]图24C示出了根据至少一个实施例的计算机系统;
[0035]图24D示出了根据至少一个实施例的计算机系统;
[0036]图24E和图24F示出了根据至少一个实施例的共享编程模型;
[0037]图25示出了根据至少一个实施例的示例性集成电路和相关的图形处理器;
[0038]图26A

图26B示出了根据至少一个实施例的示例性集成电路和相关联的图形处理器;
[0039]图27A

图27B示出了根据至少一个实施例的附加的示例性图形处理器逻辑;
[0040]图28示出了根据至少一个实施例的计算机系统;
[0041]图29A示出了根据至少一个实施例的并行处理器;
[0042]图29B示出了根据至少一个实施例的分区单元;
[0043]图29C示出了根据至少一个实施例的处理集群;
[0044]图29D示出了根据至少一个实施例的图形多处理器;
[0045]图30示出了根据至少一个实施例的多图形处理单元(GPU)系统;
[0046]图31示出了根据至少一个实施例的图形处理器;
[0047]图32是根据至少一个实施例的示出用于处理器的处理器微架构的框图;
[0048]图33示出了根据至少一个实施例的深度学习应用程序处理器;
[0049]图34是根据至少一个实施例的示出了示例神经形态处理器的框图;
[0050]图35示出了根据一个或更多个实施例的图形处理器的至少部分;
[0051]图36示出了根据一个或更多个实施例的图形处理器的至少部分;
[0052]图37示出了根据一个或更多个实施例的图形处理器的至少部分;
[0053]图38是根据至少一个实施例的图形处理器的图形处理引擎的框图;
[0054]图39是根据至少一个实施例的图形处理器核心的至少部分的框图;
[0055]图40A

图40B示出了根据至少一个实施例的线程执行逻辑,其包括图形处理器核心的处理元件的阵列。
[0056]图41示出了根据至少一个实施例的并行处理单元(“PPU”本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种系统,包括:一个或更多个计算机,其具有一个或更多个处理器,用于通过以下方式训练神经网络:在所述神经网络的层处对数据输入执行卷积,其中所述卷积是通过对所述数据输入应用卷积算子来执行的,所述卷积算子通过以下方式确定:从所述数据输入的多个顶点中选择顶点;基于所述卷积算子的长度,对所述多个顶点进行采样以生成所选择的顶点的多个采样点;将所述多个顶点添加到列表,使来自所述多个顶点中的每个顶点与来自所述多个采样点中的采样点配对;以及至少部分地基于所述列表来确定一组顶点;以及将所述卷积算子应用于所述数据输入以生成所述卷积的一组输出,所述卷积算子至少部分地基于所述一组顶点被定义。2.根据权利要求1所述的系统,其中所述一个或更多个处理器进一步通过以下方式训练所述神经网络:使用所述神经网络的附加层,对来自所述层的所述输出执行一组运算,其中来自所述一组运算中的至少一个运算包括池化运算,其中用于所述池化运算的算子通过以下方式确定:执行从所述数据输入的所述多个顶点中选择顶点,来与所述多个顶点中的至少一个其他顶点相组合,以生成一个或更多个共享顶点,其中所述一个或更多个共享顶点被用作所述算子;以及将所述算子应用于所述池化运算的所述一组输出。3.根据权利要求2所述的系统,其中所述一个或更多个处理器进一步通过使用最小二次误差公式来训练所述神经网络,以执行从多个顶点中选择所述顶点。4.根据权利要求2所述的系统,其中所选择的顶点和所述至少一个其他顶点是相互独立的。5.根据权利要求1所述的系统,其中所述一个或更多个处理器进一步通过以下方式训练所述神经网络:使用所述神经网络的附加层,对来自所述层的所述输出执行一组运算,其中所述一组运算中的至少一个运算包括去池化运算,其中用于所述去池化运算的算子通过以下方式确定:从所述数据输入的所述多个顶点中选择顶点,以及将所述顶点的值复制到所述多个顶点中的至少一个其他顶点以生成一个或更多个共享顶点,其中所述一个或更多个共享顶点被用作所述算子;以及将所述算子应用于所述去池化运算的所述一组输出。6.根据权利要求1所述的系统,其中每个顶点和对应的采样点之间的距离之和被最小化。7.根据权利要求6所述的系统,其中来自经训练的神经网络的参数被应用于第二数据输入以确定卷积算子,其中所述第二数据输入是与所述数据输入不同的三角形网格。8.一种处理器,包括:
一个或更多个算术逻辑单元(ALU),用于至少部分地通过以下方式训练一个或更多个神经网络:确定一个或更多个卷积算子以对接收到的数据输入执行卷积,其中所述一个或更多个卷积算子的所述确定通过以下方式进行:对所述数据输入的多个顶点进行采样,以生成所述多个顶点中的顶点的多个采样点;生成索引以指示所述顶点和所述多个顶点中的每个顶点都与所述多个采样点中的采样点配对;以及使用来自所述索引的信息确定所述卷积算子。9.根据权利要求8所述的处理器,进一步包括所述一个或更多个ALU,用于通过以下方式训练所述一个或更多个神...

【专利技术属性】
技术研发人员:N
申请(专利权)人:辉达公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1