辉达公司专利技术

辉达公司共有2181项专利

  • 通常,数据易受由硬件中的故障(即永久性故障)引起的错误的影响,例如存储器和/或通信信道的功能故障。为了检测由硬件故障引起的数据中的错误,引入了纠错码(ECC),其基本上为数据提供了一种冗余,可用于验证数据没有由硬件故障引起的错误。在某些...
  • 一种用于逆向图形渲染的系统、方法和计算机可读介质,包括可微分的渲染管线和梯度下降优化引擎。使用场景参数描述给定场景。可见性函数和其他渲染函数被构造为连续且可微分的,允许优化引擎和渲染管线通过越来越精细的场景模型有效地迭代。
  • 公开了一种用于线内数据检查的方法、计算机可读介质和系统。该方法包括以下步骤:由加载/存储单元接收加载指令,并通过耦合到加载/存储单元的检查电路获得由加载指令指定的数据。附加步骤包括确定数据等于零并将数据和谓词信号发送到加载/存储单元,其...
  • 公开了用于训练神经网络模型的方法、计算机可读介质和系统。所述方法包括步骤:从包括输入向量和稀疏目标向量的一组训练数据中选择输入向量,其中每个稀疏目标向量包括对应于神经网络模型的输出向量内的样本子集的目标数据。所述方法还包括步骤:通过神经...
  • 公开了用于执行矩阵乘积和累加(MMA)运算的方法、计算机可读介质和处理器。处理器包括数据路径,其被配置为执行MMA运算以在数据路径的输出处生成结果矩阵的多个元素。通过计算与在用于MMA运算的指令中指定的矩阵运算对象相关联的相应向量对的至...
  • 一种用于提供图形处理的装置。该装置包括双核CPU插槽结构,所述双核CPU插槽结构包括第一CPU插槽和第二CPU插槽。所述装置包括多个GPU板,所述多个GPU板提供耦连到所述第一CPU插槽和所述第二CPU插槽的多个GPU处理器,其中每个G...
  • 提供了一种用于全面同步执行线程的技术。在一个实施例中,同步指令使处理器确保包括在线程束中的指定线程同时执行单个后续指令。所述指定线程至少包括第一线程和第二线程。在操作中,第一线程到达同步指令。处理器确定第二线程还没有到达同步指令,并且将...
  • 公开了一种使用深度神经网络执行自主路径导航的方法、计算机可读介质和系统。所述方法包括以下步骤:在深度神经网络(DNN)处接收图像数据;利用所述图像数据由所述DNN确定运载工具相对于所述路径的方位和所述运载工具相对于所述路径的横向位置两者...
  • 本发明的各方面涉及用于执行数据压缩以及在不同程度精度的数据格式之间执行数据转换的计算机实现的技术,并且更具体地,用于使用降低精度的(例如,INT8)数据格式来改进人工神经网络的推理(应用)的计算机实现的技术。本发明的实施方案生成数据输出...
  • 公开了用于执行时空滤波的方法、计算机可读介质和系统。该方法包括识别要渲染的图像数据,使用包括神经网络的滤波器重建图像数据以创建经重建的图像数据,所述神经网络具有一个或更多个跳跃连接和一个或更多个循环层,以及返回经重建的图像数据。
  • 本发明涉及了访问计算图。在所述计算图中,要进行的运算被表示为内部节点,所述运算的输入被表示为叶节点,并且所述运算的结果被表示为根。将所述运算的选定集合进行组合以形成相应运算内核。生成用于执行所述运算内核的代码。执行所述代码以确定所述结果。
  • 用于基于物理的材料的自动化细节层次
    公开了一种用于实现基于物理的材料的自动细节层次的方法、计算机可读介质和系统。该方法包括以下步骤:识别要渲染的材料的声明性表示;通过将一个或更多项重写规则应用于材料的声明性表示,创建复杂度降低的声明性表示;以及返回材料的复杂度降低的声明性...
  • 内联错误检测和校正技术
    本发明公开了内联错误检测和校正技术。根据本技术的实施例,基于区域的选择性错误检测和校正技术提供了错误检测和错误校正(EDEC)保护的安全性以及用于不同用途的非EDEC保护的更高带宽和容量之间的权衡。
  • 用于修剪神经网络以实现资源有效推理的系统和方法
    公开了一种用于神经网络修剪的方法、计算机可读介质和系统。所述方法包括步骤:接收用于经训练的神经网络的成本函数相对层参数的一阶梯度和基于与所述层参数相对应的所述一阶梯度计算每个层参数的修剪标准,其中所述修剪标准指示包括在所述经训练的神经网...
  • 使用低精度格式的张量处理
    本发明的方面提供了使用低精度格式的张量处理。涉及用于使用低精度(例如,浮点16位)数据格式来改善对人工神经网络的训练的计算机实现的技术。本发明的实施方案在执行矩阵运算(诸如矩阵相乘或矩阵相加)前重新缩放张量值,以防止上溢和下溢。为了在所...
  • 利用投影几何失真用于以可变采样率渲染的系统、方法和计算机程序产品
    提供了以可变采样率渲染的系统、方法和计算机程序产品。从着色器执行单元接收3D基元的顶点坐标,并且通过固定操作电路对顶点坐标执行算术操作,以产生齐次坐标空间中的修改的顶点坐标。修改的顶点坐标从齐次坐标空间被变换到屏幕空间,以产生变换的3D...
  • 使用图形处理管线实现的立体多投影
    公开了一种用于生成多视图图像数据的方法、计算机可读介质和系统。所述方法包括处理模型的图元数据以生成经处理的图元数据的步骤,所述经处理的图元数据包括用于图元数据中的每个顶点的多个位置矢量,与每个顶点相关联的位置矢量的数目等于被生成的至少两...
  • 具有分立电感器的电流停泊切换调节器
    提供用于调节负载处的电压电平的系统和方法。方法配置电流控制机构为生成通过串联耦合的第一电感器和第二电感器的电流以及配置电压控制机构为提供电流的一部分以调节电压电平。第二电感器将负载与电流控制机构的寄生电容隔离。用于调节负载处的电压电平的...
  • 提供矩阵相位检测器。提供用于时钟相位检测的方法和系统。生成第一时钟信号的经延迟版本的第一集合并且生成第二时钟信号的经延迟版本的第二集合。使用第一时钟信号的经延迟版本的第一集合来将第二时钟信号的经延迟版本的第二集合采样,以在与第一时钟信号...
  • 容变周期性同步器。提供用于容变同步的方法和系统。接收表示第二时钟信号相对于第一时钟信号的相位的相位值和表示第二时钟信号与第一时钟信号之间的相对周期的周期值。基于相位值和周期值计算与第一时钟信号的下一跃迁相对应的、第二时钟信号相对于第一时...