辉达公司专利技术

辉达公司共有2181项专利

  • 用于执行操作以指示一个或更多个数据矩阵内的一个或更多个非零值;执行API以压缩一个或更多个数据矩阵;对两个或更多个数据矩阵执行矩阵乘法累加(MMA)运算,其中所述两个或更多个矩阵中的至少一个矩阵包含压缩数据;和/或执行API以解压缩一个...
  • 本公开涉及用于自主系统和应用的使用占用网格进行危险检测。在各种示例中,危险检测系统将来自多个检测传感器的危险指示符绘制到与行驶环境相对应的占用网格的网格单元格。例如,当自机器沿着道路行驶时,自机器的一个或更多个传感器可捕获表示驾驶环境的...
  • 本公开涉及用于处理器中的线程组的可扩展负载均衡的技术。处理器通过集中工作分配来支持新的线程组层次结构,以通过跨处理核心的推测性启动和负载均衡来提供线程组阵列中的线程组的硬件保证并发地执行。通过在处理核心之间分配网格光栅化来实现效率。之间...
  • 本公开涉及具有一组线程束的高效矩阵乘法和加法。本说明书描述了在图形处理单元(GPU)和其他处理器中实现矩阵乘法和加法(MMA)运算的技术。该实施方式通过使每个线程能够共享其相应的寄存器文件以供与该组线程束中的其他线程相关联的数据路径访问...
  • 本公开涉及用于高效访问多维数据结构和/或其他大型数据块的方法和装置。并行处理单元包括多个处理器,每个处理器被耦合到存储器访问硬件电路。每个存储器访问硬件电路被配置为从耦合的处理器接收指定多维数据结构的坐标的存储器访问请求,其中存储器访问...
  • 公开了使用自主系统和应用的神经网络的地图信息对象数据管理。在各种示例中,地图数据或地理空间数据用于识别较大传感器数据集的具有包括感兴趣目标对象的表示的更高可能性的传感器数据子集。对应于该传感器数据子集的特征向量然后可以与对应于所述目标对...
  • 本发明公开了用于防止取消选择存储的应用程序编程接口,具体公开了用于执行一个或更多个API的装置、系统和技术。在至少一个实施例中,处理器用于执行API以防止取消选择用于在使用不同传输协议的多个第五代新无线电(5G
  • 本发明公开了用于获得数据的应用程序编程接口,具体公开了用于执行一个或更多个API的装置、系统和技术。在至少一个实施例中,处理器用于执行API以从要用于在多个第五代新无线电(5G
  • 本公开涉及用于高效访问多维数据结构和/或其他大型数据块的方法和装置。并行处理单元包括多个处理器,每个处理器被耦合到存储器访问硬件电路。每个存储器访问硬件电路被配置为从耦合的处理器接收指定多维数据结构的坐标的存储器访问请求,其中存储器访问...
  • 本公开涉及分析集成电路时序变化。在电路设计测试期间,在测试环境的计算机实现的方法中使用自适应时钟模型和电压噪声模型,以确定电压变化和自适应时钟对电路设计时序的动态影响。计算机实现的方法使用结合了基于图的方法和基于路径的方法的混合阶段,也...
  • 本公开涉及不需要硬件复位的执行软件在处理组件之间的灵活迁移。处理器的处理硬件被虚拟化以在一致的编程接口与特定硬件实例之间提供外观。当不需要支持一致的编程接口和/或不需要跨硬件布置(诸如集成电路)平衡硬件处理时,可以永久地或暂时地禁用硬件...
  • 本发明涉及公平利用多个上下文共享加密硬件。支持多个上下文共享加密硬件的公平性的设备、系统和技术。加速器电路包括具有AES
  • 公开了虚拟化处理器中的硬件处理资源。处理器的处理硬件被虚拟化以在一致的编程接口与特定硬件实例之间提供外观。当不需要支持一致的编程接口和/或不需要跨硬件布置(诸如集成电路)平衡硬件处理时,可以永久地或暂时地禁用硬件处理器组件。执行软件可以...
  • 本公开涉及跨多个计算引擎的程序化控制的数据多播。本说明书描述了一种程序化多播技术,该技术使一个线程(例如,在GPU上的协作组阵列(CGA)中)能够代表一个或更多个其他线程(例如,在GPU的相应处理器核心上执行)请求数据。多播由跟踪电路支...
  • 公开了协作组阵列,具体描述了一个或更多个新的层次结构级别——协作组阵列(CGA)——以及关联的新的基于硬件的工作分配/执行模型。CGA是线程块的网格(也称为协作线程阵列(CTA))。CGA提供协同调度,例如,相对于应用程序所需的内存以及...
  • 本公开涉及用于自主机器系统和应用的基于感知的停车辅助。在各种示例中,呈现了用于自我机器的基于感知的停车辅助系统和方法。示例实施例可以确定现实世界停车带相对于自我机器的位置以及用于停车带的相关停车规则。可以至少部分地基于在自我机器的环境中...
  • 提出了用于对图像中的对象进行分类的装置、系统和技术。在至少一个实施例中,一个或更多个神经网络用于至少部分地基于该一个或更多个神经网络已经使用一个或更多个完整图像和该一个或更多个完整图像的一个或更多个部分进行了训练,来识别该一个或更多个完...
  • 本发明公开了用于取消选择存储的应用程序编程接口,具体公开了用于执行一个或更多个API的装置、系统和技术。在至少一个实施例中,处理器用于执行API以取消选择要用于在多个第五代新无线电(5G
  • 本公开涉及从机器人系统和应用的复杂指令中解译离散任务。提供了用于执行复杂(例如,复合)任务的方法,所述复杂任务可涉及多个离散任务,所述多个离散任务在执行所述复杂任务的指令中并不明显。可以使用捕获的图像数据来确定环境的条件集,并且分析所述...
  • 公开了分布式共享存储器,其包括跨处理器(诸如GPU)分布或者分散的存储器块。在一个存储器块本地的处理核心上执行的线程能够访问不同处理核心本地的存储器块。在一个实施例中,通过处理核心之间的通信来实现对跨处理核心的集合分布的这些DSMEM分...