辉达公司专利技术

辉达公司共有2181项专利

  • 本发明公开了内核系数量化,具体公开了在执行矩阵运算时优化存储器使用的装置、系统和技术。在至少一个实施例中,优化矩阵以限制存储器和存储要求,同时最小化矩阵成员之和的精度损失。度损失。度损失。
  • 公开了合成用于训练一个或更多个神经网络的数据。提出了用于生成对进一步训练神经网络有用的数据的设备、系统和技术。在至少一个实施例中,可以至少部分地基于由一个或更多个神经网络生成的数据,包括先前用于训练所述一个或更多个神经网络的数据,来重新...
  • 本申请涉及用于有效的结构附接存储器的技术。结构附接存储器(FAM)提供存储器池,可由一个或更多个处理器(例如,一个或更多个图形处理单元(GPU(s)))通过网络架构访问。在一个实例中,公开了一种使用不完美处理器作为存储器控制器以允许位于...
  • 本发明公开了一种用于程序间数据交换的持久便签内存。公开了用于共享在具有多个处理单元的系统上执行的内核(每个指令集)之间的数据交换的技术。在一个实施例中,每个处理单元包括片上便签内存,其可由在处理单元上执行的内核访问。例如,可以分配和配置...
  • 在各种示例中,可以提供用于高级计算操作的虚拟化计算平台,高级计算操作包括图像重建、分割、处理、分析、可视化和深度学习。该平台可以通过选择、组织和调整用于局部的、本地实现的任务容器的构造来允许推理管线定制。在任务容器内,为了特定于位置的实...
  • 公开了基于比较模型参数的精度训练机器学习模型的处理器和系统。协同训练一个或更多个机器学习模型的装置、系统和技术。参数审查器可以配置为比较机器学习模型参数信息集,以便生成一个或更多个机器学习模型,例如神经网络。
  • 本申请涉及使用一个或更多个神经网络确定注视,提出了用于预测观察者注视的设备、系统和技术。在至少一个实施例中,训练网络以至少部分地基于与一个或更多个用户并不总是可见的对象相对应的一个或更多个注视来预测所述一个或更多个用户的注视。
  • 本发明公开了一种将数据有效地传输至处理器的技术,具体公开了用于块数据传输的技术,可减少数据传输和存储器访问开销,并显著降低多处理器活动和能耗。在需要存储在全局内存中的数据的多处理器上执行的线程可以请求所需数据并将其存储在片上共享内存中,...
  • 公开了用于协调计算机系统上的操作的高性能同步机制。公开了一种新型同步屏障,用于计算系统的同步操作。在一个实施例中,所公开的同步屏障提供了某些同步机制,诸如,例如“到达(Arrive)”和“等待(Wait)”被拆分以允许在协调同步中更高的...
  • 本发明公开了游戏事件识别,游戏不可知事件检测器可用于自动识别游戏事件。游戏特定配置数据可用于指定要在游戏会话的媒体上执行的预处理的类型,以及用于检测游戏事件的检测器的类型。可以以人类可读和过程可读的形式将检测到的事件的事件数据写入事件日...
  • 在各种示例中,使用主机控制器的受信固件来保护虚拟化软件对虚拟机存储器的访问,以验证用于读取虚拟机存储器的一个或更多个命令和/或从虚拟机存储器读取的数据,以防止对虚拟机存储器中的数据的不当访问。如果验证失败,则固件可以避免读取数据和/或避...
  • 本发明公开了在计算云服务的资源分配队列期间增加用户参与度的方法,在各种示例中,当从启动器应用程序接收到用户期望与云游戏或计算服务进行交互的指示,并且确定为该交互请求的期望的计算资源不可用于分配时,则一个或更多个交互内容项与用户的本地计算...
  • 本发明公开了机器学习模型的实时更新,可以针对应用程序更新诸如机器学习模型之类的资源,而不会对该应用程序造成任何重大停机。对于托管在网络边缘处的应用程序,可以将该应用程序部署在容器中,并将一个或更多个模型版本存储在本地存储器中的边缘处,可...
  • 本发明公开了用于建模序列数据中长期依赖性的双重循环神经网络递归神经网络架构。学习环境的动态变化并预测将来的后果是一项最新的技术进步,其可以应用于视频预测,语音识别以及其他应用。通常,机器学习(例如深度学习模型,神经网络或其他人工智能算法...
  • 本发明公开了基于视觉的灵巧机器人系统的远程操作,人类驾驶员通过模拟人类手的一组期望的运动来控制机器人臂和抓取器。在至少一个实施例中,捕获并分析驾驶员的手的一个或更多个图像以确定一组手姿势。在至少一个实施例中,该组手姿势被转换成对应的一组...
  • 本并行处理单元(PPU)可以被分为多个分区。每个分区被配置为与整个PPU操作类似的操作。给定分区包括与整个PPU关联的计算和存储资源的子集。在CPU上执行的软件将管理员用户的PPU分区。访客用户被分配给一个分区,并且所述访客用户可以与分...
  • 并行处理单元(PPU)可以被分为多个分区。每个分区被配置为与整个PPU操作类似的操作。给定分区包括与整个PPU关联的计算和存储资源的子集。在CPU上执行的软件将管理员用户的PPU分区。访客用户被分配给一个分区,并且所述访客用户可以与分配...
  • 并行处理单元(PPU)可以被分为多个分区。每个分区被配置为与整个PPU操作类似的操作。给定分区包括与整个PPU关联的计算和存储资源的子集。在CPU上执行的软件将管理员用户的PPU分区。访客用户被分配给一个分区,并且所述访客用户可以与分配...
  • 并行处理单元(PPU)可以被分为多个分区。每个分区被配置为与整个PPU操作类似的操作。给定分区包括与整个PPU关联的计算和存储资源的子集。在CPU上执行的软件将管理员用户的PPU分区。访客用户被分配给一个分区,并且所述访客用户可以与分配...
  • 本发明公开了一种用于对内存有效分区的技术,具体公开了用于将在物理内存设备内定义的全局内存空间分配给一个或更多个跨步内存空间(SMS)和一个或更多个分区内存空间(PMS)的技术。在一个实施例中,SMS被映射到所有设备上,并且PMS被映射到...