辉达公司专利技术

辉达公司共有2181项专利

  • 本发明公开了使用检索增强生成的自动语音识别系统的领域适应。本文提出的方法提供了在音频数据中表示的语音的文本转录本的生成。特别地,自动语音识别(ASR)模型可以与检索增强生成(RAG)管线一起使用,以提供包括与特定知识领域相关或特定于特定...
  • 公开了具有封闭域和开放域对话集成的对话式AI平台。在各种示例中,本公开的系统和方法将开放式对话系统和封闭式对话系统组合成智能对话管理系统。文本查询可以由被训练以将文本查询与域标签、意图分类和/或输入槽相关联的自然语言理解模型进行处理。使...
  • 本公开涉及用于监控系统及应用的传感器错位检测与校正。本发明公开了用于车舱内监控系统和应用的传感器错位检测和校正的系统和方法。例如,可以从相应的传感器数据测试帧和参考帧中检测并量化当前传感器状态与校准的传感器状态之间的错位。当检测到阈值错...
  • 描述了使用包括那些对象的数字表示的图像来确定对象的位置的设备、系统和技术。在至少一个实施例中,独立于用于检测那些乘员的一个或更多个传感器的位置来确定车辆的一个或更多个乘员的视线。
  • 描述了使用包括那些对象的数字表示的图像来确定对象的位置的设备、系统和技术。在至少一个实施例中,独立于用于检测那些乘员的一个或更多个传感器的位置来确定车辆的一个或更多个乘员的视线。
  • 本公开涉及用于阻止线程执行的应用程序编程接口,具体公开了用于取消待处理的GPU线程工作以允许运行线程集群承担所述工作的装置、系统和技术。在至少一个实施例中,处理器包括一个或更多个电路,这些电路用于执行应用程序编程接口(API),以使得由...
  • 本公开涉及检测对话式AI系统和应用的语音中断。在各种示例中,本文描述了用于对话式AI系统和应用的语音中断检测。本文公开的系统和方法使用与文本中的单词(例如,标记)相关联的句子结尾检测和话语结尾检测二者来确定何时进一步处理文本的各个部分。...
  • 本公开涉及用于自主系统和应用的对象检测的椭圆模型。根据本公开的一个或更多个实施例,椭圆模型可被应用于超声波传感器数据(USS数据)中包括的检测结果,以识别可以由检测结果指示的一个或更多个对象。对象的识别可以包括确定对象的至少部分的位置、...
  • 本公开涉及用于自主系统和应用的可微分且模块化的端到端堆栈。在各个示例中,控制堆栈可以包括机器学习模型(MLM)序列,该MLM序列分别预测可微分输出序列,以确定一个或更多个控制序列。所公开的方法可以用于实现可微分且模块化的端到端的AV堆栈...
  • 本公开涉及用于可视化脚本编写和分布式内容创建的计算图优化。在各种示例中,可视化脚本编写计算图的一些节点所需的数据可以由其正在操作的目标基元的属性定义,并且可以通过查询该目标基元数据来识别匹配基元的数量和目标基元数据的位置,基于匹配基元计...
  • 本公开涉及用于流媒体系统和应用的使用上下文信息控制对话。本文在多个示例中描述了用于对话人工智能(AI)系统和应用的使用上下文信息控制对话。公开的系统和方法使用各种上下文信息源以及文本输入(例如,查询)来生成与应用程序中的用户(例如,用户...
  • 本发明公开了多晶粒芯片中性能遥测子系统的分布式多消费者控制。计算系统性能监控器提供高性能单晶粒和多晶粒计算和处理系统的行为和其他处理指示数据的片上控制、选择、收集、合并和通信,例如用于多芯片模块和/或多实例图形处理单元(GPU)和/或片...
  • 本公开将光效果融入计算机生成图形的设备、系统和技术。在至少一个实施例中,通过生成指示所述虚拟场景中的一个或更多个光的记录,并使用所述记录渲染像素,来渲染描绘虚拟场景的图形帧。至少部分地基于与所述各个记录相关联的表面之间的相似度,选择指示...
  • 本发明涉及用于自主和半自主系统及应用的使用局部表面拟合的地表面估计。本公开的实施例涉及使用局部表面拟合的地表面估计。可以使用非线性优化来估计三维(3D)表面结构(例如,路面轮廓),该非线性优化用于将高度值拟合到(例如,累积的、经偏差校正...
  • 本公开涉及用于自主和半自主系统及应用的使用立体成像的地表面估计。本公开的实施例涉及利用立体成像和表面视差进行表面估计。例如,三维(3D)表面结构可以被建模为视差场,并且可以使用受约束的非线性分层优化来生成表示环境中的表面(例如地面)的表...
  • 本公开涉及用于将对象放置在图形渲染场景中的基于神经网络的位置识别,具体公开了用于识别在图形渲染的场景中放置对象的位置的装置、系统和技术。在至少一个实施例中,使用一个或更多个神经网络至少部分地基于对一个或更多个神经网络的文本或语音输入来识...
  • 本发明公开了采用逻辑推理的生成式AI。本文公开了与利用逻辑推理的生成式AI相关的系统和方法。例如,LLM可用于将诸如自然语言语句或软件代码行之类的语句转换为逻辑规范语言的逻辑语句,逻辑推理引擎可用于评价逻辑语句,并且LLM可用于以自然语...
  • 本公开涉及用于图像渲染和逆向渲染的生成式AI模型。本公开的实施例涉及使用一个或更多个生成式模型进行渲染和逆向渲染。“渲染”是指从2D或3D模型生成最终视觉图像或动画的过程。“逆向渲染”是指从观察到的图像或视觉数据推断或估计场景的性质(例...
  • 本公开涉及基于神经网络的相机姿态识别,具体公开了用于至少部分地基于一个或更多个相机的一个或更多个不同姿态来识别该一个或更多个相机的姿态的装置、系统和技术。在至少一个实施例中,针对图像序列中的图像的相机姿态是使用一个或更多个神经网络至少部...
  • 本公开涉及用于自主系统和应用的利用时间建模的路径感知。在各种示例中,为了改进机器学习实现中的路径感知,时间模型包括主干模型,该模型经过训练后可预测当前输入帧的一个或更多个路径感知输出,例如路径几何形状、路径类别、路径不确定性和/或其他路...