辉达公司专利技术

辉达公司共有1697项专利

  • 本发明公开了估计视频序列中的被遮挡内容的流矢量。系统和方法估计视频序列的帧之间的被遮挡像素的光流矢量。可以识别被遮挡像素的区域,并且可以确定其遮挡的原因。可以至少部分地基于遮挡的原因应用不同的估计技术,以提供轻量级的、较不资源密集的光流...
  • 本发明公开了用于流媒体应用程序的改进的帧选择,具体公开了本文中的系统和方法使用一个或更多个处理单元处理视频流应用程序中的参考帧选择,以对经编码视频流中的帧进行解码,该经编码视频流使用描绘对象的帧间和描绘对象的帧内,该帧内至少部分地基于该...
  • 本发明公开了用于视频流式传输系统和应用的使用神经网络的特征重建。系统和方法涉及面部视频编码和重建,特别是在超低带宽设置。在实施例中,视频会议或其他流应用程序使用自动跟踪特征裁剪信息。用于识别裁剪区域的包围形状的大小会变化,并动态地被确定...
  • 本发明公开了生成神经网络,具体公开了用于选择性地使用一个或更多个神经网络层的装置、系统和技术。在至少一个实施例中,基于例如一个或更多个迭代增加的神经网络性能度量来选择性地使用一个或更多个神经网络层。
  • 公开了用于处理图像帧的装置、系统和技术,具体公开了用于指示帧大小信息的应用程序编程接口。在至少一个实施例中,执行应用程序编程接口(API)以使用一个或更多个神经网络来指示帧大小信息。
  • 公开了用于处理图像帧的装置、系统和技术,具体公开了用于使得执行帧插值的应用程序编程接口。在至少一个实施例中,执行应用程序编程接口(API)以使得使用一个或更多个神经网络执行帧插值。
  • 公开了用于GPU芯片和片上系统设备封装的反向嵌入式电源结构,具体公开了一种晶粒,包括晶粒体,该晶粒体具有第一体表面、与第一体表面处于晶粒体的相对侧上的第二体表面;与第一体表面相邻的互连区,包括具有金属线和通孔的互连介电层;互连区上方的晶...
  • 公开了用于处理图像帧的装置、系统和技术,具体公开了用于指示帧插值支持的应用程序编程接口。在至少一个实施例中,执行应用程序编程接口(API)以指示对使用一个或更多个神经网络来执行帧插值的支持。
  • 公开了用于处理图像帧的装置、系统和技术,具体公开了用于禁用帧插值的应用程序编程接口。在至少一个实施例中,执行应用程序编程接口(API),以禁用使用一个或更多个神经网络的帧插值。
  • 公开了用于处理图像帧的装置、系统和技术,具体公开了用于启用帧插值的应用程序编程接口。在至少一个实施例中,执行应用程序编程接口(API),以启用使用一个或更多个神经网络的帧插值。
  • 本发明公开了视频帧混合,具体公开了处理图像帧的装置、系统和技术。在至少一个实施例中,一个或更多个神经网络用于混合第一视频帧和第二视频帧之间的两个或更多个视频帧。在至少一个实施例中,使用混合视频帧来在第一视频帧和第二视频帧之间生成中间视频帧。
  • 本发明公开了使用神经网络生成经上采样的图像,具体公开了使用一个或更多个神经网络来至少部分地基于一个或更多个图像的降噪版本来生成所述一个或更多个图像的上采样版本的装置、系统和技术。至少一个实施例涉及从低分辨率图像的有噪声版本和降噪版本来生...
  • 本发明涉及提高光线‑盒测试的效率。为改进基于硬件的光线追踪器中的包围体的效率,用剪切的轴对准包围盒近似通常由旋转限定的定向包围盒。为实现这点,包围体层级构建器剪切轴对准盒,以在顶层或底层空间中紧密围绕其围起的定向几何结构拟合,然后计算逆...
  • 本公开涉及使用点退化剔除减少假阳性光线遍历。公开了适用于光线追踪硬件加速器的技术,用于遍历分层加速结构并具有减少的假阳性光线相交。假阳性的减少可以基于以下一项或更多项:有选择地对包围体进行二次高精度相交测试,识别和剔除退化为点的包围体,...
  • 本公开涉及使用大型语言模型的自然语言处理应用。本文提出的方法可以提供使用大型模型的特定类型的任务的执行,而不需要重新训练模型。自定义端点可以针对特定类型的任务进行训练,如可以通过一个或更多个指导机制的规范来指示的。指导机制可以被添加到请...
  • 本公开涉及使用光线剪裁减少假阳性光线遍历。公开了适用于光线追踪硬件加速器的技术,用于遍历分层加速结构并具有减少的假阳性光线相交。假阳性的减少可以基于以下一项或更多项:有选择地对包围体进行二次高精度相交测试,识别和剔除退化为点的包围体,以...
  • 本公开涉及减少包围体层次结构中的假阳性光线遍历。公开了适用于光线追踪硬件加速器的技术,用于遍历分层加速结构并具有减少的假阳性光线相交。假阳性的减少可以基于以下一项或更多项:有选择地对包围体进行二次高精度相交测试,识别和剔除退化为点的包围...
  • 使用用于汽车系统和应用的知识库和语言模型的对话系统。描述了使用与各种机器系统和应用相关联的对话系统的系统和方法。例如,系统和方法可以接收表示语音的文本数据,诸如与车辆或其他机器类型相关联的问题。然后系统和方法使用一个或更多个检索系统来检...
  • 深度神经网络可以被训练以从输入音频推理情绪数据。该网络可以是基于转换器的网络,其可以推理一组情绪或情绪类别的概率值。情绪概率值可以使用一个或更多个启发式方法进行修改,例如以提供情绪确定随时间的平滑性,或通过用户界面进行修改,其中用户可以...
  • 本发明公开了视频生成技术,具体公开了用于使用包括要被包括在视频中的对象的两个或更多个图像来生成该视频的装置、系统和技术。在至少一个实施例中,使用一个或更多个神经网络来识别两个或更多个图像中的对象,以生成将对象包括在视频中的该视频。
1 2 3 4 5 6 7 8 尾页