渊慧科技有限公司专利技术

渊慧科技有限公司共有192项专利

  • 本申请涉及使用优先化经验存储器训练神经网络。公开了用于对用于选择由与环境交互的强化学习代理执行的动作的神经网络进行训练的方法、系统和装置。在一个方面中,一种方法包括维持重放存储器,其中所述重放存储器存储作为所述强化学习代理与所述环境交互...
  • 本公开涉及渐进式神经网络。用于执行机器学习任务序列的方法和系统。一种系统包括深度神经网络(DNN)序列,所述深度神经网络(DNN)序列包括:与第一机器学习任务对应的第一DNN,其中,所述第一DNN包括第一多个索引层,并且所述第一多个索引...
  • 包括在计算机存储介质上编码的计算机程序的方法、系统和装置,用于使用动作选择神经网络来选择要由代理执行以与环境交互的动作。在一个方面,一种方法包括,在时间步骤序列中的每个时间步骤:生成到所述当前时间步骤为止由代理在环境中执行的任务的状态的...
  • 公开了一种前馈生成式神经网络,该前馈生成式神经网络生成在单个神经网络推理中包括特殊类型的多个输出示例的输出示例。可选地,生成可以以上下文输入为条件。例如,前馈生成式神经网络可以生成语音波形,语音波形是以文本片段的语言特征为条件的输入文本...
  • 用于训练智能体神经网络以用于控制智能体执行多个任务的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。方法之一包括维护指定一个或多个候选智能体神经网络的群体的群体数据;以及在一个或多个任务的相应集合上训练每个候选智能体神经网络以...
  • 用于训练机器学习模型的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。在一个方面,方法包括接收用于在多个任务上训练机器学习模型的训练数据,其中每个任务包括多批训练数据。根据当前任务选择策略选择任务。从所选任务中选择一批训练数据...
  • 用于生成控制信号的方法、系统和装置,包括编码在计算机存储介质上的计算机程序,控制信号用于控制磁场以将等离子体约束在磁约束设备的腔室中。方法之一包括,对于多个时间步长中的每一个,获得表征磁约束设备的腔室中的等离子体的当前状态的观察,使用等...
  • 用于训练动作选择神经网络的方法、系统以及装置,包括在计算机存储介质上编码的计算机程序。方法之一包括:接收表征环境的当前状态的观察;通过执行从当前状态开始直到环境到达满足一个或多个终结准则的可能未来状态为止的环境的可能未来状态的先行搜索来...
  • 本公开提供了方法、系统和装置,其包括在计算机存储介质上编码的计算机程序,所述计算机程序用于预测与环境有关的结果。在一个方面,一种系统包括状态表示神经网络,被配置为接收表征与代理交互的环境的状态的观察,并处理该观察以生成环境状态的内部状态...
  • 本发明涉及使用神经网络生成视频帧。提供了用于使用神经网络来生成视频帧的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。所述方法中的一个包括:使用编码器神经网络处理视频帧序列以生成编码表示;并且根据像素顺序和通道顺序逐个像素地生...
  • 用于训练神经网络以执行任务的方法、计算机系统和装置,包括编码在计算机存储介质上的计算机程序。该系统维护数据,该数据指定(i)多个候选神经网络和(ii)将该多个候选神经网络向多个分区的划分。该系统重复执行操作,该操作包括:训练每个候选神经...
  • 用于训练强化学习系统的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。在一个方面,训练动作选择策略神经网络以用于选择要由导航经过环境以实现一个或多个目标的代理执行的动作的方法包括:接收表征环境的当前状态的观察图像;使用动作选择...
  • 方法、系统和装置,包括编码在计算机存储介质上的计算机程序,用于训练动作选择神经网络,该动作选择神经网络用于选择要由与环境交互的智能体执行的动作。该系统之一包括(i)多个行动者计算单元,其中每个行动者计算单元被配置为维护动作选择神经网络的...
  • 本公开涉及使用神经网络的黑盒优化。用于确定机器学习训练过程的一个或多个过程参数的优化设置的方法和系统。方法中的一个包括:使用递归神经网络依照网络参数的第一值来处理当前网络输入以获得当前网络输出;获得使用由当前网络输出所定义的经更新的设置...
  • 本说明书涉及用于控制代理以根据包括一系列局部目标
  • 使用策略模型神经网络来选择智能体在环境中的动作,所述策略模型神经网络实现策略模型,所述策略模型针对由策略模型神经网络接收的观察表征的环境的任何观察状态来定义智能体能够执行的可能动作集合上的状态
  • 一种计算机实现的视频生成神经网络系统,被配置为通过从对象潜在变量的相应先验对象潜在分布中进行采样来确定一组对象潜在变量中的每一个的值
  • 用于使用神经网络生成网络输出的方法
  • 用于训练包括一个或多个示图神经网络层的神经网络的方法
  • 本发明公开了用于训练行动选择策略神经网络以选择将由代理执行的行动以控制代理执行任务的计算机实现的系统和方法
1 2 3 4 5 6 7 8 尾页