渊慧科技有限公司专利技术

渊慧科技有限公司共有202项专利

  • 用于控制智能体的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。特别是,能够基于包括观察图像和自然语言文本序列这两者的多模态输入来控制交互智能体。
  • 用于控制智能体的方法、系统和设备,包括在计算机存储介质上编码的计算机程序。具体地,可以使用分层控制器来控制智能体,分层控制器包括高层级控制器神经网络、中层级控制器神经网络和低层级控制器神经网络。
  • 用于生成最终输出序列的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。在一个方面中,一种方法包括:接收包括一个或多个当前输出分段的当前输出序列;接收参考分段的集合以及每个参考分段的已经使用嵌入神经网络生成的相应参考分段嵌入;对...
  • 用于使用包括一个或多个变换的激活函数层的神经网络系统来处理输入的方法、系统和装置,其包括编码在计算机存储介质上的计算机程序。
  • 用于控制环境中的强化学习智能体以使用检索增强动作选择过程来执行任务的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。其中,所述方法之一包括:接收表征环境的当前状态的当前观察;处理包括当前观察的编码器网络输入以确定与当前观察相对...
  • 用于跨集成电路的多个计算单元分布前k个计算的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。方法之一包括:由多个计算单元中的每个计算单元并且针对分配给计算单元的候选向量的相应子集中的每个候选向量,计算查询向量和候选向量之间的相...
  • 用于使用非自回归神经网络来生成输出序列的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。
  • 本申请涉及使用优先化经验存储器训练神经网络。公开了用于对用于选择由与环境交互的强化学习代理执行的动作的神经网络进行训练的方法、系统和装置。在一个方面中,一种方法包括维持重放存储器,其中所述重放存储器存储作为所述强化学习代理与所述环境交互...
  • 本申请涉及使用优先化经验存储器训练神经网络。公开了用于对用于选择由与环境交互的强化学习代理执行的动作的神经网络进行训练的方法、系统和装置。在一个方面中,一种方法包括维持重放存储器,其中所述重放存储器存储作为所述强化学习代理与所述环境交互...
  • 一种由一台或多台计算机实施的系统包括视觉编码器组件,该视觉编码器组件被配置为接收表示图像帧序列的数据作为输入,特别是表示该序列的场景中的对象的数据,并输出对应的状态码序列,每个状态码包括向量,一个向量用于每个对象。每个向量表示其对应的对...
  • 本申请涉及使用优先化经验存储器训练神经网络。公开了用于对用于选择由与环境交互的强化学习代理执行的动作的神经网络进行训练的方法、系统和装置。在一个方面中,一种方法包括维持重放存储器,其中所述重放存储器存储作为所述强化学习代理与所述环境交互...
  • 本公开涉及渐进式神经网络。用于执行机器学习任务序列的方法和系统。一种系统包括深度神经网络(DNN)序列,所述深度神经网络(DNN)序列包括:与第一机器学习任务对应的第一DNN,其中,所述第一DNN包括第一多个索引层,并且所述第一多个索引...
  • 包括在计算机存储介质上编码的计算机程序的方法、系统和装置,用于使用动作选择神经网络来选择要由代理执行以与环境交互的动作。在一个方面,一种方法包括,在时间步骤序列中的每个时间步骤:生成到所述当前时间步骤为止由代理在环境中执行的任务的状态的...
  • 公开了一种前馈生成式神经网络,该前馈生成式神经网络生成在单个神经网络推理中包括特殊类型的多个输出示例的输出示例。可选地,生成可以以上下文输入为条件。例如,前馈生成式神经网络可以生成语音波形,语音波形是以文本片段的语言特征为条件的输入文本...
  • 用于训练智能体神经网络以用于控制智能体执行多个任务的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。方法之一包括维护指定一个或多个候选智能体神经网络的群体的群体数据;以及在一个或多个任务的相应集合上训练每个候选智能体神经网络以...
  • 用于训练机器学习模型的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。在一个方面,方法包括接收用于在多个任务上训练机器学习模型的训练数据,其中每个任务包括多批训练数据。根据当前任务选择策略选择任务。从所选任务中选择一批训练数据...
  • 用于生成控制信号的方法、系统和装置,包括编码在计算机存储介质上的计算机程序,控制信号用于控制磁场以将等离子体约束在磁约束设备的腔室中。方法之一包括,对于多个时间步长中的每一个,获得表征磁约束设备的腔室中的等离子体的当前状态的观察,使用等...
  • 用于训练动作选择神经网络的方法、系统以及装置,包括在计算机存储介质上编码的计算机程序。方法之一包括:接收表征环境的当前状态的观察;通过执行从当前状态开始直到环境到达满足一个或多个终结准则的可能未来状态为止的环境的可能未来状态的先行搜索来...
  • 本公开提供了方法、系统和装置,其包括在计算机存储介质上编码的计算机程序,所述计算机程序用于预测与环境有关的结果。在一个方面,一种系统包括状态表示神经网络,被配置为接收表征与代理交互的环境的状态的观察,并处理该观察以生成环境状态的内部状态...
  • 本发明涉及使用神经网络生成视频帧。提供了用于使用神经网络来生成视频帧的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。所述方法中的一个包括:使用编码器神经网络处理视频帧序列以生成编码表示;并且根据像素顺序和通道顺序逐个像素地生...
1 2 3 4 5 6 7 8 尾页