渊慧科技有限公司专利技术

渊慧科技有限公司共有198项专利

  • 提出了一种循环单元,该循环单元在时间步系列中的每个时间步接收对应输入向量并且针对二维像素阵列的每个像素在该时间步生成具有至少一个分量的输出。该循环单元在时间步系列的除了第一个时间步之外的每个时间步被配置成接收循环单元在前一时间步的输出,...
  • 提供了一种用于通过强化学习来训练神经网络系统的方法,该神经网络系统被配置为接收表征由智能体交互的环境的状态的输入观测并且根据旨在满足多个目标的策略来选择和输出动作。该方法包括获得一个或多个轨迹的集合。每个轨迹包括环境的状态、响应于状态根...
  • 本公开涉及异步深度强化学习。用于异步深度强化学习的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。所述系统之一包括被配置为实现多个工作体的一个或多个计算机,其中每个工作体被配置为独立于每个其它工作体进行操作,并且其中每个工作体...
  • 使用比较样本的比较集来分类新样本的方法、系统和装置。一种方法包括维持比较集,该比较集包括比较样本和每个比较样本的相应标签矢量,每个标签矢量包括预定标签集中的每个标签的相应分数;接收新样本;通过将神经网络注意力机制应用于新样本和比较样本来...
  • 本公开涉及利用深度强化学习的连续控制。训练动作器神经网络的方法、系统、和装置,包括编码在计算机存储介质上的计算机程序,所述动作器神经网络用于选择待由与环境交互的代理执行的动作。所述方法中的一个方法包括:获得小批经验元组;以及更新所述动作...
  • 用于数据驱动机器人控制的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。方法中的一个包括:维护机器人经验数据;获取注释数据;在注释数据上训练奖励模型;为特定任务生成特定于任务的训练数据,包括,针对机器人经验数据中经验的第二子集...
  • 本发明涉及用于执行神经网络的深度并行训练的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。方法中的一个包括接收输入序列;并且在处理时间步序列中的每个处理时间步:使用层块堆叠中的第一层块来处理输入项,以生成第一块输出;对于每个后...
  • 方法、系统和装置,包括在计算机存储介质上编码的计算机程序,用于响应于上下文输入序列中的每个上下文而选择动作。这些方法中的一种方法包括:维持指定与所述多个动作中的每个动作相对应的相应门控线性网络的数据;对于上下文序列中的每个上下文:对于每...
  • 方法、系统和装置,包括编码在计算机存储介质上的计算机程序,用于使用环境模型来模拟由使用策略神经网络控制的智能体与其交互的环境的状态转换。方法中的一个包括在当前时间点初始化环境状态的内部表示;重复执行以下操作:接收智能体要执行的动作;基于...
  • 包括编码在计算机储存介质上的计算机程序的方法、系统和装置,其用于确定由氨基酸序列指定的蛋白质的预测的结构。一方面,方法包括:获得对于蛋白质的多序列比对;从多序列比对中且对于蛋白质的氨基酸序列中的各氨基酸对,确定氨基酸对的相应的初始嵌入;...
  • 方法、系统和装置,包括在计算机存储介质上编码的计算机程序,用于使用生成神经网络来生成输出音频示例。这些方法中的一种方法包括:获得训练调节文本输入;使用前馈生成神经网络来处理包括所述训练调节文本输入的训练生成输入,以生成训练音频输出;使用...
  • 一种强化学习系统和方法,其选择要由与环境交互的智能体执行的动作。该系统使用强化学习和前瞻搜索的组合:强化学习Q值被用来引导前瞻搜索,并且搜索继而用于改进Q值。该系统从真实经验和模拟的基于模型的经验的组合中学习。习。习。
  • 包括在计算机存储介质上编码的计算机程序的方法、系统和装置,用于对作为序列的网络输入执行机器学习任务以生成网络输出。在一个方面,方法中的一个包括,针对层输入的每个特定序列:针于神经网络中的每个注意力层:维护事段记忆数据;维护压缩记忆数据;...
  • 一种强化学习方法和系统,所述强化学习方法和系统选择要由与环境交互的强化学习智能体执行的动作。因果模型由后见之明模型神经网络实施并且使用后见之明,即使用未来环境状态轨迹进行训练。由于所述方法和系统在选择动作时无法访问这种未来信息,因此使用...
  • 本发明提供了一种神经网络系统,所述系统包括至少一个层,所述层使用稀疏权重矩阵所定义的内核将1x 1卷积应用于稠密激活矩阵。所述层由处理器通过访问稀疏性数据集来实施,所述稀疏性数据集指示空权重在所述权重矩阵中的位置。所述处理器从存储器单元...
  • 描述了一种包括注意力神经网络的系统,该注意力神经网络被配置为接收输入序列并处理输入序列以生成输出。注意力神经网络包括:注意力块,其被配置为接收从注意力块输入导出的查询输入、键输入和值输入。注意力块包括注意力神经网络层,其被配置为:接收从...
  • 用于控制代理的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。一种方法包括:根据连续空间上的概率分布从可能索引变量的连续空间采样一个或多个索引变量;对于每个索引变量:根据超模型的多个参数值使用超模型处理索引变量,以生成指定环境...
  • 方法、系统和装置,包括编码在计算机存储介质上的计算机程序,用于使用反对称神经网络处理输入。处理输入。处理输入。
  • 用于训练神经网络的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。方法中的一种包括:使用神经网络并根据网络参数的当前值处理每个训练输入以为训练输入生成网络输出;通过评估损失函数计算每个训练输入的相应损失;从多个可能的扰动中识别...
  • 本发明提供了用于对生成器神经网络和编码器神经网络进行训练的方法、系统和装置,其包括在计算机存储介质上编码的计算机程序。生成器神经网络基于潜在值集合生成数据项,这些数据项是分布的样本。编码器神经网络生成对应数据项的潜在值集合。方法包括对生...