渊慧科技有限公司专利技术

渊慧科技有限公司共有201项专利

  • 方法、系统和装置,包括在计算机存储介质上编码的计算机程序,用于选择由强化学习代理要执行的动作。该方法包括获得表征环境的当前状态的观察。对于神经网络的每个噪声层的每个层参数确定相应的噪声值。对于每个噪声层的每个层参数,从层参数的当前值、相...
  • 方法、系统和装置,包括在计算机存储介质上编码的计算机程序,用于生成例如图像的预测的观察的序列。在一个方面,一种系统,包括控制器循环神经网络和解码器神经网络,以处理潜变量集合以生成观察。外部存储器和存储器接口子系统被配置为,对于多个时间步...
  • 用于数据高效的强化学习的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。所述系统之一是一种用于训练行动者神经网络的系统,所述行动者神经网络用于选择要由通过接收表征环境的状态的观察并且响应于每个观察执行从可能的动作的连续空间选择...
  • 用于从输入序列生成目标序列的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。一方面,该方法包括维护当前假设的集合,其中每个当前假设包括输入前缀和输出前缀。对于输入前缀和输出前缀长度的每个可能的组合,该方法扩展任何可以达到可能的...
  • 一种方法包括维护多个动作中的每一个的相应的情节存储器数据;接收表征代理正在与之交互的环境的当前状态的当前观察;根据嵌入神经网络的参数的当前值,使用嵌入神经网络处理当前观察以生成当前观察的当前键嵌入;对于多个动作中的每个动作:根据距离度量...
  • 用于训练动作选择神经网络的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。所述方法的一种包括维持回放存储器,该回放存储器存储由于代理与环境的交互而生成的轨迹;并且训练具有关于回放存储器中的轨迹的策略参数的动作选择神经网络,其中...
  • 用于图像渲染的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。在一个方面,一种方法包括接收表征特定场景的多个观察,每个观察包括特定场景的图像和识别捕获图像的相机的位置的数据。在另一方面,该方法包括接收表征特定视频的多个观察,每...
  • 用于环境模拟的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。在一个方面,一种系统包括递归神经网络,该递归神经网络被配置为在多个时间步骤中的每个处:接收先前的时间步骤的先前的动作,使用先前的动作从先前的时间步骤更新递归神经网络...
  • 包括在计算机存储介质上编码的计算机程序的用于训练强化学习系统的方法、系统和装置。该方法包括:训练动作选择策略神经网络,并且在动作选择神经网络的训练期间,训练一个或多个辅助控制神经网络和奖励预测神经网络。辅助控制神经网络中的每个辅助控制神...
  • 本公开提供了方法、系统和装置,其包括在计算机存储介质上编码的计算机程序,所述计算机程序用于预测与环境有关的结果。在一个方面,一种系统包括状态表示神经网络,被配置为接收表征与代理交互的环境的状态的观察,并处理该观察以生成环境状态的内部状态...
  • 用于训练强化学习系统的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。在一个方面,训练动作选择策略神经网络以用于选择要由导航经过环境以实现一个或多个目标的代理执行的动作的方法包括:接收表征环境的当前状态的观察图像;使用动作选择...
  • 一种系统包括由一个或多个计算机实现的神经网络系统。神经网络系统被配置为接收表征机器人智能体与之交互以执行机器人任务的现实世界环境的当前状态的观察,并处理所述观察以生成限定由所述机器人智能体响应于所述观察而执行的动作的策略输出。神经网络系...
  • 用于神经机器翻译的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。在一个方面,系统被配置为接收表示源自然语言中的单词的源序列的源嵌套的输入序列,并且生成表示单词的目标序列的目标嵌套的输出序列,所述单词的目标序列为所述源序列到目...
  • 一种生成具有N像素×N像素的输出分辨率的输出图像的方法,输出图像中的每个像素具有多个颜色通道中的每一个的相应颜色值,该方法包括:获得输出图像的低分辨率版本;通过重复执行以下操作,升级输出图像的低分辨率版本以生成具有输出分辨率的输出图像:...
  • 用于使用神经网络来生成视频帧的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。所述方法中的一个包括:使用编码器神经网络处理视频帧序列以生成编码表示;并且根据像素顺序和通道顺序逐个像素地生成预测的下一帧,包括:对于每个像素的每个...
  • 本申请涉及具有记忆的低通递归神经网络系统,包括:用于接收表示观察的序列的输入矢量的序列的输入;记忆结构,耦合到该输入以接收输入矢量的表示并将其存储为存储的数据;以及一个或多个输出层,耦合到所述记忆结构以读取并处理所述存储的数据以提供输出...
  • 用于生成从输入序列生成神经网络输出的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。其中一种方法包括,对于输入中的每一个,将包括输入序列中的该输入和该输入之前的输入的当前输入序列提供给包括多个扩张卷积神经网络层的卷积子网络,其...
  • 提供了任务的强化和模仿学习。一种用于控制代理在真实世界环境中执行任务的神经网络控制系统基于图像数据和描述所述代理的配置的本体感受数据来操作。所述控制系统的训练包括使用从所述任务的先前执行生成的数据集的模仿学习以及基于从由所述控制系统输出...
  • 一种训练具有多个参数的机器学习模型的方法,其中该机器学习模型已经在第一机器学习任务上进行训练以确定该机器学习模型的参数的第一值。该方法包括:对于每一个参数,确定参数对机器学习模型在第一机器学习任务上实现可接受性能的重要性的相应度量;获得...
  • 用于使用强化学习利用外部存储器增强神经网络的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。一种方法包括提供从神经网络输出的系统输出部分取得的输出作为系统输出序列中的一个系统输出;根据该神经网络输出的强化学习部分从存储器访问过...