专利查询
首页
专利评估
登录
注册
渊慧科技有限公司专利技术
渊慧科技有限公司共有192项专利
使用优先化经验存储器训练神经网络制造技术
本申请涉及使用优先化经验存储器训练神经网络。公开了用于对用于选择由与环境交互的强化学习代理执行的动作的神经网络进行训练的方法、系统和装置。在一个方面中,一种方法包括维持重放存储器,其中所述重放存储器存储作为所述强化学习代理与所述环境交互...
渐进式神经网络制造技术
本公开涉及渐进式神经网络。用于执行机器学习任务序列的方法和系统。一种系统包括深度神经网络(DNN)序列,所述深度神经网络(DNN)序列包括:与第一机器学习任务对应的第一DNN,其中,所述第一DNN包括第一多个索引层,并且所述第一多个索引...
自回归地生成定义要由代理执行的动作的数据元素序列制造技术
包括在计算机存储介质上编码的计算机程序的方法、系统和装置,用于使用动作选择神经网络来选择要由代理执行以与环境交互的动作。在一个方面,一种方法包括,在时间步骤序列中的每个时间步骤:生成到所述当前时间步骤为止由代理在环境中执行的任务的状态的...
前馈生成式神经网络制造技术
公开了一种前馈生成式神经网络,该前馈生成式神经网络生成在单个神经网络推理中包括特殊类型的多个输出示例的输出示例。可选地,生成可以以上下文输入为条件。例如,前馈生成式神经网络可以生成语音波形,语音波形是以文本片段的语言特征为条件的输入文本...
通过开放式学习来训练智能体神经网络制造技术
用于训练智能体神经网络以用于控制智能体执行多个任务的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。方法之一包括维护指定一个或多个候选智能体神经网络的群体的群体数据;以及在一个或多个任务的相应集合上训练每个候选智能体神经网络以...
训练机器学习模型的方法、系统和计算机存储介质技术方案
用于训练机器学习模型的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。在一个方面,方法包括接收用于在多个任务上训练机器学习模型的训练数据,其中每个任务包括多批训练数据。根据当前任务选择策略选择任务。从所选任务中选择一批训练数据...
使用神经网络控制磁约束设备的磁场制造技术
用于生成控制信号的方法、系统和装置,包括编码在计算机存储介质上的计算机程序,控制信号用于控制磁场以将等离子体约束在磁约束设备的腔室中。方法之一包括,对于多个时间步长中的每一个,获得表征磁约束设备的腔室中的等离子体的当前状态的观察,使用等...
训练动作选择神经网络的方法技术
用于训练动作选择神经网络的方法、系统以及装置,包括在计算机存储介质上编码的计算机程序。方法之一包括:接收表征环境的当前状态的观察;通过执行从当前状态开始直到环境到达满足一个或多个终结准则的可能未来状态为止的环境的可能未来状态的先行搜索来...
加强学习系统技术方案
本公开提供了方法、系统和装置,其包括在计算机存储介质上编码的计算机程序,所述计算机程序用于预测与环境有关的结果。在一个方面,一种系统包括状态表示神经网络,被配置为接收表征与代理交互的环境的状态的观察,并处理该观察以生成环境状态的内部状态...
使用神经网络生成视频帧制造技术
本发明涉及使用神经网络生成视频帧。提供了用于使用神经网络来生成视频帧的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。所述方法中的一个包括:使用编码器神经网络处理视频帧序列以生成编码表示;并且根据像素顺序和通道顺序逐个像素地生...
增强对神经网络的基于群体的训练制造技术
用于训练神经网络以执行任务的方法、计算机系统和装置,包括编码在计算机存储介质上的计算机程序。该系统维护数据,该数据指定(i)多个候选神经网络和(ii)将该多个候选神经网络向多个分区的划分。该系统重复执行操作,该操作包括:训练每个候选神经...
一种计算机实现的方法及其系统技术方案
用于训练强化学习系统的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。在一个方面,训练动作选择策略神经网络以用于选择要由导航经过环境以实现一个或多个目标的代理执行的动作的方法包括:接收表征环境的当前状态的观察图像;使用动作选择...
使用分布式优先化回放的强化学习制造技术
方法、系统和装置,包括编码在计算机存储介质上的计算机程序,用于训练动作选择神经网络,该动作选择神经网络用于选择要由与环境交互的智能体执行的动作。该系统之一包括(i)多个行动者计算单元,其中每个行动者计算单元被配置为维护动作选择神经网络的...
使用神经网络的黑盒优化制造技术
本公开涉及使用神经网络的黑盒优化。用于确定机器学习训练过程的一个或多个过程参数的优化设置的方法和系统。方法中的一个包括:使用递归神经网络依照网络参数的第一值来处理当前网络输入以获得当前网络输出;获得使用由当前网络输出所定义的经更新的设置...
使用环境动态的连续潜在变量学习任务的多种技能制造技术
本说明书涉及用于控制代理以根据包括一系列局部目标
通过凸马尔可夫决策过程的求解的强化学习制造技术
使用策略模型神经网络来选择智能体在环境中的动作,所述策略模型神经网络实现策略模型,所述策略模型针对由策略模型神经网络接收的观察表征的环境的任何观察状态来定义智能体能够执行的可能动作集合上的状态
使用空间和时间上的注意力对来自视频序列的对象表示的无监督学习制造技术
一种计算机实现的视频生成神经网络系统,被配置为通过从对象潜在变量的相应先验对象潜在分布中进行采样来确定一组对象潜在变量中的每一个的值
通过查询嵌入在潜在嵌入集上的交叉注意力来生成神经网络输出制造技术
用于使用神经网络生成网络输出的方法
使用去噪目标训练示图神经网络制造技术
用于训练包括一个或多个示图神经网络层的神经网络的方法
使用加权策略投影的多目标强化学习制造技术
本发明公开了用于训练行动选择策略神经网络以选择将由代理执行的行动以控制代理执行任务的计算机实现的系统和方法
1
2
3
4
5
6
7
8
>>
尾页
科研机构数量排行前10
华为技术有限公司
109494
珠海格力电器股份有限公司
85385
中国石油化工股份有限公司
69585
浙江大学
66514
中兴通讯股份有限公司
62015
三星电子株式会社
60314
国家电网公司
59735
清华大学
47308
腾讯科技深圳有限公司
44998
华南理工大学
44090
最新更新发明人
胜利油田胜机石油装备有限公司
278
江苏宜兴德融科技有限公司
53
重庆赛力斯新能源汽车设计院有限公司
948
齐鲁工业大学山东省科学院
998
中国农业大学
13343
中国石油化工股份有限公司
69586
苏州时盛塑业有限公司
2
华能澜沧江水电股份有限公司
1904
上海绿泽生物科技有限责任公司
38
中国能源建设集团浙江省电力设计院有限公司
261