使用具有可学习张量列诱导的先验的变分自动编码器的子集条件化制造技术

技术编号：29034730 阅读：19 留言：0更新日期：2021-06-26 05:41

所提出的模型是一种具有用张量列进行参数化的可学习先验的变分自动编码器VAE

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用具有可学习张量列诱导的先验的变分自动编码器的子集条件化
[0001]相关申请的交叉引用
[0002]本申请要求于2018年9月18日提交的题为“使用具有可学习张量列诱导的先验的变分自动编码器的子集条件化(SUBSET CONDITIONING USING VARIATIONAL AUTOENCODER WITH A LEARNABLE TENSOR TRAIN INDUCED PRIOR)”的美国专利申请第16/134,624号的优先权，其通过引用整体并入本文。

技术介绍

[0003]深度神经网络(DNN)是最近为复杂数据处理和人工智能(AI)创建的计算机系统架构。DNN是机器学习模型，其采用多于一个隐藏层的非线性计算单元来预测接收输入集合的输出。DNN可以出于各种目的以各种配置提供，并且将继续对其进行开发以改善性能和预测能力。
[0004]将是有利的是，具有一种用于使用一或多个DNN生成满足条件的对象的计算机方法，其中一些条件可以是已知的，并且其中一些条件可以不是已知的。

技术实现思路

[0005]在一些实施例中，提供了一种用于训练模型以生成对象的方法。所述方法可以包含以下步骤：提供模型，所述模型被配置为具有张量列的变分自动编码器；提供数据集，所述数据集具有对象的对象数据和所述对象的性质的性质数据；用所述模型的对象编码器处理所述数据集的所述对象数据以获得潜对象数据，其中所述潜对象数据包含具有平均值和方差的潜变量分布；从所获得的潜变量分布采样一或多个潜变量；处理所采样的具有限定对象性质的一或多个潜变...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于训练模型以生成对象的方法，所述方法包括：提供模型，所述模型被配置为具有张量列诱导的可学习先验的变分自动编码器；提供数据集，所述数据集具有对象的对象数据和所述对象的性质的性质数据；用所述模型的对象编码器处理所述数据集的所述对象数据以获得潜对象数据，其中所述潜对象数据包含具有平均值和方差的潜变量分布；从所获得的潜变量分布采样一或多个潜变量；处理所采样的具有限定对象性质的一或多个潜变量，以计算具有所述限定对象性质的所述样本的概率；通过对象解码器处理所采样的一或多个潜变量以获得重构对象；根据所述对象数据确定所述重构对象相较于原始对象的重构损失；根据具有所述限定对象性质的所述样本的概率计算库尔贝克
‑
莱布勒散度；使用所确定的重构损失和所计算的库尔贝克
‑
莱布勒散度计算相较于所述数据集的损失；进行梯度下降，直到所述重构对象足够代表所述原始对象并具有所述限定对象性质；获得经训练的模型，所述经训练的模型被配置为具有用所述张量列进行参数化的可学习先验的经训练的变分自动编码器；和提供所述经训练的模型。2.根据权利要求1所述的方法，其进一步包括对于所述数据集中的多个对象：用所述对象编码器处理对象数据以获得潜变量分布；从所获得的潜变量分布采样一或多个潜变量；用解码器处理所采样的一或多个潜变量以获得所述重构对象；获得所采样的一或多个潜变量具有限定性质的概率的对数；计算所获得的潜变量分布的熵；计算所述概率对数的对数，以获得所获得的对数概率；用所述熵减去所获得的对数概率，以获得所述库尔贝克
‑
莱布勒散度的近似值；用所述概率的对数减去所述库尔贝克
‑
莱布勒散度的近似值；和获得变分干扰的估计下限目标。3.根据权利要求2所述的方法，其进一步包括：首先，计算所述数据集的所有对象上的所有估计下限目标的平均值；和其次，进行所述梯度下降。4.根据权利要求1所述的方法，其进一步包括：为所述对象限定一或多个条件；和允许所述对象的一或多个未限定条件具有任意初始值。5.根据权利要求1所述的方法，其中所述计算具有所述限定对象性质的所述样本的概率包含：用张量列分布计算所述对象的对象性质的概率；用张量列分布计算对象性质和所述潜代码的概率；和通过条件概率公式计算以对象性质为条件的所述潜代码的概率。6.根据权利要求1所述的方法，其中所述用张量列分布计算对象性质和所述潜代码的
概率包含：将缓冲区设置为单位(眼)矩阵；确定所述对象性质是离散的还是连续的或未限定的；当所述对象性质是离散的时，沿中间指数计算与onehot(y
j
)的点积，其中y
j
是所述对象性质；当所述对象性质是连续的时，沿中间指数计算与[N(y
j
|mu
i
,std
i
)，针对所有i]的点积，其中mu
i
是i的平均值，并且std
i
是沿第j个潜分量的混合的第i个正态分量的标准偏差；当缺少所述对象性质时，沿所述中间指数计算与(1,1,
…
,1)的点积(进行边缘化)，根据所获得的矩阵，得出与所述缓冲区的所述点积以获得新缓冲区；和如果处理了所有分量，则计算新缓冲区的迹并将所述迹设置为(y1,
…
,y
n
)的概率。7.根据权利要求1所述的方法，其进一步包括用增强学习进一步训练所述经训练的模型，其中所述增强学习产生具有限定特性的所述重构对象。8.根据权利要求7所述的方法，其中所述用所述增强学习训练所述经训练的模型包含：丢弃所述对象编码器；固定除所述对象解码器的第一层以外的所述对象解码器的所有层的权重；进行以下步骤直到收敛：估计先前获得的潜变量分布的每个维度的平均值和方差，所述先前获得的潜变量分布限定为可学习先验；从可学习先验产生的所述潜变量之外获得每个维度的探索潜变量；将所述探索潜变量通过所述解码器，以基于所述探索潜变量获得重构对象；基于至少一个限定回报计算所述重构对象的回报；和应用单个梯度上升步骤，以最大化相对于所学习的先验的参数和所述解码器的第一层的总回报。9.根据权利要求8所述的方法，当所述对象是分子时，所述回报包含：一般生物活性自组织科霍宁映射，其为作为具有生物途径中的生物活性的分子的重构对象提供回报；特定生物活性自组织科霍宁映射，其为作为与特定生物物质具有生物活性的分子的重构对象提供回报；和趋势自组织科霍宁映射，其为作为具有在限定时间框架内退化的化学基序的分子的重构对象提供回报。10.根据权利要求9所述的方法，其中：其中所述一般生物活性自组织科霍宁映射，其为作...

【专利技术属性】
技术研发人员：A，
申请(专利权)人：英科智能有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人