当前位置: 首页 > 专利查询>梁燕专利>正文

目标分子的获得方法技术

技术编号：38368290 阅读：10 留言：0更新日期：2023-08-05 17:33

本公开提供一种目标分子的获得方法，其包括：取出SMILES中的不重复字符与填充字符一起作为字符集，将SMILES中的每一个字符以及该字符的前后文分别作为标签和训练数据，输入词嵌入模型得到每种字符的词向量，以获得训练数据集；通过训练数据集对待训练的神经网络模型进行训练，得到VecVAE模型；将诱导分子的词向量输入VecVAE模型，获得重构后词向量；采用相似性度量的方法获得与重构后的向量最相似的词向量，将最相似的词向量对应的字符作为解码字符；以及将该解码字符输入词嵌入模型获得目标分子。分子。分子。

全部详细技术资料下载

【技术实现步骤摘要】
目标分子的获得方法

[0001]本公开涉及一种目标分子的获得方法。

技术介绍

[0002]新分子设计对新技术的发展有着至关重要的作用，它代表了一个国家的工业和科技水平。在药物发现与清洁能源等领域，传统的分子设计方法是一个类似于“炒菜”的试错过程，它耗时耗能且效率相对低下。
[0003]近年来，以深度生成模型为基础的分子设计工作得到了快速发展。
[0004]2016年，Rafael Gomez
‑
Bombarelli等人提出了一种逆向分子设计方法Character VAE(CVAE)，CVAE将VAE(Variational Auto
‑
Encoder)与多层感知机(Multilayer Perceptron,MLP)联合训练，构造一个依据属性值分层的隐藏空间，并在隐藏空间中进行优化，找到符合预期属性值的分子。但CVAE面临解码有效性较低的问题。因此，2017年Matt J.Kusner等人提出了将SMILES语法融入VAE的GVAE(Grammar Variational Auto
‑
Encoder)方法，GVAE将SMILES语法知识加入数据预处理过程中，提取出了更合理的数据特征。2018年Hanjun Dai[48]等人提出在VAE中加入语义验证器的SD
‑
VAE(Syntax
‑
Directed Variational Auto
‑
Encoder)方法，SD
‑
VAE通过

【技术保护点】

【技术特征摘要】
1.一种目标分子的获得方法，其特征在于，包括：取出SMILES中的不重复字符与填充字符一起作为字符集，将SMILES中的每一个字符以及该字符的前后文分别作为标签和训练数据，输入词嵌入模型得到每种字符的词向量，以获得训练数据集；通过训练数据集对待训练的神经网络模型进行训练，得到VecVAE模型；将诱导分子的词向量输入VecVAE模型，获得重构后词向量；采用相似性度量的方法获得与重构后的向量最相似的词向量，将最相似的词向量对应的字符作为解码字符；以及将该解码字符输入词嵌入模型获得目标分子。2.如权利要求1所述的目标分子的获得方法，其特征在于，所述词嵌入模型包括Word2Vec模型或者GloVe模型。3.如权利要求1所述的目标分子的获得方法，其特征在于，所述VecVAE模型包括：编码器：所述编码器将输入数据通过多层神...

【专利技术属性】
技术研发人员：梁燕，谭胖，
申请(专利权)人：梁燕，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人