分子生成方法、模型构建方法、装置、设备及存储介质制造方法及图纸

技术编号:34269727 阅读:75 留言:0更新日期:2022-07-24 15:44
本申请涉及一种分子生成方法、模型构建方法、装置、设备及存储介质,该方法包括:获取药效团特征矢量;利用预设模型的第一子模型对药效团特征矢量进行处理,得到目标构象矢量;利用预设模型的第二子模型对目标构象矢量进行压缩处理,得到压缩矢量;利用预设模型的第三子模型对压缩矢量进行处理,得到候选分子。本申请的技术方案,能够生成更可靠的分子,有助于提高药物分子设计的成功率。于提高药物分子设计的成功率。于提高药物分子设计的成功率。

Molecular generation method, model construction method, device, equipment and storage medium

【技术实现步骤摘要】
分子生成方法、模型构建方法、装置、设备及存储介质


[0001]本申请涉及计算化学
,特别涉及一种分子生成方法、模型构建方法、装置、设备及存储介质。

技术介绍

[0002]目前的分子生成方法大多基于分子的一维SMILES序列和二维结构片段,基于上述分子生成的药物设计成功率较低。且现有的分子生成药物设计受限于药物化学家的经验和想象空间,往往难以设计出大量的结构新颖的药物分子,设计过程自动化程度不高,效率低下。

技术实现思路

[0003]为解决或部分解决相关技术中存在的问题,本申请提供一种分子生成方法、模型构建方法、装置、设备及存储介质,能够生成更可靠的分子,有助于提高药物分子设计的成功率。
[0004]本申请第一方面提供一种分子生成方法,包括:
[0005]获取药效团特征矢量;
[0006]利用预设模型的第一子模型对所述药效团特征矢量进行处理,得到目标构象矢量;
[0007]利用所述预设模型的第二子模型对所述目标构象矢量进行压缩处理,得到压缩矢量;
[0008]利用所述预设模型的第三子模本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种分子生成方法,其特征在于,包括:获取药效团特征矢量;利用预设模型的第一子模型对所述药效团特征矢量进行处理,得到目标构象矢量;利用所述预设模型的第二子模型对所述目标构象矢量进行压缩处理,得到压缩矢量;利用所述预设模型的第三子模型对所述压缩矢量进行处理,得到候选分子。2.根据权利要求1所述的方法,其特征在于,所述利用预设模型的第一子模型对所述药效团特征矢量进行处理,得到构象矢量,包括:利用预设模型的第一子模型随机生成隐变量;利用所述第一子模型对所述隐变量和所述药效团特征矢量进行解码,得到目标构象矢量。3.根据权利要求1所述的方法,其特征在于,所述获取药效团特征矢量,包括:获取目标分子的药效团;根据所述药效团生成药效团特征矢量。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:获取所述目标分子的三维构象;根据所述三维构象生成初始构象矢量;所述利用预设模型的第一子模型对所述药效团特征矢量进行处理,得到目标构象矢量,包括:利用预设模型的第一子模型对所述初始构象矢量和所述药效团特征矢量进行处理,得到目标构象矢量。5.根据权利要求4所述的方法,其特征在于,所述根据所述三维构象生成初始构象矢量,包括:根据所述三维构象,提取所述目标分子中的每个原子的特征信息;将所述三维构象放置于均匀分布有若干个格点的立方体内,利用每个原子的特征信息对各格点进行赋值,得到各格点的数值,并根据各格点的数值确定初始构象矢量。6.根据权利要求5所述的方法,其特征在于,所述立方体为边长为N埃的正方体,每个格点的边长为1埃,提取的每个原子的特征信息为M种,所述N为大于所述目标分子的最大长度的正整数,所述M为大于等于1的正整数;所述利用每个原子的特征信息对各格点进行赋值,得到各格点的数值,并根据各格点的数值确定初始构象矢量,包括:利用每个原子的各种特征信息分别对各格点进行赋值,得到每种特征信息下的各格点的数值;利用每种特征信息下的各格点的数值,生成N3*M维的初始构象矢量。7.根据权利要求6所述的方法,其特征在于,所述根据所述药效团生成药效团特征矢量,包括:根据所述药效团,提取所述目标分子的K种药效团特征信息,所述K为大于等于1的正整数;利用每种药效团特征信息分别对各格点进行重新赋值,得到每种药效团特征信息下的各格点的数值;
利用每种药效团特征信息下的各格点的数值,生成N3*K维的药效团特征矢量。8.根据权利要求4

7任一所述的方法,其特征在于,所述利用预设模型的第一子模型对所述初始构象矢量和所述药效团特征矢量进行处理,得到目标构象矢量,包括:利用预设模型的第一子模型对所述初始构象矢量进行编码,得到隐变量;利用所述第一子模型对所述隐变量和所述药效团特征矢量进行解码,得到目标构象矢量。9.根据权利要求8所述的方法,其特征在于,所述第一子模型为对变分自编码器进行训练得到,所述利用预设模型的第一子模型对所述初始构象矢量进行编码,得到隐变量,包括:将所述初始构象矢量输入已训练好的变分自编码器,通过所述变分自编码器的Q个第一神经层,利用卷积操作和线性变换,编码得到隐变量,所述Q为大于等于3的正整数;所述利用所述第一子模型对所述隐变量和所述药效团特征矢量进行解码,得到目标构象矢量,包括:将所述隐变量通过所述变分自编码器的Q个第二神经层,并按照Q个所述第二神经层的排列位置,在第q个所述第二神经层中导入所述药效团特征矢量,解码得到目标构象矢量,所述q大于1且小于Q。10.根据权利要求8所述的方法,其特征在于,所述利用预设模型的第一子模型对所述初始构象矢量进行编码,得到隐变量之后,所述方法还包括:对所述隐变量进行更新处理,得到新的隐变量;所述利用所述第一子模型对所述隐变量和所述药效团特征矢量进行解码,得到目标构象矢量,包括:利用所述第一子模型对所述新的隐变量和所述药效团特征矢量进行解码,得到目标构象矢量。11.根据权利要求10所述的方法,其特征在于,所述对所述隐变量进行更新处理,得到新的隐变量,包括:利用预设扰动值对所述隐变量进行微扰,得到新的隐变量。12.根据权利要求11所述的方法,其特征在于,所述隐变量包括矢量和所述n为所述隐变量的维度;所述利用预设扰动值对所述隐变量进行微扰,得到新的隐变量,包括:对所述隐变量的每一个维度μ
i
,建立以所述μ
i
为平均值,以λ*σ
i
为标准差的正态分布,从所述正态分布中选取一个点,作为所述μ
i
微扰后的值,记为μ

i
,其中,所述i的取值为1~n,所述λ为预设扰动值;将和构成新的隐变量。13.根据权利要求10所述的方法,其特征在于,所述目标分子有多个,所述对所述隐变量进行更新处理,得到新的隐变量,包括:确定每个所述目标分子的隐变量在所处隐层空间中的坐标;根据每个所述隐变量对应的坐标,计算得到中点坐标;利用预设规则在每个所述隐变量对应的坐标与所述中点...

【专利技术属性】
技术研发人员:郑莲君范方达李远鹏王纵虎
申请(专利权)人:北京晶泰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1