System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于分子片段化学空间解构的分子定向智能生成方法技术_技高网
当前位置: 首页 > 专利查询>重庆大学专利>正文

一种基于分子片段化学空间解构的分子定向智能生成方法技术

技术编号:40966288 阅读:3 留言:0更新日期:2024-04-18 20:46
本发明专利技术涉及一种基于分子片段化学空间解构的分子定向智能生成方法,根据分子生成任务需求建立分子性能评估模型,对已有分子数据库进行评估,筛选出其中性能较为优异的分子组成初始优异分子集合;利用BRICS技术将集合中的分子拆分为骨架集和装饰物集,然后基于集合中的分子结构碎片进行重组,生成新分子结构,对新分子进行评估、筛选,得到基于分子重组生成的第一代优异分子库Gen‑MR;将Gen‑MR中的分子继续拆分为新的骨架集和装饰物集,借助训练好的化学空间模型从原始碎片库快速定位每个保留碎片的相似物,从而扩充新碎片集合,并继续组装骨架‑装饰物,同样地对分子进行评估、筛选,得到基于化学空间搜索生成的优异分子库。

【技术实现步骤摘要】

本专利技术涉及小分子设计开发领域,特别涉及一种基于分子片段化学空间解构的分子定向智能生成方法


技术介绍

1、分子设计是搜寻符合需求的分子结构在广袤的化学空间上,其大概包含了1060个可能的类药分子。因此,在未来短期时间内,对化学空间进行穷尽的遍历搜寻是不实际的。另一方面,现实应用要求设计出来的目标分子具备诸多特性,这增大了在化学空间上搜索的难度。近年来,随着人工智能(ai)技术的涌入,分子设计得到了迅速发展。其在人力、资源和时间成本的降低上,展现出了巨大的工业应用潜力,因而广泛应用于新药研发、材料设计和化学合成等领域中。

2、ai辅助的分子设计可以分为(ⅰ)无梯度的分子优化(gradient free)和(ⅱ)基于梯度的分子优化(gradient based),二者现有技术均存在问题:

3、无梯度的分子优化通过元启发式方法使用基于群体的随机优化程序来导航化学空间,在原子或者碎片的基础上组装新分子。但这类基于随机优化方法容易面临问题:组合爆炸风险;生成的目标分子集合往往会陷入局部最优,无法实现化学空间的全域探索;在有潜力的局部化学空间上也会挖掘不充分。

4、基于梯度的分子优化通过深度神经网络(包括变异自动编码器(vaes)、生成对抗网络(gans)和循环神经网络(rnns))来训练生成模型,根据优化过程(如贝叶斯优化(bo)或强化学习(rl))的导航,从所学的化学空间中抽取分子作为生成的新分子。基于梯度的分子优化已被广泛采用,但仍然存在一些问题:由于深度学习的黑箱特性,使得其在化学空间上的搜寻过程不透明、解释性差;并且深度学习对于分子结构矩阵化表征,对应的化学空间也是难以理解和表达的高维度空间;模型复杂度高,每次训练费时。


技术实现思路

1、针对现有技术存在的上述问题,本专利技术要解决的技术问题是:本专利技术结合了所提出的分子碎片化学空间表征模型和改进的分子结构“拆解-重组”算法,开发了一个轻便高效的智能分子定向生成框架(som-molgen),以实现对化学空间的快速、精准、深度的搜索,同时保持优化过程的可视化和可解释性。

2、为解决上述技术问题,本专利技术采用如下技术方案:一种基于分子片段化学空间解构的分子定向智能生成方法,包括如下步骤:

3、s1:采集有机物分子,对采集的数据进行预处理剔除无效分子,形成可用分子结构数据库,对可用分子结构数据库中的分子使用给定药物潜力评价指标idp进行评价,将idp大于阈值的分子作为初始优异分子集群gen0,利用brics拆分方法将gen0中的分子拆分碎片,所有碎片中的大碎片构成骨架集,所有碎片中的小碎片构成装饰物集。

4、s2:基于骨架集和饰物集中所有碎片进行重组生成新分子结构,对所有新分子结构使用给定药物潜力评价指标idp进行评估、筛选出idp大于预设值的分子结构作为第一代优异分子库gen-mr。

5、将所有碎片输入训练好的som得到聚类后的若干分子骨架子空间和若干装饰物子空间。

6、s3:利用brics拆分方法将gen-mr中的分子拆分为新碎片,所有新碎片中的新大碎片构成新骨架集,所有碎片中的新小碎片构成新装饰物集,将所有新碎片输入训练好的som得到聚类后的若干新分子骨架子空间和若干新装饰物子空间。

7、随机选择一个新分子骨架子空间中的一新大碎片,搜索若干分子骨架子空间,将与新大碎片的相似大碎放入该新大碎片的新分子骨架子空间中,遍历所有新分子骨架子空间中的每个新大碎片,得到若干最新分子骨架子空间;采用与得到若干最新分子骨架子空间相同的方法得到若干最新装饰物子空间。

8、s4:基于最新分子骨架子空间和最新装饰物子空间中所有最新碎片进行重组生成最新分子结构,对所有最新分子结构使用idp进行评估、筛选出idp大于预设值的最新分子结构作为优异分子库gen-css。

9、作为优选,所述s2中训练好的som,计算s1得到的骨架集和装饰物集中的碎片topological分子指纹,然后使用topological分子指纹对自组织映射神经网络som进行训练,当som损失的不再下降时得到训练好的som。

10、作为优选,所述s2中topological分子指纹的计算方法为:

11、首先,使用氢原子进行补齐s1中brics方法得到的碎片断点,形成满足八隅体规则的分子碎片,然后利用rdkit化学信息工具包分别计算骨架集和装饰物集中碎片对应的topological分子指纹。

12、作为优选,所述s4基于最新分子骨架子空间和最新装饰物子空间中所有最新碎片进行重组生成最新分子结构的过程如下:

13、s4-1:以最新分子骨架子空间中第j个最新大碎片作为第j个骨架,并以该骨架为主体,统计第j个骨架的不同连接节点数量。

14、s4-2:判断第j个骨架中连接点的数量fr,如果fr>2,则执行s4-3,否则执行s4-4。

15、s4-3:不放回地随机从最新装饰物子空间中抽取第k个最新小碎片,在第j个骨架中随机选择第t个连接点与第k个最新小碎片进行重组,未重组的连接点用氢原子补齐,生成一个新分子结构。t遍历第j个骨架的所有连接点,分别与第k个最新小碎片进行重组,未重组的连接点用氢原子补齐,生成与骨架连接点数量相同的分子结构,检验所得所有新分子结构的正确性。

16、计算判定为正确的新分子结构的idp,如果新分子结构的idp大于第j个骨架的idp,则将该新分子结构中的最新小碎片添加到潜力装饰物组中。

17、s4-4:通过枚举将第j个骨架与最新装饰物子空间中的所有最新小碎片进行重组,得到若干新分子结构,检验所得所有新分子结构的正确性。

18、计算判定为正确的新分子结构的idp,如果新分子结构的idp大于第j个骨架的idp,则将该新分子结构中的最新小碎片添加到潜力装饰物组中。

19、s4-5:j遍历最新分子骨架子空间中的所有最新大碎片,对每一个j返回s4-2,筛选得到最终的潜力装饰物组。

20、s4-6:将最新分子骨架子空间中骨架和潜力装饰物组枚举组合,生成最终分子。

21、从最新分子骨架子空间选择第j'个骨架,判断第j'个骨架中连接点的数量fr':

22、如果fr'>2则执行:

23、不放回地随机从潜力装饰物组中选择第k'个潜力装饰物碎片,在第j'个骨架中随机选择第t'个连接点与第k'个最新小碎片进行重组,未重组的连接点用氢原子补齐,生成一个最新分子结构。t'遍历第j'个骨架的所有连接点,分别与第k'个最新小碎片进行重组,未重组的连接点用氢原子补齐,生成与骨架连接点数量相同的新分子结构。

24、如果fr'≤2则执行:

25、枚举将第j'个骨架与潜力装饰物组中的所有潜力装饰物碎片进行重组,得到若干最新分子结构。

26、所有最新分子结构构成最终分子结构集。

27、作为优选,所述给定药物潜力评价指本文档来自技高网...

【技术保护点】

1.一种基于分子片段化学空间解构的分子定向智能生成方法,其特征在于:包括如下步骤:

2.如权利要求1所述的一种基于分子片段化学空间解构的分子定向智能生成方法,其特征在于:所述S2中训练好的SOM,计算S1得到的骨架集和装饰物集中的碎片Topological分子指纹,然后使用Topological分子指纹对自组织映射神经网络SOM进行训练,当SOM损失的不再下降时得到训练好的SOM。

3.如权利要求2所述的一种基于分子片段化学空间解构的分子定向智能生成方法,其特征在于:所述S2中Topological分子指纹的计算方法为:

4.如权利要求2所述的一种基于分子片段化学空间解构的分子定向智能生成方法,其特征在于:所述S4基于最新分子骨架子空间和最新装饰物子空间中所有最新碎片进行重组生成最新分子结构的过程如下:

5.如权利要求4所述的一种基于分子片段化学空间解构的分子定向智能生成方法,其特征在于:所述给定药物潜力评价指标IDP的计算步骤包括:

【技术特征摘要】

1.一种基于分子片段化学空间解构的分子定向智能生成方法,其特征在于:包括如下步骤:

2.如权利要求1所述的一种基于分子片段化学空间解构的分子定向智能生成方法,其特征在于:所述s2中训练好的som,计算s1得到的骨架集和装饰物集中的碎片topological分子指纹,然后使用topological分子指纹对自组织映射神经网络som进行训练,当som损失的不再下降时得到训练好的som。

3.如权利要求2所述的一种基于分子片段...

【专利技术属性】
技术研发人员:申威峰文华强邓向辉常承林金赛蒙
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1