解离常数的预测方法、装置及存储介质制造方法及图纸

技术编号:36327299 阅读:15 留言:0更新日期:2023-01-14 17:35
本公开涉及解离常数的预测方法、装置及存储介质,该方法包括:构建分子的分子图;对所述分子图进行初始化,得到所述分子图的初始特征;基于所述初始特征,获取初始化后的分子图中原子的特征;将所述原子的特征输入预设的微观预测模型中,预测所述原子的微观解离常数。本公开实施例提供的解离常数的预测方法、装置及存储介质,通过构建分子的分子图,并在对分子图进行初始化后通过原子间的信息传递,获取原子的特征,基于该原子的特征利用预设的pK

【技术实现步骤摘要】
解离常数的预测方法、装置及存储介质


[0001]本公开涉及计算化学
,具体涉及一种解离常数的预测方法、装置及存储介质。

技术介绍

[0002]解离常数(pK
a
)是一个平衡常数,定义为化合物质子化和脱质子化形式之比的负对数,是描述物质离子化能力的关键参数。据报道,约三分之二的市售药物在水溶液中至少含有一个可电离基团。因此,在设计新药时,pK
a
是一个重要的理化性质,它对药物的生物活性、ADMET(吸收、分布、代谢、排泄和毒性)性质以及其它性质有着深远的影响。除了制药业,pK
a
还与环境生态学、农业和化学工业相关。因此,从化合物的结构中快速准确地预测其pK
a
值具有重要意义。
[0003]许多机器学习模型曾被用于pK
a
的预测,比如支持向量机、随机森林、人工神经网络和极端梯度提升等。但这些机器学习模型都需要预先定义的分子指纹和描述符,而到目前为止,哪种分子指纹和描述符最适合预测化合物的pK
a
仍然存在很大的争议。
[0004]此外,由于微观pK
a
的测定非常困难,目前可获得的pK
a
数据基本上都是宏观pK
a
数据。基于这些数据训练的常规的机器学习模型,也只能预测分子的宏观pK
a
,而无法预测出各原子的微观pK
a
。一种常用的获得微观pK
a
数据的策略是将分子的宏观pK
a/>值赋给其最主要的电离位点,并将其作为微观pK
a
值的近似值。但这一策略存在两个重要问题:(1)对于丙烷

1,2,3

三胺等,存在多个电离能力相近的位点的分子,这种近似处理可能会带来较大误差;(2)主要电离位点的选择是一个耗时的过程,需要丰富的专家知识,而且在许多情况下,宏观pK
a
值并不能明确地分配给某一个主要的电离位点。

技术实现思路

[0005]鉴于现有技术存在的上述问题,本公开的目的在于提供一种解离常数的预测方法、装置及存储介质,能够有效解决原子的微观pK
a
难以直接预测的问题。
[0006]为了实现上述目的,本公开提供一种解离常数的预测方法,包括:
[0007]构建分子的分子图;
[0008]对所述分子图进行初始化,得到所述分子图的初始特征;
[0009]基于所述初始特征,获取初始化后的分子图中原子的特征;
[0010]将所述原子的特征输入预设的微观预测模型中,预测所述原子的微观解离常数。
[0011]进一步地,所述方法还包括:
[0012]基于预测得到的所述原子的微观解离常数,计算得到所述分子的宏观解离常数。
[0013]可选地,对所述分子图进行初始化,得到所述分子图的初始特征,包括:
[0014]获取所述分子图中的点特征、边特征以及连接特征,其中,所述点特征表示所述分子中原子的特征,所述边特征表示所述分子中化学键的特征,所述连接特征表示不同的点特征之间以及点特征和边特征之间的连接关系。
[0015]可选地,基于所述初始特征,获取初始化后的分子图中原子的特征,包括:
[0016]将所述初始化后的分子图输入神经网络层中,通过原子间的信息传递对所述初始特征进行优化,得到所述分子中每个原子的特征。
[0017]可选地,将所述原子的特征输入预设的微观预测模型中,预测所述原子的微观解离常数,包括:
[0018]将所述原子的特征输入全连接神经网络层中,输出每个所述原子的微观解离常数;
[0019]通过掩膜处理提取可电离的原子的微观解离常数。
[0020]可选地,所述输出每个所述原子的微观解离常数,包括:输出酸性微观解离常数和/或输出碱性微观解离常数;
[0021]其中:
[0022]输出酸性微观解离常数的方式为:
[0023]pK
a(acidic)i
=FC(X
i
)
[0024]其中,pK
a(acidic)i
表示原子A
i
的酸性微观解离常数,FC表示一个全连接神经网络层,X
i
表示原子A
i
的特征;
[0025]输出碱性微观解离常数的方式为:
[0026]pK
a(basic)i
=FC(X
i
)
[0027]其中,pK
a(basic)i
表示原子A
i
的碱性微观解离常数,FC表示一个全连接神经网络层,X
i
表示原子A
i
的特征;
[0028]通过掩膜处理提取可电离的原子的微观解离常数,包括:原子的酸性微观解离常数的掩膜处理和/或原子的碱性微观解离常数的掩膜处理;
[0029]其中:
[0030]所述原子的酸性微观解离常数的掩膜处理表示为:
[0031][0032]其中,P表示至少与一个氢原子相连的非碳原子,inf表示正无穷;
[0033]所述原子的碱性微观解离常数的掩膜处理表示为:
[0034][0035]其中,Q表示不带正电荷的氮原子,

inf表示负无穷。
[0036]可选地,基于预测得到的所述原子的微观解离常数,计算得到所述分子的宏观解离常数包括:
[0037]基于所述原子的酸性微观解离常数确定所述分子的宏观解离常数和/或基于所述原子的碱性微观解离常数确定所述分子的宏观解离常数;
[0038]其中:
[0039]基于所述原子的酸性微观解离常数确定所述分子的宏观解离常数表示为:
[0040][0041]其中,pK
a(acidic)
是分子最强酸的pK
a
值,pK
a(acidic)i
表示原子A
i
的酸性微观解离常数,N为分子中重原子的数目;
[0042]基于所述原子的碱性微观解离常数确定所述分子的宏观解离常数表示为:
[0043][0044]其中,pK
a(basic)
是分子最强碱的pK
a
值,pK
a(basic)i
表示原子A
i
的碱性微观解离常数,N为分子中重原子的数目。
[0045]可选地,所述方法还包括:
[0046]基于多示例学习对所述分子的宏观解离常数进行训练,预测所述分子中原子的微观解离常数。
[0047]根据本公开的方案之一,提供一种解离常数的预测装置,包括:
[0048]构建模块,配置为构建分子的分子图;
[0049]初始化模块,配置为对所述分子图进行初始化,得到所述分子图的初始特征;
[0050]获取模块,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种解离常数的预测方法,包括:构建分子的分子图;对所述分子图进行初始化,得到所述分子图的初始特征;基于所述初始特征,获取初始化后的分子图中原子的特征;将所述原子的特征输入预设的微观预测模型中,预测所述原子的微观解离常数。2.根据权利要求1所述的方法,其中,所述方法还包括:基于预测得到的所述原子的微观解离常数,计算得到所述分子的宏观解离常数。3.根据权利要求1所述的方法,其中,对所述分子图进行初始化,得到所述分子图的初始特征,包括:获取所述分子图中的点特征、边特征以及连接特征,其中,所述点特征表示所述分子中原子的特征,所述边特征表示所述分子中化学键的特征,所述连接特征表示不同的点特征之间以及点特征和边特征之间的连接关系。4.根据权利要求1所述的方法,其中,基于所述初始特征,获取初始化后的分子图中原子的特征,包括:将所述初始化后的分子图输入神经网络层中,通过原子间的信息传递对所述初始特征进行优化,得到所述分子中每个原子的特征。5.根据权利要求1所述的方法,其中,将所述原子的特征输入预设的微观预测模型中,预测所述原子的微观解离常数,包括:将所述原子的特征输入全连接神经网络层中,输出每个所述原子的微观解离常数;通过掩膜处理提取可电离的原子的微观解离常数。6.根据权利要求5所述的方法,其中,所述输出每个所述原子的微观解离常数,包括:输出酸性微观解离常数和/或输出碱性微观解离常数;其中:输出酸性微观解离常数的方式为:pK
a(acidic)i
=FC(X
i
)其中,pK
a(acidic)i
表示原子A
i
的酸性微观解离常数,FC表示一个全连接神经网络层,X
i
表示原子A
i
的特征;输出碱性微观解离常数的方式为:pK
a(basic)i
=FC(X
i
)其中,pK
a(basic)i
表示原子A
i
的碱性微观解离常数,FC表示一个全连接神经网络层,X
i
表示...

【专利技术属性】
技术研发人员:郑明月蒋华良熊嘉诚李叙潼
申请(专利权)人:中国科学院上海药物研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1