基于自监督学习的药物小分子性质预测方法、装置及设备制造方法及图纸

技术编号:31022244 阅读:25 留言:0更新日期:2021-11-30 03:14
本申请公开一种基于自监督学习的药物小分子性质预测方法、装置及设备,涉及人工智能技术领域,包括:生成目标药物小分子的分子图结构,并利用目标图神经网络模型确定分子图结构的第一特征向量;提取目标药物小分子的第一分子线性输入规范数据,以及不同药物小分子的第二分子线性输入规范数据,利用预设语言模型确定第一分子线性输入规范数据的第二特征向量和第二分子线性输入规范数据的第三特征向量;利用第一特征向量、第二特征向量和第三特征向量调整目标图神经网络模型的模型参数,以基于调整后的目标图神经网络模型输出目标药物小分子满足预设特征约束条件的目标特征向量;将目标特征向量输入训练完成的性质预测模型中,确定性质预测结果。确定性质预测结果。确定性质预测结果。

【技术实现步骤摘要】
基于自监督学习的药物小分子性质预测方法、装置及设备


[0001]本申请涉及人工智能
,尤其涉及到一种基于自监督学习的药物小分子性质预测方法、装置及设备。

技术介绍

[0002]新药研发周期十分漫长,包括靶标选择与验证、从苗头化合物(Hit)的发现到先导化合物(Lead)最后到候选药物(Candidate)的发现与优化,层层筛选,成本高昂。为了充分挖掘药物分子背后的规律,加速发现药物研发的速度,从本世纪开始,药物开发领域的研究人员尝试将机器学习方法引入到药物化学研究中,以期解决药物开发过程中面临的问题。
[0003]传统的药物小分子性质预测方法要求研究人员进行特征工程以合理选择药物的分子描述符作为模型的特征输入,进行定量构效关系或构效关系(QSAR/QSPR)建模。而分子描述符的选取是一个繁琐、耗时的过程,而且选取的描述符会对模型施加较强的预设先验,使模型产生偏差,进而影响模型的预测性能。

技术实现思路

[0004]有鉴于此,本申请提供了一种基于自监督学习的药物小分子性质预测方法、装置及设备,可用于解决目前对药物小分本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于自监督学习的药物小分子性质预测方法,其特征在于,包括:依据目标药物小分子的化学分子结构生成分子图结构,并利用目标图神经网络模型确定所述分子图结构对应的第一特征向量;提取所述目标药物小分子对应的第一分子线性输入规范数据,以及与所述目标药物小分子不同化学分子结构的药物小分子对应的第二分子线性输入规范数据,并利用预设语言模型确定所述第一分子线性输入规范数据对应的第二特征向量以及所述第二分子线性输入规范数据对应的第三特征向量;利用所述第一特征向量、所述第二特征向量和所述第三特征向量调整所述目标图神经网络模型的模型参数,以基于调整后的目标图神经网络模型输出所述目标药物小分子对应满足预设特征约束条件的目标特征向量;将所述目标特征向量输入训练完成的性质预测模型中,确定所述目标药物小分子的性质预测结果。2.根据权利要求1所述的方法,其特征在于,所述利用所述第一特征向量、所述第二特征向量和所述第三特征向量调整所述目标图神经网络模型的模型参数,以基于调整后的目标图神经网络模型输出所述目标药物小分子对应满足预设特征约束条件的目标特征向量,包括:利用所述第一特征向量、所述第二特征向量和所述第三特征向量计算对比损失函数;依据所述对比损失函数调整所述目标图神经网络模型的模型参数,直至所述目标图神经网络模型输出所述目标药物小分子对应的目标特征向量和所述第二特征向量的特征距离小于第一预设距离阈值且所述目标特征向量和任一所述第三特征向量的特征距离大于第二预设距离阈值。3.根据权利要求1所述的方法,其特征在于,所述分子图结构中携带有邻接矩阵以及属性信息,所述属性信息包含节点初始特征向量和边初始特征向量,其中,所述节点初始特征向量和所述边初始特征向量是依据预设向量生成规则确定的;所述利用目标图神经网络模型确定所述分子图结构对应的第一特征向量,包括:将所述分子图结构和所述邻接矩阵、所述属性信息输入目标图神经网络模型,获取所述分子图结构中各个节点的节点隐向量;利用所述各个节点的节点隐向量生成所述目标药物小分子的第一特征向量。4.根据权利要求3所述的方法,其特征在于,所述利用所述各个节点的节点隐向量生成所述目标药物小分子的第一特征向量,包括:计算所述节点隐向量的隐向量平均值,将所述隐向量平均值确定为所述目标药物小分子的第一特征向量;或,在所述节点隐向量提取对应隐向量值最大的第一节点隐向量,将所述第一节点隐向量确定为所述第一特征向量。5.根据权利要求1所述的方法,其特征在于,所述提取所述目标药物小分子对应的第一分子线性输入规范数据,以及与所述目标药物小分子不同化学分子结构的药物小分子对应的第二分子线性输入规范数据,包括:按照预设药物小分子标识,在分子线性输入规范数据库中提取与所述目标药物小分子匹配的第一分子线性输入规范数据以及预设数量个与所述目标药物小分子不同化学分子
结构的药物小分子对应的第二分子线性输入规范数据,其中,所述第...

【专利技术属性】
技术研发人员:王俊
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1