【技术实现步骤摘要】
一种小样本分子毒性预测方法
[0001]本专利技术属于数据处理
,尤其是涉及一种小样本分子毒性预测方法。
技术介绍
[0002]对于生物制造而言,目前研究人员面对大量未知性能的化合物,采用直接实验的方法费时费力、效率太低。考虑到这些因素,正日益被基于化合物结构的毒性预测方法所代替。由于现有可用的公开毒性数据有限,因此有必要构建一个高效的分子毒性预测的定量构效关系模型。
技术实现思路
[0003]有鉴于此,本专利技术提出一种小样本分子毒性预测方法,适用于只有少量训练样本的分子毒性预测任务,可以在只有少量训练样本情况下达到较高的毒性预测准确率。
[0004]为达到上述目的,本专利技术的技术方案是这样实现的:一种小样本分子毒性预测方法,包括如下步骤:步骤1:将毒性数据集中的化合物转化成图结构数据;步骤2:基于多分类模块图神经网络模型搭建预训练模型,构建预训练模型的训练集,将预训练模型的训练集输入至预训练模型中进行预训练模型的训练;步骤3:对预训练模型进行变型,并对变形后的预训练模型进行迁移训练获得小样 ...
【技术保护点】
【技术特征摘要】
1.一种小样本分子毒性预测方法,其特征在于:包括如下步骤:步骤1:将毒性数据集中的化合物转化成图结构数据;步骤2:基于多分类模块图神经网络模型搭建预训练模型,构建预训练模型的训练集,将预训练模型的训练集输入至预训练模型中进行预训练模型的训练;步骤3:对预训练模型进行变型,并对变形后的预训练模型进行迁移训练获得小样本分子毒性预测模型;步骤4:利用小样本分子毒性预测模型进行毒性预测。2.根据权利要求1所述的一种小样本分子毒性预测方法,其特征在于:所述步骤1具体包括:步骤101:从数据库中获取化合物的SMILES格式以及对应的毒理活性标签,将SMILES格式转化成RDkit的mol对象,同时生成一个空的DGL图;步骤102:将化合物的原子映射成节点,化学键映射成边,从而将分子结构式转化成图的形式,对化合物中的原子进行编号组建节点数组,根据两个原子在数组中的编号,返回一个化学键的对象;步骤...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。