【技术实现步骤摘要】
一种面向小分子药物虚拟筛选的多源迁移学习方法和装置
本专利技术涉及一种虚拟学习方法和装置,特别涉及一种面向小分子药物虚拟筛选的多源迁移学习方法和装置。
技术介绍
药物虚拟筛选是一种用于药物发现的计算技术,用于搜索小分子库,以识别最可能与药物靶标结合的结构,这样就能集中目标,大大降低实验筛选化合物的数量,从而缩短研发周期,节约经费开支。其中,虚拟筛选可以分为两类,即基于受体的虚拟筛选和基于配体的虚拟筛选。基于受体的虚拟筛选从靶蛋白的三维结构出发,研究靶蛋白结合位点的特征性质以及它与小分子化合物之间的相互作用模式,根据与结合能相关的亲合性打分函数对蛋白和小分子化合物的结合能力进行评价,最终从大量的化合物分子中挑选出结合模式比较合理的、预测得分较高的化合物,用于后续的生物活性测试。基于配体的虚拟筛选一般是利用已知活性的小分子化合物,根据化合物的形状相似性或药效团模型在化合物数据库中搜索能够与它匹配的化学分子结构,然后对这些挑选出来的化合物进行实验筛选研究。具有成药属性的化合物的数量是巨大的,机器学习可以帮助搜索庞大 ...
【技术保护点】
1.一种面向小分子药物虚拟筛选的多源迁移学习方法,其特征在于,包括以下步骤:/n(1)获取同源数据集,并对其采样,获得经过采样后的同源数据集;/n(2)输入配体分子smiles和生物活性值,在图神经网络中训练得到虚拟筛选模型;/n(3)将采样后的同源数据集放到虚拟筛选模型中训练,得到模型参数;/n(4)预测配体分子与药物靶标结合的生物活性值。/n
【技术特征摘要】
1.一种面向小分子药物虚拟筛选的多源迁移学习方法,其特征在于,包括以下步骤:
(1)获取同源数据集,并对其采样,获得经过采样后的同源数据集;
(2)输入配体分子smiles和生物活性值,在图神经网络中训练得到虚拟筛选模型;
(3)将采样后的同源数据集放到虚拟筛选模型中训练,得到模型参数;
(4)预测配体分子与药物靶标结合的生物活性值。
2.根据权利要求1所述的一种面向小分子药物虚拟筛选的多源迁移学习方法,其特征在于,步骤(1)包括:
(1.1)选择同源药物靶标;
(1.2)对获取所需的同源药物靶标数据集,其中,所述的初始数据集包括同源药物靶标的信息,所述信息包括所需要的配体分子smiles和配体作用的活性值;
(1.3)对同源药物靶标对应的数据集随机有放回采样,设置采样比率,重复几次,获得经过采样后的子同源数据集。
3.根据权利要求1所述的一种面向小分子药物虚拟筛选的多源迁移学习方法,其特征在于,步骤(2)包括:
(2.1)获取目标药物靶标数据集T,其中,所述的初始数据集包括同源药物靶标的信息,所述信息包括所需要的配体分子smiles和配体作用的活性值;
(2.2)利用公式通过卷积操作生成配体分子的分子指纹,记为f;
(2.3)利用公式生成配体分子的加权分子指纹,记为F;
(2.4)利用生成的分子指纹,通过两层全连接层,预测出生物活性值,
4.根据权利要求1所述的一种面向小分子药物虚拟筛选的多源迁移学习方法,其特征在于,步骤(3)包括:
(3.1)获取步骤(1)生成的多个子同源数据集,数据集包括所述信息包括所需要的配体分子smiles和配体作用的活性值;
(3.2)将每一个子源域数据集通过步骤(2)生成的药物小分子虚拟筛选模型中训练,并获取模型参数;
(3.3)将目标域数据集输入到虚拟筛选模型中,并将虚拟模型中的原始参数置换为上一步得到的模型参数。获得目标域预测的生物活性值。
5.根据权利要求1所述的一种面向小分子药物虚拟筛选的多源迁移学习方法,其特征在于,步骤(4)包括:
(4.1)比较多个子源域训练得到的目标域生物活性值的可靠性,并用相关系数来衡量;
(4.2)选取其中相关系数最大...
【专利技术属性】
技术研发人员:袁露,吴建盛,胡海峰,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。