【技术实现步骤摘要】
本专利技术涉及的是一种rna与药物小分子领域的技术,具体是一种基于子图匹配和领域适应的rna药物结合预测方法。
技术介绍
1、基于深度学习的药物-rna相互作用预测目前存在潜在的捷径学习现象,导致现有的方法对模型训练期间未见的新型rna和药物效果较差。与此同时,药物-rna复合物数据的缺乏也是训练一个深度学习模型的关键问题,与之相对的是,药物-蛋白质复合物数据较多,可以支撑训练出泛化效果较好的深度学习模型。
技术实现思路
1、本专利技术针对药物-rna复合物数据的缺乏导致的预测模型对新发现rna难以预测的问题,提出一种基于子图匹配和领域适应的rna药物结合预测方法,通过子图匹配与领域适应相结合的训练方式有效避免捷径学习,增强泛化效果。
2、本专利技术是通过以下技术方案实现的:
3、本专利技术涉及一种基于子图匹配和领域适应的rna药物结合预测方法,通过在离线阶段构造预测模型并采用药物-蛋白质结合任务进行预训练后,通过冻结部分模型参数并采用药物-rna结合训练任务进行微
...【技术保护点】
1.一种基于子图匹配和领域适应的RNA药物结合预测方法,其特征在于,通过在离线阶段构造预测模型并采用药物-蛋白质结合任务进行预训练后,通过冻结部分模型参数并采用药物-RNA结合训练任务进行微调;在在线阶段采用微调后的预测模型进行实时RNA药物结合预测;
2.根据权利要求1所述的基于子图匹配和领域适应的RNA药物结合预测方法,其特征是,所述的预训练,具体包括:
3.根据权利要求1所述的基于子图匹配和领域适应的RNA药物结合预测方法,其特征是,所述的知识迁移是指:将生成蛋白质图初始表征与生成RNA图初始表征映射到同一样本空间后再进行模型训练,对蛋白
...【技术特征摘要】
1.一种基于子图匹配和领域适应的rna药物结合预测方法,其特征在于,通过在离线阶段构造预测模型并采用药物-蛋白质结合任务进行预训练后,通过冻结部分模型参数并采用药物-rna结合训练任务进行微调;在在线阶段采用微调后的预测模型进行实时rna药物结合预测;
2.根据权利要求1所述的基于子图匹配和领域适应的rna药物结合预测方法,其特征是,所述的预训练,具体包括:
3.根据权利要求1所述的基于子图匹配和领域适应的rna药物结合预测方法,其特征是,所述的知识迁移是指:将生成蛋白质图初始表征与生成rna图初始表征映射到同一样本空间后再进行模型训练,对蛋白质图节点初始表征:其中:mlpp为多层感知机,ap为蛋白质图节点初始表征,为多层感知机网络参数。
4.根据权利要求1所述的基于子图匹配和领域适应的rna药物结合预测方法,其特征是,所述的对蛋白质图结构进行特征提取是指:在保持节点对称性和等变性的情况下,通过聚合邻居节点特征进行表征更新后,将将蛋白质图节点表征组合为蛋白质图表征,具体为:得到蛋白质图表征其中:分别是节点特征、坐标特征和边特征,φe、φh和φx各是两层mlp,c是标准化常数,计算公式为pi为第i个蛋白质节点,与为计算中间产物;
5.根据权利要求1所述的基于子图匹配和领域适应的rna药物结合预测方法,其特征是,所述的蛋白质关键子图表征,通过以下方式得到:使用多层感知机建立蛋白质子图节点匹配模型,将蛋白质图表征与药物小分子图表征拼接后输入蛋白质子图节点匹配模型,得到节点分配矩阵进而得到蛋白质关键子图表征gsub=ztgp[0],其中:mlp为蛋白质子图节点匹配模型,gp为蛋白质图表征,gm为小分子图表征,softmax为激活函数,设置促进节点选择损失函数i2为单位二阶矩阵,a为蛋白质图邻接矩阵,最小化可使节点分配矩阵z接近与[0,1]/[1,0]。
6.根据权利要求1所述的基于子图匹配和领域适应的rna药物结合预测方法,其特征是,所述的药物-rna结合训练任务是指:读取rna pdb结构,得到rna各碱基化学信息与三维坐标,设置各碱基为图网络节点,由各碱基三维坐标计算之间的欧氏距离时,该两碱基对应节点之间存在一条边,其中:(x1,y1,z1),(x2,y2,z2)分别为两碱基三维坐标;使用rna-fm模型编码rna碱基信息,最终得到rna图结构以及rna图节点初始表征;再使用rdkit软件包将药物小分子smiles字符串转换为图网络结构,其中:小分子原子作为图网络节点,分子间化学键作为图网络边,使用unimol模型编码药物小分子节点特征,得到小分子图节点初始表征。
7.根据权利要求1...
【专利技术属性】
技术研发人员:王宇轩,朱伟民,沈红斌,潘小勇,
申请(专利权)人:上海交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。