System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开实施例涉及生物信息学,尤其涉及一种靶点突变对药物靶点结合亲和力影响定量评估方法。
技术介绍
1、目前,在有效治疗及最大程度减少治疗期间副作用的过程中,特定关键靶点抑制剂的识别显得至关重要。因此药物-靶点亲和力(drug-target affinity,dta)研究已然成为跨领域研究的焦点,是药物研发过程中的关键环节。从生物医学实验的角度,dta实验方法从依赖化学修饰向非化学修饰的转变已经成为趋势。细胞热转移实验(cellularthermal shift assay,cetsa)和热蛋白质组分析(thermal proteome profiling,tpp)等技术,因其在识别药物与靶点间相互作用方面的广泛应用而备受青睐。x射线晶体学作为研究生物大分子结构的核心技术,能够精确揭示小分子与蛋白质间的结合机制,解析复杂的结构。这两类方法因其在分析药物-靶点结合亲和力方面所展现出的高度可靠性而被高度肯定。然而它们高昂的成本及对精密实验设施的需求限制了其在广泛筛选药物靶点亲和力方面的应用。由于肿瘤、病毒或细菌引发的疾病频繁展现出对药物的抵抗性,蛋白质的突变成为了这一现象的关键驱动因素。特别是在蛋白质活性口袋的关键位点上发生的突变,可能会显著影响其与药物的结合亲和力。
2、可见,亟需一种高效精准的靶点突变对药物靶点结合亲和力影响定量评估方法。
技术实现思路
1、有鉴于此,本公开实施例提供一种靶点突变对药物靶点结合亲和力影响定量评估方法,至少部分解决现有技术中存在预测效率和精准
2、本公开实施例提供了一种靶点突变对药物靶点结合亲和力影响定量评估方法,包括:
3、步骤1,将药物smiles作为输入,通过rdkit工具包,将药物的原子作为节点,化学键作为边将药物smiles转化为药物分子图,并且使用定向消息传递神经网络聚合药物分子图上节点信息,使用readout函数获取最终的药物的特征向量;
4、步骤2,将靶点的序列作为输入,使用tape分词技术对氨基酸序列划分不同的token,初始化每一个氨基酸的特征向量,然后使用多层一维卷积神经网络从靶点的序列中提取靶点的特征向量;
5、步骤3,基于transformer架构,使用非对称的交叉注意力机制融合药物的特征向量和靶点的特征向量,获取药物和靶点对的融合特征向量;
6、步骤4,将融合特征向量输入初始模型预测药物和靶点的亲和力,使用mse损失函数计算损失,并使用adam优化器基于反向传播方法更新初始模型的参数;
7、步骤5,重复步骤1至步骤4,直到模型拟合,得到预训练模型;
8、步骤6,使用突变数据集对预训练模型进行微调,得到目标模型;
9、步骤7,使用目标模型对特定的药物和靶点的亲和力进行预测,得到预测分值。
10、根据本公开实施例的一种具体实现方式,所述使用定向消息传递神经网络聚合药物分子图上节点信息,使用readout函数获取最终的药物的特征向量的步骤,包括:
11、对于特定药物d而言,定义其消息传递过程为:
12、
13、
14、其中,代表了在第(t+1)次迭代中节点v和w之间的信息传递,xv是药物d的分子图中节点v的特征,表示第t次迭代中连接节点v和w的边的隐藏状态,将边的初始隐藏状态初始化为其中n(v)表示节点v的邻居节点集,wi代表一个可学习的参数,wvw表示节点v和w之间的化学键属性,τ表示relu激活函数;
15、定义信息传递功能mt和边信息更新功能ut为:
16、
17、
18、其中,wm是一个可训练的参数,通过在每个步骤中迭代地重新引入构建一条指向该边原始特征向量的跳跃连接;
19、计算每个节点的信息及其隐藏状态,具体计算公式为:
20、
21、hv=τ(wacat(xv,mv))
22、其中,t表示最终的迭代次数,wa表示另一个可学习的参数;
23、对于药物d,d-mpnn通过对每一个原子的特征向量进行求和作为readout函数获取药物分子的特征向量edd:
24、
25、其中,g表示所有分子图d中药物原子节点的集合。
26、根据本公开实施例的一种具体实现方式,每层一维卷积神经网络中使用残差连接方法。
27、根据本公开实施例的一种具体实现方式,所述使用多层一维卷积神经网络从靶点的序列中提取靶点的特征向量的步骤,包括:
28、在每一层一维卷积神经网络中通过门控线性单元提取蛋白质的特征向量为
29、
30、其中,λ被设定为一个常量,旨在调节缩放效应,ln(·)则代表层级归一化操作,代表第t层的蛋白质的特征向量;
31、将最后一层一维卷积神经网络的输出作为靶点的特征向量
32、
33、其中,n为一维卷积神经网络的层数。
34、根据本公开实施例的一种具体实现方式,所述交叉注意力机制的表达式为
35、q=fq(ed);k=fk(ep);v=fv(ep)
36、
37、e=crossattention(q,k,v)
38、其中,e表示药物和靶点对的融合特征,ed表示使用d-mpnn获取到的药物的特征,ep表示使用1d-cnn获取到的蛋白序列的特征,fq(·),fk(·),fv(·)表示线性映射。
39、根据本公开实施例的一种具体实现方式,所述亲和力的计算公式为
40、
41、其中,w1,w2,b1和b2为可训练参数。
42、本公开实施例中的靶点突变对药物靶点结合亲和力影响定量评估方案,包括:步骤1,将药物smiles作为输入,通过rdkit工具包,将药物的原子作为节点,化学键作为边将药物smiles转化为药物分子图,并且使用定向消息传递神经网络聚合药物分子图上节点信息,使用readout函数获取最终的药物的特征向量;步骤2,将靶点的序列作为输入,使用tape分词技术对氨基酸序列划分不同的token,初始化每一个氨基酸的特征向量,然后使用多层一维卷积神经网络从靶点的序列中提取靶点的特征向量;步骤3,基于transformer架构,使用非对称的交叉注意力机制融合药物的特征向量和靶点的特征向量,获取药物和靶点对的融合特征向量;步骤4,将融合特征向量输入初始模型预测药物和靶点的亲和力,使用mse损失函数计算损失,并使用adam优化器基于反向传播方法更新初始模型的参数;步骤5,重复步骤1至步骤4,直到模型拟合,得到预训练模型;步骤6,使用突变数据集对预训练模型进行微调,得到目标模型;步骤7,使用目标模型对特定的药物和靶点的亲和力进行预测,得到预测分值。
43、本公开实施例的有益效果为:通过本公开的方案,使用定向消息传递网络从药物的smiles序列中提取药物的本文档来自技高网...
【技术保护点】
1.一种靶点突变对药物靶点结合亲和力影响定量评估方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述使用定向消息传递神经网络聚合药物分子图上节点信息,使用Readout函数获取最终的药物的特征向量的步骤,包括:
3.根据权利要求2所述的方法,其特征在于,每层一维卷积神经网络中使用残差连接方法。
4.根据权利要求3所述的方法,其特征在于,所述使用多层一维卷积神经网络从靶点的序列中提取靶点的特征向量的步骤,包括:
5.根据权利要求4所述的方法,其特征在于,所述交叉注意力机制的表达式为
6.根据权利要求5所述的方法,其特征在于,所述亲和力的计算公式为
【技术特征摘要】
1.一种靶点突变对药物靶点结合亲和力影响定量评估方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述使用定向消息传递神经网络聚合药物分子图上节点信息,使用readout函数获取最终的药物的特征向量的步骤,包括:
3.根据权利要求2所述的方法,其特征在于,每层一维卷积神经网...
【专利技术属性】
技术研发人员:李广迪,邓磊,张东山,秦家碧,胡小文,张盼,黄洁,宋启翔,
申请(专利权)人:中南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。