【技术实现步骤摘要】
一种基于综合kmer和拓扑特征的增强型蛋白质
‑
药物相互作用预测方法及系统
[0001]本专利技术涉及人工智能辅助药物筛选
,尤其涉及一种基于综合
kmer
和拓扑特征的增强型蛋白质
‑
药物相互作用预测方法及系统
。
技术介绍
[0002]药物在生物体内与特定蛋白质发生相互作用,调节或干扰生物体内的生理过程,从而产生治疗效果
。
药物与蛋白质之间的亲和力是指药物与蛋白质之间相互结合的强度或亲近程度
。
药物分子与蛋白质之间的亲和力主要取决于它们之间的相互作用力,例如氢键
、
离子键
、
范德华力等
。
药物分子的结构和蛋白质的结构决定了它们之间的相互作用模式和亲和力大小
。
药物与蛋白质之间的高亲和力意味着它们更容易结合并形成稳定的复合物,从而增强了药物对蛋白质的影响,提高了药物的疗效
。
[0003]现有人工智能辅助药物筛选领域中药物和蛋白质的亲和 ...
【技术保护点】
【技术特征摘要】
1.
一种基于综合
kmer
和拓扑特征的增强型蛋白质
‑
药物相互作用预测方法,其特征在于,包括:步骤1,收集数据,所述数据包括药物数据
、
蛋白质数据和亲和力数据;步骤2,对收集的数据进行处理,包括:从药物的
SMILES
字符串获取到药物的分子图,使用
Pconsc4
预测模型从蛋白质的氨基酸序列预测得到残基接触图,从蛋白质的氨基酸序列中提取到多组
kmer
特征;步骤3,通过多层图卷积神经网络对药物的特征进行提取;步骤4,通过多层图卷积神经网络对蛋白质的拓扑特征进行提取;步骤5,通过多层全连接网络对蛋白质的
kmer
特征进行提取;步骤6,将药物的特征
、
蛋白质的拓扑特征和蛋白质的
kmer
特征进行拼接融合,得到交互特征;步骤7,将交互特征输入进多层全连接网络中,对药物和蛋白质的亲和力进行预测,并输出二者的亲和力
。2.
根据权利要求1所述的一种基于综合
kmer
和拓扑特征的增强型蛋白质
‑
药物相互作用预测方法,其特征在于,所述步骤2中,按照以下方式对药物数据进行处理:使用
RDKit
工具将药物的
SMILES
字符串表示转换为分子图,药物中的原子作为分子图中的节点,原子与原子之间的化学键作为分子图中的边,提取每个原子的各个物理和化学属性,形成多维的原子特征向量,由分子图提取出所对应的邻接矩阵,且邻接矩阵的对角线元素值均为
1。3.
根据权利要求1所述的一种基于综合
kmer
和拓扑特征的增强型蛋白质
‑
药物相互作用预测方法,其特征在于,所述步骤2中,按照以下方式对蛋白质数据进行处理:首先使用蛋白质结构预测模型
Pconsc4
从蛋白质的氨基酸序列预测出蛋白质的残基接触图,并对残基接触图以
0.5
的阈值进行过滤,捕捉每个残基的各个物理和化学属性,形成多维的残基特征向量,然后由残基接触图提取出所对应的邻接矩阵,且邻接矩阵的对角线元素均为1;从蛋白质的氨基酸序列中提取到多组
kmer
特征
。4.
根据权利要求3所述的一种基于综合
kmer
和拓扑特征的增强型蛋白质
‑
药物相互作用预测方法,其特征在于,所述从蛋白质的氨基酸序列中提取到多组
kmer
特征包括:输入蛋白质氨基酸序列;设定不同的
k
值来表示不同长度的
kmer
片段;对于每个
k
值,采用滑动窗口的方式从蛋白质序列中提取出所有可能的
kmer
片段;统计每个
kmer
片段在蛋白质序列中的出现频率,生成相应的
kmer
特征向量;将不同长度的
kmer
特征向量进...
【专利技术属性】
技术研发人员:张祚龙,陈盛博,罗钢,澹奥帅,魏文彬,
申请(专利权)人:河南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。