System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及生物信息学中的药物交互预测领域,尤其涉及基于多源药物特征的药物交互智能预测系统及其方法。
技术介绍
1、当一种药物的作用因另一种药物的共同使用而改变时,就会发生药物交互;预测药物交互是药物研发工作中重要的一部分,有助于减少意外的药物交互,降低药物开发成本,优化药物设计过程;然而,传统的药物交互预测方法,如测试细胞色素p450,面临高成本和长周期等挑战。
2、随着机器学习技术的发展,研究人员可从公开的药物数据库中收集数据,包括药物交互信息、靶标、酶、通路等,这些数据可以为识别潜在的药物交互提供有价值的信息;目前,现有的药物交互预测方法大多基于相似性计算,通过计算药物之间的结构、功能、药理学等相似性,来推断它们之间的交互关系;但是,不同的相似性度量可能会导致不同的预测结果,且无法捕捉药物交互的复杂非线性关系;此外,尽管许多公共数据库提供了各种药物的相关信息,但仍缺乏对药物交互的全面总结,导致对于新药物的交互预测能力有限。
3、因此,现有的药物交互预测方法仍有待改进。
技术实现思路
1、本专利技术的目的在于提出一种基于多源药物特征的药物交互智能预测系统及其方法,解决当前药物交互预测方法中特征信息提取不足的问题;该系统和处理方法全面考虑药物特征的多样性,通过整合多个药物数据库中的特征信息,如通路、酶、靶标和化学亚结构等,构建一致尺度的特征矩阵,为药物交互预测提供更全面的解决方案;同时,通过映射调控和正则化处理,确定交互空间中的药物配对关系,实现更精准、
2、为达到上述目的,本专利技术是通过下述技术方案实现的:
3、一种基于多源药物特征的药物交互智能预测系统,其特征在于,包括:
4、药物信息采集与预处理模块,进行数据采集、数据清洗和数据预处理,分别构建包含通路、酶、靶标、化学亚结构四种特征信息的数据集和包含药物交互信息的数据集,该模块包括数据采集装置、数据预处理装置;
5、药物特征匹配模块,计算x的四种特征下,每两种药物之间的相似度,从而将四个特征矩阵转化为四个相似度矩阵,利用相似度矩阵确定药物之间的匹配关系,并对相似度矩阵进行迭代归一化处理,该模块包括相似度计算装置、归一化处理装置;
6、药物结构信息增强模块,从药物近邻中学习其内在结构,可以用于预测新的交互,基于距离计算寻找每种药物的近邻,使其从近邻中学习药物之间的局部结构相似性,以增强药物相似度矩阵中所能表达的结构信息,并对相似度矩阵进行迭代归一化处理,该模块包括最近邻居学习装置、归一化处理装置;
7、药物交互预测模块,输入药物的相似度矩阵训练模型,获得每种特征的权重矩阵,累加四种特征矩阵与其对应的权重矩阵的乘积,得到药物交互预测矩阵,将其与药物交互观测矩阵作差,值为1的位置表示潜在的药物交互,输出潜在的药物交互列表。
8、所述的一种基于多源药物特征的药物交互智能预测系统,数据采集装置,从药物数据库中采集包含药物交互、通路、酶、靶标和化学亚结构等药物信息,分别构建包含通路、酶、靶标、化学亚结构四种特征信息的数据集x和包含药物交互信息的数据集y;
9、对所述数据采集装置的设置内容包括:
10、(4)从drugbank和kegg drug药物数据库中采集药物信息,包括药物交互ddi、酶de、靶标dt和化学亚结构ds;
11、(5)使用uniport数据库提供的id映射系统将药物的靶标映射到kegg drug数据库,以获取药物的通路dp;
12、(6)移除没有任何交互信息的药物数据,以确保x和y中药物的数量相等;
13、(7)定义数据集x={dp,de,dt,ds},y={ddi}。
14、所述的一种基于多源药物特征的药物交互智能预测系统,数据预处理装置,用于处理数据集x和y中的数据,构建特征矩阵和药物交互观测矩阵;
15、对所述数据预处理装置的设置内容包括:
16、(4)取dp,de,dt,ds∈x,使其分别对应于一组描述符,即可将x中的每个药物xn表示为四个二元特征向量,xn={dpn,den,dtn,dsn},其长度表示每组描述符的数量,其值1或0表示对应描述符的存在或缺失,n为x中每个药物的索引,n∈[1,m],m为x中药物的数量;
17、(5)取xn∈x,定义x的特征矩阵i表示的x的第i个特征矩阵,对于hi,其每一行表示一个药物特征向量,共m行,m为x中药物的数量;
18、(6)取yi,yj∈y,定义y的药物交互观测矩阵j,若药物yi和药物yj之间有交互,则jij=1,否则,jij=0,i,j∈[1,m],m为y中药物的数量。
19、所述的一种基于多源药物特征的药物交互智能预测系统,相似度计算装置,每种药物的特征包括通路、酶、靶标和化学亚结构四个方面,该装置分别计算四种特征下,每两种药物之间的相似度,从而将四个特征矩阵转化为四个相似度矩阵,利用相似度矩阵确定药物之间的匹配关系;
20、对所述相似度计算装置的设置内容包括:
21、(1)取计算num=(h1)t*h1,(h1)t为h1的转置矩阵;
22、(2)构造与(h1)t形状相同的全1矩阵,并将其与h1逐元素相乘,得到矩阵e;
23、(3)构造与h1形状相同的全1矩阵,并将h1与其逐元素相乘,得到矩阵f;
24、(4)计算den=e+f-num;
25、(5)输出h1的相似度矩阵z1,z1=num/den;
26、(6)同理,可计算的相似度矩阵z2,z3,z4,输出的相似度矩阵其中zi中的每个元素(zi)xy反映了hi中两种药物之间在第i个特征下的相似度,zi的主对角线元素全为1,表示hi中每种药物与其自身的相似度。
27、所述的一种基于多源药物特征的药物交互智能预测系统,归一化处理装置,用于加速模型训练和收敛,提高数值稳定性并提高模型的性能;
28、对所述归一化处理装置的设置内容包括:
29、(1)取将zi的主对角线元素设置为0,即自相似度为0,表示不考虑每种药物与其自身的相似度;
30、(2)计算zi每行的和,构建对角矩阵di,其中di[n,n]表示第n行的总和,n∈[1,m],m为药物的数量;
31、(3)计算di的逆平方根
32、(4)迭代更新共200次,输出更新后的相似度矩阵
33、所述的一种基于多源药物特征的药物交互智能预测系统,最近邻居学习装置,从最近邻矩阵中学习药物之间的局部结构相似性,以增强药物相似度矩阵中所能表达的结构信息;
34、对所述最近邻居学习装置的设置内容包括:
35、(7)取计算hi中每两行之间的距离其中,n1、n2分别为hi中的两个行向量,ri为向量的长度,对应于中第i个特征下描述本文档来自技高网...
【技术保护点】
1.一种基于多源药物特征的药物交互智能预测系统,其特征在于,包括:
2.根据权利要求1所述的预测系统,其特征在于,所述的药物信息采集与预处理模块包括:数据采集装置和数据预处理装置;
3.根据权利要求1所述的预测系统,其特征在于,所述的药物特征匹配模块包括:相似度计算装置和归一化处理装置;
4.根据权利要求1所述的预测系统,其特征在于,所述的药物结构信息增强模块包括:最近邻居学习装置和归一化处理装置;
5.根据权利要求1所述的预测系统,其特征在于,所述的药物交互预测模块包括预测模型训练装置和药物交互预测装置;
6.一种基于多源药物特征的药物交互智能预测方法,其特征在于,包括:
7.一种计算机程序产品,其特征在于,包括:计算机指令;
8.一种计算设备,其特征在于,包括:处理器和存储器;
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令或程序,当计算机指令或程序在计算机上运行时,使得如权利要求6所述的基于多源药物特征的药物交互智能预测方法被执行。
【技术特征摘要】
1.一种基于多源药物特征的药物交互智能预测系统,其特征在于,包括:
2.根据权利要求1所述的预测系统,其特征在于,所述的药物信息采集与预处理模块包括:数据采集装置和数据预处理装置;
3.根据权利要求1所述的预测系统,其特征在于,所述的药物特征匹配模块包括:相似度计算装置和归一化处理装置;
4.根据权利要求1所述的预测系统,其特征在于,所述的药物结构信息增强模块包括:最近邻居学习装置和归一化处理装置;
5.根据权利要求1所述的预测系统,其特...
【专利技术属性】
技术研发人员:王玲,王曦炜,金天宇,周铁华,张正阳,
申请(专利权)人:东北电力大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。