【技术实现步骤摘要】
药物-疾病关联预测方法及系统
本专利技术涉及药物重新定位
,具体涉及一种基于整合相似性和二分图扩散算法的药物-疾病关联预测方法及系统。
技术介绍
药物重新定位旨在为现有药物确定新的适应症,这技术将大大降低了药物开发的成本和时间。近年来,研究人员探索了多种挖掘现有药物与疾病之间的联系的计算方法,包括基于机器学习方法、矩阵分解、网络和图等方法。但是,到目前为止的所有应用于药物重定位的方法都直接使用未经处理的原始的药物-疾病关联矩阵的信息,由于在实际情况下这些相似关联信息只有小部分被证明并记录下来,还有很多相似关联信息亟待证明,导致用于预测方法的原始关联矩阵数据稀疏性大。另外,对于药物之间和疾病之间的相似性特征的提取,目前还缺乏充分挖掘方法。公开日为2021.03.26,公告号为CN112562795A的中国申请专利:基于多相似度融合的药物新用途预测方法,试图利用药物化学结构、药物靶蛋白和药物副作用数据计算药物相似度,再加权求和得到融合的药物相似度,基于融合的药物相似度计算得到的药物-疾病关联预测值,以此避免依靠单一 ...
【技术保护点】
1.一种药物-疾病关联预测方法,其特征在于,包括以下步骤:/nS1,获取药物-疾病关联数据集,所述药物-疾病关联数据集包括;药物-疾病关联矩阵、药物化学相似矩阵以及疾病语义相似矩阵;/nS2,对所述药物-疾病关联矩阵进行高斯核运算获得药物高斯核相似性矩阵以及疾病高斯核相似性矩阵;/nS3,结合所述药物化学相似矩阵以及疾病语义相似矩阵,运用权值K最近邻算法对所述药物-疾病关联矩阵进行重构获得药物-疾病关联重构矩阵;/nS4,根据所述药物-疾病关联重构矩阵,运用线性邻域相似性算法计算获得药物线性邻域相似性矩阵以及疾病线性邻域相似性矩阵;/nS5,对所述药物高斯核相似性矩阵与药物 ...
【技术特征摘要】
1.一种药物-疾病关联预测方法,其特征在于,包括以下步骤:
S1,获取药物-疾病关联数据集,所述药物-疾病关联数据集包括;药物-疾病关联矩阵、药物化学相似矩阵以及疾病语义相似矩阵;
S2,对所述药物-疾病关联矩阵进行高斯核运算获得药物高斯核相似性矩阵以及疾病高斯核相似性矩阵;
S3,结合所述药物化学相似矩阵以及疾病语义相似矩阵,运用权值K最近邻算法对所述药物-疾病关联矩阵进行重构获得药物-疾病关联重构矩阵;
S4,根据所述药物-疾病关联重构矩阵,运用线性邻域相似性算法计算获得药物线性邻域相似性矩阵以及疾病线性邻域相似性矩阵;
S5,对所述药物高斯核相似性矩阵与药物线性邻域相似性矩阵进行整合获得药物综合相似矩阵;对所述疾病高斯核相似性矩阵与疾病线性邻域相似性矩阵进行整合获得疾病综合相似矩阵;
S6,根据所述药物综合相似矩阵、疾病综合相似矩阵以及药物-疾病关联重构矩阵,运用基于二分图的二步扩散方法构建获得药物-疾病关联预测矩阵作为预测结果。
2.根据权利要求l所述的药物-疾病关联预测方法,其特征在于,在所述步骤S2中,通过以下公式获得疾病di和dj之间的药物高斯核相似性矩阵GIDD以及药物Di和Dj之间疾病高斯核相似性矩阵GIDd:
GIDd(di,dj)=exp(-βd||IP(di)-IP(dj)||2);
GIDD(Di,Dj)=exp(-βD||IP(Di)-IP(Dj)||2);
其中,在所述药物-疾病关联矩阵,第i行表示药物Di是否与矩阵中的各项疾病相关,第j列表示疾病dj是否与矩阵中的各项药物相关;向量IP(Di)和IP(dj)分别以所述药物-疾病关联矩阵中的第i行向量和第j列向量作为高斯核的特征向量;βd和βD表示内核带宽,按以下公式表示:
β′d、β′D表示预设的原始内核带宽。
3.根据权利要求1所述的药物-疾病关联预测方法,其特征在于,在所述步骤S3中,包括以下步骤:
S31,根据所述药物化学相似矩阵DrugCSim找到与药物Di相邻的K个已知药物,推导出Di的相互作用似然分布YD:
其中,D1到表示Di的K个最近的已知药物,按降序排列;是权重系数,其中,η是衰减项,η取值η≤1,是正则化项;
S32,根据所述疾病语义相似矩阵DiseaseSSim找到与疾病dj相邻的K个已知疾病,推导出dj的相互作用似然分布Yd:
其中d1到表示dj的K个最近的已知疾病,按降序排序;是权重系数,其中,η是衰减项,η取值η≤1,是正则化项;
S33,通过将所述YD与Yd的平均值Ym中对应的值填充所述药物-疾病关联矩阵Y中的空白项,对所述药物-疾病关联矩阵进行重构,获得药物-疾病关联重构矩阵YF:
4.根据权利要求3所述的药物-疾病关联预测方法,其特征在于,在所述步骤S4中,通过以下过程计算获得药物线性邻域相似性矩阵:
对所述药物-疾病关联重构矩阵YF按行划分获得nD个表示药物Di的特征向量zi,i=1,2,…,nD;通过求解以下优化问题,获得特征向量zi的重构权值生成权重矩陈作为药物线性邻域相似性矩阵DrugLNSSim:
其中,O(zi)表示kD(0<kD<nD)到zi的欧几里得距离最小的邻居;表示zi的第j个邻居;代表到zi的重建贡献,表示zi和之间的相似性;ωi=(ωi,i1,ωi,i2,...ωi,ik)T和为Gram矩阵Gi∈Rk×k的entry;λ为正则化参数。
5.根据权利要求3所述的药物-疾病关联预测方法,其特征在于,在所述步骤S4中,通过以下过程计算获得疾病线性邻域相似性矩阵:
对所述药物-疾病关联重构矩阵YF按列划分获得nd个表示疾病di的特征向量zi,i=1,2,…,nd;通过求解以下优化问题,获得特征向量zi的重...
【专利技术属性】
技术研发人员:顾国生,李健明,孙宇平,林志毅,谢国波,
申请(专利权)人:广东工业大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。