The present invention discloses a kind of logic and matrix decomposition of the miRNA disease association prediction method based on similar, first calculate the disease function similarity and miRNA function similarity; then construct disease Gauss kernel similarity and miRNA similarity with known Gauss nuclear miRNA disease association; integrated disease functional similarity and get the final the disease similar to Gauss kernel similar integrated miRNA functional similarity and similarity to get the final miRNA Gauss kernel similarity. Finally, based on the logistic matrix decomposition model, we predict the latent feature vectors of miRNA and disease, and calculate the correlation scores between miRNA and disease pairs according to logistic regression function. The invention also can predict the disease relationship of the new miRNA, avoiding the high accuracy of the manpower, material and financial resources consumed by the biochemistry laboratory.
【技术实现步骤摘要】
一种基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法
本专利技术属于系统生物学领域,涉及一种基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法。
技术介绍
越来越多的研究表明miRNA作为一类长度约等于22nt的非编码RNA,在许多人类复杂疾病中起着非常重要的作用。因此识别miRNA和疾病之间的关联关系,这将对疾病机制的理解,药物的开发,疾病的治疗产生很大的推动作用。而众所周知的是通过生物测定方法对miRNA-疾病相互作用进行识别,是非常昂贵的、耗时的和具有挑战性的,但是计算模型能够提供一种低成本,高效率的方法对miRNA-疾病关系进行预测。故随着计算技术的发展,目前出现了相对多的算法对miRNA和疾病关系进行预测。目前,用于miRNA-疾病关系预测的方法主要有3大类:(1)生物实验测定方法这个是最传统,最原始的识别方法,目前典型的miRNA-疾病关系数据库HMDD就是在此类数据上构建的,这个也是最基础的数据来源。(2)基于网络的预测方法这类方法利用已知miRNA-疾病关联关系数据,基于相似的miRNA与之存在关联关系的疾病也相似的特点,通过集成miRNA功能相似性、疾病语义相似性、已有的miRNA-疾病关联关系等信息,为miRNA-疾病关系的确认提供了重要的辅助作用,也为后续的医学研究提供了基础,当前这类方法已经成为miRNA-疾病关系预测的重要工具。比如在RWRMDA方法中,利用miRNA功能相似性和全局网络相似性特点来预测未知的miRNA-疾病关系。HDMP方法通过权重K近邻思想来推断miRNA-疾病关系,其主要贡献在于利用了miR ...
【技术保护点】
一种基于相似性和逻辑矩阵分解的miRNA‑疾病关联关系预测方法,其特征在于,包括以下步骤:步骤1:构建疾病功能相似性矩阵Dfunsim;步骤2:构建miRNA功能相似性矩阵Mfunsim;步骤3:根据已知的miRNA‑疾病关联关系分别构建miRNA高斯核相似性矩阵KGIP,m和疾病高斯核相似性矩阵KGIP,d;步骤4:基于miRNA功能相似性矩阵Mfunsim和高斯核相似性矩阵KGIP,m计算miRNA最终相似性矩阵Sm;基于疾病功能相似性矩阵Dfunsim和高斯核相似性矩阵KGIP,d计算疾病最终相似性矩阵Sd;步骤5:首先根据已知的miRNA‑疾病关联关系、miRNA最终相似性矩阵Sm和疾病最终相似性矩阵Sd,利用逻辑矩阵分解构建miRNA‑疾病关联关系预测模型;然后通过动态近邻正则化对预测模型进行优化;步骤6:首先求解优化后的预测模型,得到miRNA和疾病的潜在特征向量;然后根据miRNA和疾病的潜在特征向量,计算需要预测的miRNA‑疾病对之间的关联关系分数;分数越高,相应的miRNA‑疾病对存在关联关系的可能性越大。
【技术特征摘要】
1.一种基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法,其特征在于,包括以下步骤:步骤1:构建疾病功能相似性矩阵Dfunsim;步骤2:构建miRNA功能相似性矩阵Mfunsim;步骤3:根据已知的miRNA-疾病关联关系分别构建miRNA高斯核相似性矩阵KGIP,m和疾病高斯核相似性矩阵KGIP,d;步骤4:基于miRNA功能相似性矩阵Mfunsim和高斯核相似性矩阵KGIP,m计算miRNA最终相似性矩阵Sm;基于疾病功能相似性矩阵Dfunsim和高斯核相似性矩阵KGIP,d计算疾病最终相似性矩阵Sd;步骤5:首先根据已知的miRNA-疾病关联关系、miRNA最终相似性矩阵Sm和疾病最终相似性矩阵Sd,利用逻辑矩阵分解构建miRNA-疾病关联关系预测模型;然后通过动态近邻正则化对预测模型进行优化;步骤6:首先求解优化后的预测模型,得到miRNA和疾病的潜在特征向量;然后根据miRNA和疾病的潜在特征向量,计算需要预测的miRNA-疾病对之间的关联关系分数;分数越高,相应的miRNA-疾病对存在关联关系的可能性越大。2.根据权利要求1所述的基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法,其特征在于,所述步骤1中,首先根据疾病基因关系和基因的功能相似性计算两种疾病之间的功能相似性,然后由所有疾病两两之间的功能相似性构建疾病功能相似性矩阵Dfunsim;对于任意两种疾病A和B,其功能相似性计算公式如下:其中,GA={gA1,gA2,......,gAm}和GB={gB1,gB2,......,gBn}分别为与疾病A和B相关联的基因集合,m和n分别为基因集合GA和GB中的基因数目;为基因gAi与基因集合GB的功能相似性值,为基因gBj与基因集合GA的功能相似性值,它们的计算方式如下:其中F(gAi,gBj)为基因gAi和基因gBj的语义相似性值,在HumanNet数据库中,给出了基于对数似然函数的语义相似性值计算值,具体如下:F(gAi,gBj)=LLS(gAi,gBj).其中,LLS表示对数似然函数(在HumanNet数据库中,使用对数似然函数计算基因语义相似性值为现有技术)。3.根据权利要求1所述的基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法,其特征在于,所述步骤2中,先构建疾病语义相似性矩阵Dsemsim,再根据已知的miRNA-疾病关联关系和疾病语义相似性Dsemsim构建miRNA功能相似性矩阵Mfunsim。4.根据权利要求3所述的基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法,其特征在于,构建疾病语义相似性矩阵Dsemsim的步骤如下:首先,根据Mesh数据库中的数据将每一种疾病分别定义为一个有向图(DAG),对于任一种疾病A,其有向图表示为DAGA=(TA,EA),其中TA是疾病A结点及其祖先疾病结点的集合,EA为TA中结点之间的关系边集合;然后,根据疾病的语义信息计算两种疾病之间的语义相似性;对于任意两种疾病A和B,其语义相似性计算公式如下:其中,t为疾病A和B的公共祖先结点,SVA(t)和SVB(t)分别表示疾病t与疾病A和B的层次关系语义值,Sem(A)和Sem(B)分别表示疾病A和B在有向图中的语义值,计算公式如下:其中,SVA(t')和SVB(t″)的计算公式如下:其中,Δ′和Δ″分别表示疾病t和t″与其直接祖先结点的层次贡献因子,依据经验取值;然后,由所有疾病两两之间的语义相似性构建疾病语义相似性矩阵Dsemsim。5.根据权利要求4所述的基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法,其特征在于,所述步骤2中,构建miRNA功能相似性矩阵Mfunsim的步骤如下:首先,根据已知的miRNA-疾病关联关系和疾病语义相似性矩阵Dsemsim计算两个miRNA之间的功能相似性;对于任意两个miRNAm1和m2,其功能相似性计算公式如下:其中,DT1和DT2分别为与miRNAm1和m2存在已知关联关系的疾病集合;n1和n2分别为DT1和DT2中的疾病数目;dt1i∈DT1,dt2j∈DT2,S(dt1i,DT2)为疾病dt1i和疾病集合DT2的语义相似性,S(dt2j,DT1)为疾病dt2j和疾病集合DT1的语义相似性,它们的计算公式如下:然后,由所有miRNA两两之间的功能相似性构建miRNA功能相似性矩阵Mfunsim。6.根据权利要求1所述的基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法,其特征在于,所述步骤3中,根据已知的miRNA-疾病关联关系,构建miRNA高斯核相似性矩阵的过程如下:首先,定义为所有miRNA的集合,Nm为miRNA的数量;定义为所有疾病的集合,Nd为疾病的数量;定义Nm×Nd的矩阵Y表示miRNA-疾病关联关系,如果mi和dj存在已知的关联关系,则yij为1,否则为0;然后,计算miRNAm1和m2的高斯核相似性:KGIP,m(m1,m2)=exp(-γm||ym...
【专利技术属性】
技术研发人员:王建新,倪鹏,严承,李敏,朱晓姝,
申请(专利权)人:中南大学,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。