当前位置: 首页 > 专利查询>中南大学专利>正文

一种基于相似性和逻辑矩阵分解的miRNA‑疾病关联关系预测方法技术

技术编号:17597454 阅读:534 留言:0更新日期:2018-03-31 10:30
本发明专利技术公开了一种基于相似性和逻辑矩阵分解的miRNA‑疾病关联关系预测方法,首先计算出疾病功能相似性和miRNA功能相似性;然后利用已知miRNA疾病关联关系构建疾病高斯核相似性和miRNA高斯核相似性;集成疾病功能相似性和高斯核相似性得到最终的疾病相似性,集成miRNA功能相似性和高斯核相似性得到最终的miRNA相似性。最后基于逻辑矩阵分解模型进行预测miRNA和疾病的潜在特征向量,并根据逻辑回归函数来计算miRNA和疾病对的关联关系分数。本发明专利技术也能够对全新miRNA的疾病关系进行预测,避免了生物化学实验室所消耗的人力物力财力准确性高。

A logical and matrix decomposition of the miRNA disease association prediction method based on similarity

The present invention discloses a kind of logic and matrix decomposition of the miRNA disease association prediction method based on similar, first calculate the disease function similarity and miRNA function similarity; then construct disease Gauss kernel similarity and miRNA similarity with known Gauss nuclear miRNA disease association; integrated disease functional similarity and get the final the disease similar to Gauss kernel similar integrated miRNA functional similarity and similarity to get the final miRNA Gauss kernel similarity. Finally, based on the logistic matrix decomposition model, we predict the latent feature vectors of miRNA and disease, and calculate the correlation scores between miRNA and disease pairs according to logistic regression function. The invention also can predict the disease relationship of the new miRNA, avoiding the high accuracy of the manpower, material and financial resources consumed by the biochemistry laboratory.

【技术实现步骤摘要】
一种基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法
本专利技术属于系统生物学领域,涉及一种基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法。
技术介绍
越来越多的研究表明miRNA作为一类长度约等于22nt的非编码RNA,在许多人类复杂疾病中起着非常重要的作用。因此识别miRNA和疾病之间的关联关系,这将对疾病机制的理解,药物的开发,疾病的治疗产生很大的推动作用。而众所周知的是通过生物测定方法对miRNA-疾病相互作用进行识别,是非常昂贵的、耗时的和具有挑战性的,但是计算模型能够提供一种低成本,高效率的方法对miRNA-疾病关系进行预测。故随着计算技术的发展,目前出现了相对多的算法对miRNA和疾病关系进行预测。目前,用于miRNA-疾病关系预测的方法主要有3大类:(1)生物实验测定方法这个是最传统,最原始的识别方法,目前典型的miRNA-疾病关系数据库HMDD就是在此类数据上构建的,这个也是最基础的数据来源。(2)基于网络的预测方法这类方法利用已知miRNA-疾病关联关系数据,基于相似的miRNA与之存在关联关系的疾病也相似的特点,通过集成miRNA功能相似性、疾病语义相似性、已有的miRNA-疾病关联关系等信息,为miRNA-疾病关系的确认提供了重要的辅助作用,也为后续的医学研究提供了基础,当前这类方法已经成为miRNA-疾病关系预测的重要工具。比如在RWRMDA方法中,利用miRNA功能相似性和全局网络相似性特点来预测未知的miRNA-疾病关系。HDMP方法通过权重K近邻思想来推断miRNA-疾病关系,其主要贡献在于利用了miRNA的家族和聚类信息进一步提高了其功能相似性。在PBMDA方法中,其通过集成已知miRNA-疾病关联关系、miRNA功能相似性和疾病语义相似性,以及miRNA和疾病的高斯核相似性来进行miRNA-疾病关联关系进行预测。(3)其他基于机器学习的预测方法基于矩阵分解的预测模型也是一个很重要的方法,在KBMF-MDI方法中,其通过集成miRNA的功能相似性和序列相似性,疾病的语义相似性和功能相似性来进行新的miRNA-疾病关联关系的预测。RLSMDA作为一个半监督的miRNA-疾病预测方法,其不但能够对已知有关联miRNA的疾病的miRNA进行预测,也能够对全新的疾病进行预测。尽管上述这些方法在预测miRNA-疾病关系方面取得了一些良好的效果,为医学研究提供了重要的依据,但仍存在一些不足的地方,比如生物实验测定方法需要大量的人力,财力,物力来进行实验,基于网络的预测方法和其他基于机器学习的预测方法预测准确性仍需进一步提高。因此,有必要设计一种新的miRNA-疾病关联关系预测的方法。
技术实现思路
本专利技术所要解决的技术问题是,针对现有技术的不足,提供一种基于相似性和逻辑矩阵分解的miRNA-疾病关系预测方法,有效避免生物化学实验所消耗的大量人力物力,且能够较准确的预测miRNA-疾病关系。本专利技术的技术解决方案如下:一种基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法,包括以下步骤:步骤1:构建疾病功能相似性矩阵Dfunsim;步骤2:构建miRNA功能相似性矩阵Mfunsim;步骤3:根据已知的miRNA-疾病关联关系分别构建miRNA高斯核相似性矩阵KGIP,m和疾病高斯核相似性矩阵KGIP,d;步骤4:基于miRNA功能相似性矩阵Mfunsim和高斯核相似性矩阵KGIP,m计算miRNA最终相似性矩阵Sm;基于疾病功能相似性矩阵Dfunsim和高斯核相似性矩阵KGIP,d计算疾病最终相似性矩阵Sd;步骤5:首先根据已知的miRNA-疾病关联关系、miRNA最终相似性矩阵Sm和疾病最终相似性矩阵Sd,利用逻辑矩阵分解构建miRNA-疾病关联关系预测模型;然后通过动态近邻正则化对预测模型进行优化;步骤6:首先求解优化后的预测模型,得到miRNA和疾病的潜在特征向量;然后根据miRNA和疾病的潜在特征向量,计算需要预测的miRNA-疾病对之间的关联关系分数;分数越高,相应的miRNA-疾病对存在关联关系的可能性越大(对各个miRNA-疾病对按其关联关系分数从高到低进行排名,排名越靠前,该miRNA-疾病对存在关联关系的可能性越大)。进一步地,所述步骤1中,首先根据疾病基因关系和基因的功能相似性计算两种疾病之间的功能相似性,然后由所有疾病两两之间的功能相似性构建疾病功能相似性矩阵Dfunsim;对于任意两种疾病A和B,其功能相似性计算公式如下:其中,GA={gA1,gA2,......,gAm}和GB={gB1,gB2,......,gBn}分别为与疾病A和B相关联的基因集合,m和n分别为基因集合GA和GB中的基因数目;为基因gAi与基因集合GB的功能相似性值,为基因gBj与基因集合GA的功能相似性值,它们的计算方式如下:其中F(gAi,gBj)为基因gAi和基因gBj的语义相似性值,在HumanNet数据库中,给出了基于对数似然函数的语义相似性值计算值,具体如下:F(gAi,gBj)=LLS(gAi,gBj).其中,LLS表示对数似然函数(在HumanNet数据库中,使用对数似然函数计算基因语义相似性值为现有技术)。进一步地,所述步骤2中,先构建疾病语义相似性矩阵Dsemsim,再根据已知的miRNA-疾病关联关系和疾病语义相似性Dsemsim构建miRNA功能相似性矩阵Mfunsim。进一步地,构建疾病语义相似性矩阵Dsemsim的步骤如下:首先,根据Mesh数据库中的数据将每一种疾病分别定义为一个有向图(DAG),对于任一种疾病A,其有向图表示为DAGA=(TA,EA),其中TA是疾病A结点及其祖先疾病结点的集合,EA为TA中结点之间的关系边集合;然后,根据疾病的语义信息计算两种疾病之间的语义相似性;对于任意两种疾病A和B,其语义相似性计算公式如下:其中,t为疾病A和B的公共祖先结点,SVA(t)和SVB(t)分别表示疾病t与疾病A和B的层次关系语义值,Sem(A)和Sem(B)分别表示疾病A和B在有向图中的语义值,计算公式如下:其中,SVA(t')和SVB(t″)的计算公式如下:其中,Δ′和Δ″分别表示疾病t和t″与其直接祖先结点的层次贡献因子,依据经验取值(本专利技术中,依照以前其他方法的研究经验设置Δ′和Δ″的值为0.5);然后,由所有疾病两两之间的语义相似性构建疾病语义相似性矩阵Dsemsim。进一步地,所述步骤2中,构建miRNA功能相似性矩阵Mfunsim的步骤如下:首先,根据已知的miRNA-疾病关联关系和疾病语义相似性矩阵Dsemsim计算两个miRNA之间的功能相似性;对于任意两个miRNAm1和m2,其功能相似性计算公式如下:其中,DT1和DT2分别为与miRNAm1和m2存在已知关联关系的疾病集合;n1和n2分别为DT1和DT2中的疾病数目;dt1i∈DT1,dt2j∈DT2,S(dt1i,DT2)为疾病dt1i和疾病集合DT2的语义相似性,S(dt2j,DT1)为疾病dt2j和疾病集合DT1的语义相似性,它们的计算公式如下:然后,由所有miRNA两两之间的功能相似性构建miRNA功能相似性矩阵Mfunsim。进一步地,所本文档来自技高网
...
一种<a href="http://www.xjishu.com/zhuanli/55/201711075296.html" title="一种基于相似性和逻辑矩阵分解的miRNA‑疾病关联关系预测方法原文来自X技术">基于相似性和逻辑矩阵分解的miRNA‑疾病关联关系预测方法</a>

【技术保护点】
一种基于相似性和逻辑矩阵分解的miRNA‑疾病关联关系预测方法,其特征在于,包括以下步骤:步骤1:构建疾病功能相似性矩阵Dfunsim;步骤2:构建miRNA功能相似性矩阵Mfunsim;步骤3:根据已知的miRNA‑疾病关联关系分别构建miRNA高斯核相似性矩阵KGIP,m和疾病高斯核相似性矩阵KGIP,d;步骤4:基于miRNA功能相似性矩阵Mfunsim和高斯核相似性矩阵KGIP,m计算miRNA最终相似性矩阵Sm;基于疾病功能相似性矩阵Dfunsim和高斯核相似性矩阵KGIP,d计算疾病最终相似性矩阵Sd;步骤5:首先根据已知的miRNA‑疾病关联关系、miRNA最终相似性矩阵Sm和疾病最终相似性矩阵Sd,利用逻辑矩阵分解构建miRNA‑疾病关联关系预测模型;然后通过动态近邻正则化对预测模型进行优化;步骤6:首先求解优化后的预测模型,得到miRNA和疾病的潜在特征向量;然后根据miRNA和疾病的潜在特征向量,计算需要预测的miRNA‑疾病对之间的关联关系分数;分数越高,相应的miRNA‑疾病对存在关联关系的可能性越大。

【技术特征摘要】
1.一种基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法,其特征在于,包括以下步骤:步骤1:构建疾病功能相似性矩阵Dfunsim;步骤2:构建miRNA功能相似性矩阵Mfunsim;步骤3:根据已知的miRNA-疾病关联关系分别构建miRNA高斯核相似性矩阵KGIP,m和疾病高斯核相似性矩阵KGIP,d;步骤4:基于miRNA功能相似性矩阵Mfunsim和高斯核相似性矩阵KGIP,m计算miRNA最终相似性矩阵Sm;基于疾病功能相似性矩阵Dfunsim和高斯核相似性矩阵KGIP,d计算疾病最终相似性矩阵Sd;步骤5:首先根据已知的miRNA-疾病关联关系、miRNA最终相似性矩阵Sm和疾病最终相似性矩阵Sd,利用逻辑矩阵分解构建miRNA-疾病关联关系预测模型;然后通过动态近邻正则化对预测模型进行优化;步骤6:首先求解优化后的预测模型,得到miRNA和疾病的潜在特征向量;然后根据miRNA和疾病的潜在特征向量,计算需要预测的miRNA-疾病对之间的关联关系分数;分数越高,相应的miRNA-疾病对存在关联关系的可能性越大。2.根据权利要求1所述的基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法,其特征在于,所述步骤1中,首先根据疾病基因关系和基因的功能相似性计算两种疾病之间的功能相似性,然后由所有疾病两两之间的功能相似性构建疾病功能相似性矩阵Dfunsim;对于任意两种疾病A和B,其功能相似性计算公式如下:其中,GA={gA1,gA2,......,gAm}和GB={gB1,gB2,......,gBn}分别为与疾病A和B相关联的基因集合,m和n分别为基因集合GA和GB中的基因数目;为基因gAi与基因集合GB的功能相似性值,为基因gBj与基因集合GA的功能相似性值,它们的计算方式如下:其中F(gAi,gBj)为基因gAi和基因gBj的语义相似性值,在HumanNet数据库中,给出了基于对数似然函数的语义相似性值计算值,具体如下:F(gAi,gBj)=LLS(gAi,gBj).其中,LLS表示对数似然函数(在HumanNet数据库中,使用对数似然函数计算基因语义相似性值为现有技术)。3.根据权利要求1所述的基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法,其特征在于,所述步骤2中,先构建疾病语义相似性矩阵Dsemsim,再根据已知的miRNA-疾病关联关系和疾病语义相似性Dsemsim构建miRNA功能相似性矩阵Mfunsim。4.根据权利要求3所述的基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法,其特征在于,构建疾病语义相似性矩阵Dsemsim的步骤如下:首先,根据Mesh数据库中的数据将每一种疾病分别定义为一个有向图(DAG),对于任一种疾病A,其有向图表示为DAGA=(TA,EA),其中TA是疾病A结点及其祖先疾病结点的集合,EA为TA中结点之间的关系边集合;然后,根据疾病的语义信息计算两种疾病之间的语义相似性;对于任意两种疾病A和B,其语义相似性计算公式如下:其中,t为疾病A和B的公共祖先结点,SVA(t)和SVB(t)分别表示疾病t与疾病A和B的层次关系语义值,Sem(A)和Sem(B)分别表示疾病A和B在有向图中的语义值,计算公式如下:其中,SVA(t')和SVB(t″)的计算公式如下:其中,Δ′和Δ″分别表示疾病t和t″与其直接祖先结点的层次贡献因子,依据经验取值;然后,由所有疾病两两之间的语义相似性构建疾病语义相似性矩阵Dsemsim。5.根据权利要求4所述的基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法,其特征在于,所述步骤2中,构建miRNA功能相似性矩阵Mfunsim的步骤如下:首先,根据已知的miRNA-疾病关联关系和疾病语义相似性矩阵Dsemsim计算两个miRNA之间的功能相似性;对于任意两个miRNAm1和m2,其功能相似性计算公式如下:其中,DT1和DT2分别为与miRNAm1和m2存在已知关联关系的疾病集合;n1和n2分别为DT1和DT2中的疾病数目;dt1i∈DT1,dt2j∈DT2,S(dt1i,DT2)为疾病dt1i和疾病集合DT2的语义相似性,S(dt2j,DT1)为疾病dt2j和疾病集合DT1的语义相似性,它们的计算公式如下:然后,由所有miRNA两两之间的功能相似性构建miRNA功能相似性矩阵Mfunsim。6.根据权利要求1所述的基于相似性和逻辑矩阵分解的miRNA-疾病关联关系预测方法,其特征在于,所述步骤3中,根据已知的miRNA-疾病关联关系,构建miRNA高斯核相似性矩阵的过程如下:首先,定义为所有miRNA的集合,Nm为miRNA的数量;定义为所有疾病的集合,Nd为疾病的数量;定义Nm×Nd的矩阵Y表示miRNA-疾病关联关系,如果mi和dj存在已知的关联关系,则yij为1,否则为0;然后,计算miRNAm1和m2的高斯核相似性:KGIP,m(m1,m2)=exp(-γm||ym...

【专利技术属性】
技术研发人员:王建新倪鹏严承李敏朱晓姝
申请(专利权)人:中南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1