半局部社交信息miRNA‑疾病关联性预测方法技术

技术编号:16874314 阅读:33 留言:0更新日期:2017-12-23 12:07
本发明专利技术公开了一种半局部社交信息miRNA‑疾病关联性预测方法。本发明专利技术将疾病之间的相似性,miRNA之间的相似性和已知疾病与miRNA之间的关联性构建异构图,在异构图中利用已知的关联和相似性来预测未知的疾病与miRNA的关联关联。将疾病与miRNA作为异构图中的顶点,类似性与关联矩阵作为边。路径的评分为边的权值与中间顶点的权值的乘积。疾病与miRNA关联的评分为两个顶点间所有长度为2边或3边的路径的评分之和。本发明专利技术该方法相较于之前的模型和方法,可较为高效且准确地预测疾病与miRNA间未知的关联。

Prediction method of semi local social information miRNA Disease Association

The invention discloses a method for predicting the semi local social information miRNA disease association. The invention constructs the heterogeneous graph between the similarity among diseases, the similarity between miRNA and the correlation between known diseases and miRNA, and uses the known association and similarity to predict the association between unknown diseases and miRNA in heterogeneous maps. The disease and miRNA are used as the vertices of the isomeric graph, and the similarity and correlation matrix are used as edges. The score of the path is the product of the weight of the edge and the weight of the middle vertex. The score of the association between the disease and the miRNA was the sum of the scores of the path between the 2 or the 3 sides of the two vertices. Compared with previous models and methods, the present invention can predict the unknown association between disease and miRNA more efficiently and accurately.

【技术实现步骤摘要】
半局部社交信息miRNA-疾病关联性预测方法
本专利技术涉及生物医学和数学建模领域,尤其涉及定向异构图的构建方法,提出一种预测miRNA和疾病之间关联性的方法,一种半局部社交信息miRNA-疾病关联性预测方法。技术背景miRNA是一种小的非编码RNA,在植物、动物和一些病毒中,其在RNA沉默和转录后调控基因虽然大多数miRNA位于细胞内,但一些miRNA(通常称为循环miRNA或细胞外miRNA)也已在细胞外环境中发现,包括各种生物流体和细胞培养基。在过去几年中,越来越多的实验证据表明,miRNA在许多基本生物过程中起着非常重要的作用,如循环调节,代谢,神经元图案化等。疾病-miRNA关联预测是早期疾病诊断和治疗的重要手段。然而,大多数疾病-miRNA关联尚未确定,因此不能从文献中开采。疾病-miRNA关联的预测越来越受到重视。虽然目前许多研究人员已经将其功能用于miRNA-疾病相互作用鉴定,但miRNA的失调机制尚未完全被理解。近年来,已经开发了一些方法来发现潜在的疾病-miRNA关联。它们主要基于一些假设,具有相似功能的miRNA有与类似疾病相关联的更多可能性。基于这一假设,研究人员通过使用已知的关联和miRNA功能相似性来预测潜在的与疾病相关的miRNA,提出了HDMP的可靠性计算模型。还有研究人员提出了一种名为RWRMDA的方法,是第一个全球网络相似度计算模型。该方法通过考虑人类miRNA与miRNA之间的关联性来预测未确定的疾病与miRNA的关联。今年来机器学习的发展迅速,研究人员尝试机器学习计算模型来预测新型miRNA疾病关联,通过构建一个异质miRNATarget失调网络,网络进行特征提取,并构建一个SVM分类器,以从负相关中识别阳性miRNA疾病关联。综上所述目前用于预测miRNA与疾病之间关联性的方法存在明显的局限性:1.数据库的完整性对模型预测结果影响明显;2.部分方法需要负面样本的加入才能取得较好的预测效果;3.对实验数据要求较高,如果没有数量较大的实验数据,这些方法无法得到理想的预测结果;4.部分方法可以发现潜在的miRNA与疾病之间的关联,但模型性能不甚理想。
技术实现思路
本专利技术提出一种半局部社交信息miRNA-疾病关联性预测方法(SSLMDA),用于克服以前方法的局限性。本专利技术得到的预测结果更加准确。本专利技术主要思想是基于相似疾病往往与具有相似功能的miRNA相关的假设,将疾病之间的相似性,miRNA之间的相似性和已知疾病与miRNA之间的关联性构建异构图,在异构图中利用已知的关联和相似性来预测未知的疾病与miRNA的关联关联。该方法相较于之前的模型和方法,可较为高效且准确地预测疾病与miRNA间未知的关联。本专利技术将疾病与miRNA作为异构图中的顶点,类似性与关联矩阵作为边。路径的评分为边的权值与中间顶点的权值的乘积。疾病与miRNA关联的评分为两个顶点间所有长度为2边或3边的路径的评分之和。本专利技术解决其技术问题所采用的技术方案包括如下步骤:步骤1.数据预处理1-1.获取数据集中疾病相似性矩阵SD,miRNA相似矩阵SR和miRNA-疾病关联矩阵A;疾病相似性矩阵SD包含不同疾病的相似性信息,SD(d(i),d(j))代表疾病d(i)和疾病d(j)的相似度;miRNA相似矩阵SR包含各种miRNA的相似性信息,SR(m(i),m(j))表示miRNAm(i)和m(j)之间的相似性;miRNA疾病关联矩阵A包含疾病与miRNA之间已知关联,若A(d(i),m(j))取值为1,则认为疾病d(i)与miRNAm(j)存在关联且关联已通过实验证实。如果A(d(i),m(j))取值为0,则疾病d(i)与miRNAm(j)之间的关联尚未在实验和临床上得到证实。1-2.对疾病相似性矩阵SD和miRNA相似矩阵SR应用高斯相互作用内核相似度方法,对原本疾病相似性矩阵SD和miRNA相似矩阵SR中空缺的位置进行补齐,得到新的疾病相似性矩阵SD和miRNA相似矩阵SR。之所以采用高斯相互作用内核相似度方法,是因为疾病相似性矩阵SD和miRNA相似矩阵SR包含的信息可以描述为定向非循环图(DAG),然而在目前可以得到的数据集中,疾病相似性矩阵SD,miRNA相似矩阵SR的信息不够完善,部分位置的值处于空缺状态。步骤2.构建异构图矩阵GRAPH异构图中有两种顶点和三种边,为了使不同长度的路径或经过不同类型顶点的路径的评分相加有意义,对边的权值和顶点的权值进行预处理,边的权重均值为1,顶点的权重为相连的边的权重的平方和的倒数:SD'=SD/(sum(SD))*CD,疾病类似性矩阵SD首先归1,将矩阵SD中非零元素个数记为CD,归一后矩阵SD乘上CD,使得Dis-Dis(疾病与疾病)边的均值为1。SR'=SR/(sum(SR))*CR,miRNA类似性矩阵SR首先归1,将SR矩阵中非零元素个数记为CR,归一后SR矩阵乘上CR,使得miR-miR(miRNA与miRNA)边的均值为1。miRNA-疾病关联矩阵A记录了Dis-miR边,权重都为1。Dis顶点的权重设置为SD′*SD′T的对角线向量的倒数。miR顶点的权重设置为SR′*SR′T的对角线向量的倒数。由SD′、SR′和A矩阵生成描述异构有向图的矩阵GRAPH:GRAPH.block(0,0,Nd,Nd)=DIS;GRAPH.block(0,Nd,Nd,Nr)=A;GRAPH.block(Nd,Nd,Nr,Nr)=MIR;GRAPH.block(Nd,0,Nr,Nd)=A.transpose();GRAPH左上角的子矩阵是疾病语义相似性矩阵SD′。GRAPH右下角矩阵为miRNA功能相似性矩阵SR′。GRAPH右上角是miRNA-疾病关联矩阵A。矩阵A的转置位于矩阵GRAPH左下方;得到GRAPH;步骤3.获取疾病与miRNA之间的评分矩阵F预测疾病和miRNA之间存在潜在的关联,得到一个疾病与miRNA是否存在关联的评分矩阵F。矩阵GRAPH的异构有向图由矩阵SD′,SR′,A组成,将矩阵GRAPH与矩阵GRAPH转置的乘积记为矩阵B。取矩阵B的对角线元素做倒数。将这些值组合成对角矩阵WEIGHT,对角矩阵的对角元素为异构图中顶点的权重值。WEIGHT.diagonal()=(GRAPH*GRAPH.transpose()).diagonal().inverse()用长度为2边或3边的路径进行评分:具有两个边的路径的分数存储在名为Route2E的矩阵中。矩阵Route2E计算公式如下:Route2E=GRAPH*WEIGHT*GRAPH具有三个边的路径的分数存储在名为Route3E的矩阵中。获取矩阵Route3E计算公式如下:Route3E=Route2E*WEIGHT*GRAPH最终得分矩阵F通过获取Route2E和Route3E总和的右上部分得到:F=(Route2E+Route3E).block(0,Nd,Nd,Nr)。步骤4、根据阈值设置进行预测;用评分矩阵的计算方法获得一个阈值,并将设置的阈值与评分矩阵计算获得的评分进行比较,从而判断疾病与miRNA之间是否具有关系。本专利技术方法具有的优点和创新性主要有:1.算法过程运行简单明本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201710902228.html" title="半局部社交信息miRNA‑疾病关联性预测方法原文来自X技术">半局部社交信息miRNA‑疾病关联性预测方法</a>

【技术保护点】
半局部社交信息miRNA‑疾病关联性预测方法,其特征在于包括如下步骤:步骤1.数据预处理1‑1.获取数据集中疾病相似性矩阵SD,miRNA相似矩阵SR和miRNA‑疾病关联矩阵A;疾病相似性矩阵SD包含不同疾病的相似性信息,SD(d(i),d(j))代表疾病d(i)和疾病d(i)的相似度;miRNA相似矩阵SR包含各种miRNA的相似性信息,SR(m(i),m(j))表示miRNA m(i)和m(j)之间的相似性;miRNA疾病关联矩阵A包含疾病与miRNA之间已知关联,若A(d(i),m(j))取值为1,则认为疾病d(i)与miRNA m(j)存在关联且关联已通过实验证实;如果A(d(i),m(j))取值为0,则疾病d(i)与miRNA m(j)之间的关联尚未在实验和临床上得到证实;1‑2.对疾病相似性矩阵SD和miRNA相似矩阵SR应用高斯相互作用内核相似度方法,对原本疾病相似性矩阵SD和miRNA相似矩阵SR中空缺的位置进行补齐,得到新的疾病相似性矩阵SD和miRNA相似矩阵SR;步骤2.构建异构图矩阵GRAPH异构图中有两种顶点和三种边,为了使不同长度的路径或经过不同类型顶点的路径的评分相加有意义,对边的权值和顶点的权值进行预处理,边的权重均值为1,顶点的权重为相连的边的权重的平方和的倒数:SD'=SD/(sum(SD))*CD,疾病类似性矩阵SD首先归1,将矩阵SD中非零元素个数记为CD,归一后矩阵SD乘上CD,使得Dis‑Dis边的均值为1;SR'=SR/(sum(SR))*CR,miRNA类似性矩阵SR首先归1,将SR矩阵中非零元素个数记为CR,归一后SR矩阵乘上CR,使得miR‑miR边的均值为1;miRNA‑疾病关联矩阵A记录了Dis‑miR边,权重都为1;Dis顶点的权重设置为SD′*SD′...

【技术特征摘要】
1.半局部社交信息miRNA-疾病关联性预测方法,其特征在于包括如下步骤:步骤1.数据预处理1-1.获取数据集中疾病相似性矩阵SD,miRNA相似矩阵SR和miRNA-疾病关联矩阵A;疾病相似性矩阵SD包含不同疾病的相似性信息,SD(d(i),d(j))代表疾病d(i)和疾病d(i)的相似度;miRNA相似矩阵SR包含各种miRNA的相似性信息,SR(m(i),m(j))表示miRNAm(i)和m(j)之间的相似性;miRNA疾病关联矩阵A包含疾病与miRNA之间已知关联,若A(d(i),m(j))取值为1,则认为疾病d(i)与miRNAm(j)存在关联且关联已通过实验证实;如果A(d(i),m(j))取值为0,则疾病d(i)与miRNAm(j)之间的关联尚未在实验和临床上得到证实;1-2.对疾病相似性矩阵SD和miRNA相似矩阵SR应用高斯相互作用内核相似度方法,对原本疾病相似性矩阵SD和miRNA相似矩阵SR中空缺的位置进行补齐,得到新的疾病相似性矩阵SD和miRNA相似矩阵SR;步骤2.构建异构图矩阵GRAPH异构图中有两种顶点和三种边,为了使不同长度的路径或经过不同类型顶点的路径的评分相加有意义,对边的权值和顶点的权值进行预处理,边的权重均值为1,顶点的权重为相连的边的权重的平方和的倒数:SD'=SD/(sum(SD))*CD,疾病类似性矩阵SD首先归1,将矩阵SD中非零元素个数记为CD,归一后矩阵SD乘上CD,使得Dis-Dis边的均值为1;SR'=SR/(sum(SR))*CR,miRNA类似性矩阵SR首先归1,将SR矩阵中非零元素个数记为CR,归一后SR矩阵乘上CR,使得miR-miR边的均值为1;miRNA-疾病关联矩阵A记录了Dis-miR边,权重都为1;Dis顶点的权重设置为SD′*SD′T的对角线向量的倒数;miR顶点的权重设置为SR′*SR′T的对角线向量的倒...

【专利技术属性】
技术研发人员:邵碧尧颜成钢刘炳涛吕晓泉俞灵慧
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1