The invention discloses a forecasting method based on improved miRNA related diseases based on collaborative filtering. MiRNA disease prediction problem can be regarded as a recommendation to fix the problem. Based on a two - point network known as a known miRNA disease association, miRNA is recommended and vice versa based on the known preferences of miRNA for related diseases. First, we define and calculate the importance matrix SIGd of a disease to another disease. When the disease D (I) thinks the disease D (J) is more important, the score of SIGd (d (I), D (J)) is higher. It is similar to define and calculate SIGr to measure the importance of two kinds of miRNA. Secondly, the score is calculated by using the significant matrix and the similar matrix as weight weight. The similarity matrix is defined to represent the similarity between miRNA or disease, the final score is the sum of the miRNA disease association miRNA and disease score and the miRNA score of the disease. The invention has achieved higher prediction precision.
【技术实现步骤摘要】
一种改进的基于协同过滤的miRNA-疾病关联预测方法
本专利技术涉及人类生命医学工程,尤其针对与miRNA有关的疾病预测及验证工作,提供一种改进的基于协同过滤的miRNA-疾病关联预测方法。技术背景微小RNA(miRNA)一类短小的内源性非编码RNA,通过碱基序列互补配对的方式对靶标miRNA的表达进行调控。自从在C.elegans中最先发现了miRNAlin-4和let-7,已经确定的miRNA持续增加。最新的miRbase记录了人类1881种miRNA。许多研究已经广泛证明了miRNA在各种生物进程中的重要性。虽然miRNA之间的相互作用机制和对疾病的影响仍处于爆发的初期阶段,但可以肯定的是,miRNA所包含的信息非常丰富,其参与调控分子的机制也是多样的。此外,更多的研究表明,miRNA可能在许多人类复杂疾病的出现中起到关键作用,比如代谢疾病和癌症。例如,miRNA不仅存在于各种组织中,而且在癌症患者的血液中,如黑色素瘤患者的血细胞中已经有51种差异调节的miRNA被鉴定出来,如miR-125b和miR-527可以调节cJun蛋白进而控制黑色素瘤进展。Dk ...
【技术保护点】
一种改进的基于协同过滤的miRNA‑疾病关联预测方法,其特征在于将miRNA‑疾病预测问题看作是一种推荐修补问题;基于已知miRNA疾病关联的二分网络,根据miRNA对相关疾病的已知偏好,推荐使用miRNA,反之亦然;通过整合相似的疾病语义,将miRNA功能相似性纳入网络工作并建立孤立顶点;具体的:首先定义和计算测量一种疾病对另一种疾病的重要性矩阵SIGd;当疾病d(i)认为疾病d(j)更重要时,SIGd(d(i),d(j))的得分更高;当一种疾病在评估潜在相关的miRNA时,会从对miRNA的优先性高度重视的疾病中获得更多的建议;类似地定义和计算SIGr以测量两种miRN ...
【技术特征摘要】
1.一种改进的基于协同过滤的miRNA-疾病关联预测方法,其特征在于将miRNA-疾病预测问题看作是一种推荐修补问题;基于已知miRNA疾病关联的二分网络,根据miRNA对相关疾病的已知偏好,推荐使用miRNA,反之亦然;通过整合相似的疾病语义,将miRNA功能相似性纳入网络工作并建立孤立顶点;具体的:首先定义和计算测量一种疾病对另一种疾病的重要性矩阵SIGd;当疾病d(i)认为疾病d(j)更重要时,SIGd(d(i),d(j))的得分更高;当一种疾病在评估潜在相关的miRNA时,会从对miRNA的优先性高度重视的疾病中获得更多的建议;类似地定义和计算SIGr以测量两种miRNA的重要性;其次使用显著矩阵和相似矩阵作为权重来计算得分;相似性矩阵被定义为表示miRNA或疾病之间的相似性,则miRNA-疾病关联的最终得分是miRNA与疾病的评分分数和该疾病对miRNA的评分评分的总和。2.根据权利要求1所述的一种改进的基于协同过滤的miRNA-疾病关联预测方法,其特征在于具体实现步骤如下:步骤1:从HMDD数据库下载人类已知的miRNA与疾病相关联的数据;构建MatrixA来代表疾病和miRNA之间的关联,当疾病d(i)和miRNAm(j)被验证为相关时,条目A(d(i),m(j))被设置为1;其他未经确认的条目设置为0;变量nm,nd分别表示数据库中miRNA和疾病的数量;根据HMDD数据库,使用的MatrixA有383种疾病和495种miRNA,5430种经实验验证的miRNA-疾病关联;步骤2:建立疾病语义相似模型Ⅰ;通过两个模型来计算疾病之间的语义相似性;使用DAG代表疾病,对于特定疾病D,DAG(D)=(D,T(D),E(D)),其中节点集T(D)包含疾病节点本身及其祖节点,E(D)表示父节点直接到子节点的边集;DAG(D)描述了这种疾病节点及其祖先疾病,而边缘将父节点链接到子节点;疾病D的语义价值定义如下:其中Δ是语义贡献衰落参数;语义贡献随着疾病距离的增加而减小;疾病语义相似性评分是基于疾病DAG之间的共同子图的测量来计算的;语义相似矩阵SS1定义如下:步骤3:建立疾病语义相似性模型Ⅱ;在疾病语义相似模型Ⅰ中,DAG(D)相同深度的不同祖先疾病具有相同的语义贡献;但是,DAG中较不常见的疾病应该比其他疾病更为重要,因为它更具体;定义的疾病语义相似性和疾病D的语义价值的第二个模型计算如下:D′D(d)=-log(thenumberofDAGsincludingd/nd)(5)疾病语义相似性评分测量不同DAG之间共享部分的大小;语义相似性的矩阵SS2定义如下:疾病语义相似度的最终语义相似性矩阵是计算上述两个语义相似性矩阵SS1和SS2的平均值,并定义如下:步骤4:建立miRNA功能相似性矩阵FS;功能相似的miRNA通常参与类似的疾病过程,反之亦然;因此,引入miRNA功能相似性矩阵FS来提高计算模型的准确性;通过测量评估两组miRNA相关疾病的语义相似性,能够得出miRNAU和miRNAV之间的相似性可能性得分;步骤5:基于双向协同过滤对m...
【专利技术属性】
技术研发人员:俞灵慧,颜成钢,刘炳涛,施海南,邵碧尧,李志胜,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。