当前位置: 首页 > 专利查询>中南大学专利>正文

一种环状RNA与疾病的关联关系预测方法技术

技术编号:19635386 阅读:37 留言:0更新日期:2018-12-01 16:04
本发明专利技术公开了一种环状RNA与疾病的关联关系预测方法,包括步骤1:构建环状RNA高斯核相似性第一矩阵以及疾病高斯核相似性第一矩阵;步骤2:基于递减权重方法计算全新环状RNA与每种疾病、全新疾病与每种环状RNA的关系初始值;步骤3:再构建环状RNA高斯核相似性第二矩阵以及疾病高斯核相似性第二矩阵;步骤4:构建环状RNA相似性矩阵、疾病相似性矩阵;步骤5:采用克罗内克积最小二乘法计算出环状RNA与疾病关联分数矩阵,再获取全新环状RNA与所有疾病的关联分数以及全新疾病与所有环状RNA的关联分数。本发明专利技术通过计算预测模型来对环状RNA疾病的关联关系进行预测,填补当前没有预测环状RNA与疾病关系的计算模型的空缺。

A Prediction Method for the Association between Ring RNA and Disease

The invention discloses a method for predicting the relationship between circular RNA and disease, which includes steps 1: constructing the first matrix of Gauss nuclear similarity of circular RNA and the first matrix of Gauss nuclear similarity of disease; step 2: calculating the initial value of the relationship between the new circular RNA and each disease, the new disease and each circular RNA based on the decreasing weight method. Step 3: Construct the second matrix of Gauss nucleus similarity of circular RNA and the second matrix of Gauss nucleus similarity of disease; Step 4: Construct the similarity matrix of circular RNA and disease; Step 5: Calculate the correlation fraction matrix of circular RNA and disease by the least square method of Crohneck product, and then obtain the new circular RNA and disease. The association score for all diseases and the association score for all new diseases with circular RNA. The present invention predicts the relationship between cyclic RNA diseases by calculating the prediction model, and fills in the vacancy of the current calculation model which does not predict the relationship between cyclic RNA and diseases.

【技术实现步骤摘要】
一种环状RNA与疾病的关联关系预测方法
本专利技术属于系统生物学领域,具体涉及一种基于高斯核相似性和递减权重最小二乘法的环状RNA疾病的关联关系预测方法。
技术介绍
环状RNA作为一类反向剪切产生的非编码RNA,与传统的线性RNA(linearRNA,含5’和3’末端)不同,circRNA分子呈封闭环状结构,不受RNA外切酶影响,表达更稳定且不易降解,但随着高通量深度测序技术的发展,最近的研究表明多种circRNA在动植物的多种组织和细胞系中得到了鉴定。通常,circRNAs通过调控miRNA转录或转录后水平来调剂基因表达,进而在疾病中发挥重要的调控作用。近年来,随着微阵列,RNA序列和其他技术的应用,在包括神经胶质瘤,食管癌,肝癌等广泛疾病中发现了失调的环状RNA。所以,对环状NRA与疾病关系的研究已经成为疾病诊断和治疗机制研究过程中一个重要的组成部分。近年来,通过研究人员和组织的不断努力,环状RNA相关的数据库已经建立起来。CircBase数据库对其他的环状RNA数据库进行了合并和统一处理,给所有的环状RNA建立了统一的ID编号,为后续环状RNA的研究打下了基础。在CircNet数据库中,提供了一些新颖的环状RNA,并给出了其表达谱,亚型信息以及circRNA-miRNA-mRNA之间的调节网络,为进一步研究环状RNA相关的网络信息提供了基础。此外,在TSCD数据库提供的数据中,对环状RNA的组织特异性,特点和功能进行确认。SomamiR2.0提供了癌症相关体细胞突变miRNA以及包括mRNAs,IncRNA和环状RNA在内的内源性竞争RNAs信息。同样,PlantCircNet数据库对植物中的circRNA-miRNA-mRNA网络进行了可视化的描述。CircR2Disease作为第一个环状RNA疾病关联关系的数据库,其中提供了676种环状RNA和100种疾病以及之间存在的725条关联关系。这些都为后续的环状RNA疾病机制的理解和研究提供了重要的基础。鉴于当前对环状RNA在疾病中的作用的认识不断的提高,对当前相关生物医学实验和相关计算模型提出了迫切的需求。但是目前提供的环状RNA提供的数据库中,主要集中在环状RNA本身的研究,通过生物医学实验得到的表达机制,具有周期长,成本高等缺点,不能满足目前需要的快速定位的要求。此外,就我们所知,在环状RNA相关的数据库中,CircR2Disease是到目前为止唯一的其基础数据来源于生物实验验证相关文献的环状RNA和疾病关联关系的数据库。此外,由于传统的生物实验对环状RNA疾病关系进行判定固有的成本高,周期长的缺点,也对环状RNA疾病关系进行预测的计算模型提出迫切的需求。但是到目前为止,还没有相关的计算模型来预测环状RNA与疾病之间的关系。故受制于传统实验的限制,以前对RNA疾病关系通过计算模型预测的认识不足的影响,当前对环状RNA和疾病之间的关联关系还有待于进一步加深。故需要在充分利用已有的生物医学信息,通过计算预测模型来对环状RNA疾病之间关联关系进行预测,为后续的计算模型的发展提供基础,同时也为生物医学实验提供基础指导作用。因此,有必要提出一种有效的环状RNA疾病关联关系预测的方法来弥补当前在这个领域的缺陷。
技术实现思路
本专利技术的目的是提供一种环状RNA与疾病的关联关系预测方法,其充分利用已有的生物医学信息,通过计算预测模型来对环状RNA疾病之间关联关系进行预测,为后续的计算模型的发展提供基础,同时也为生物医学实验提供基础指导作用,填补当前没有预测环状RNA与疾病之间的关系的计算模型的空缺。本专利技术提供一种环状RNA与疾病的关联关系预测方法,包括如下步骤:步骤1:获取环状RNA与疾病的关系邻接矩阵,并基于所述关系邻接矩阵构建环状RNA高斯核相似性第一矩阵以及疾病高斯核相似性第一矩阵;其中,所述关系邻接矩阵为Nc*Nd或Nd*Nc的矩阵,Nc为环状RNA的种类数量,Nd为疾病的种类数量,所述关系邻接矩阵中每个元素的值是依据对应一种环状RNA与一种疾病的关联关系是否是已知的来进行编码;所述环状RNA高斯核相似性第一矩阵为Nc*Nc的矩阵,所述疾病高斯核相似性第一矩阵为Nd*Nd的矩阵;步骤2:基于递减权重方法和所述关系邻接矩阵,并分别根据所述环状RNA高斯核相似性第一矩阵、所述疾病高斯核相似性第一矩阵计算待预测环状RNA与每种疾病、待预测疾病与每种环状RNA的关系初始值;其中,所述待预测环状RNA为所述关系邻接矩阵中与所有的疾病的关联关系均未知的环状RNA,所述待预测疾病为所述关系邻接矩阵中与所有的环状RNA的关联关系均未知的疾病;步骤3:更新所述关系邻接矩阵,再基于更新的关系邻接矩阵构建环状RNA高斯核相似性第二矩阵以及疾病高斯核相似性第二矩阵;其中,将步骤2中每种待预测环状RNA与所有疾病的关系初始值、每种待预测疾病与所有环状RNA的关系初始值来替换原始关系邻接矩阵中对应元素值;步骤4:分别根据所述环状RNA高斯核相似性第一矩阵和环状RNA高斯核相似性第二矩阵、所述疾病高斯核相似性第一矩阵和疾病高斯核相似性第二矩阵构建环状RNA相似性矩阵、疾病相似性矩阵;步骤5:根据更新的所述关系邻接矩阵、环状RNA相似性矩阵、疾病相似性矩阵采用克罗内克积最小二乘法计算出环状RNA与疾病关联分数矩阵,再获取待预测环状RNA与所有疾病的关联分数以及待预测疾病与所有环状RNA的关联分数;其中,关联分数越高,待预测环状RNA与疾病或待预测疾病与环状RNA存在关联关系的几率越大;所述环状RNA与疾病关联分数矩阵为Nc*Nd或Nd*Nc的矩阵,且每个元素值为对应一种环状RNA与一种疾病的关联分数。本专利技术通过现有的数据库中已知的环状RNA与疾病的关联关系构建环状RNA高斯核相似性第一矩阵以及疾病高斯核相似性第一矩阵,再利用递减权重方法来获取待预测环状RNA与所有药物的关系初始值、获取待预测药物与所有环状RNA的关系初始值,进而再重构得到环状RNA高斯核相似性第二矩阵以及疾病高斯核相似性第二矩阵,最后利用克罗内克积最小二乘法计算出环状RNA与疾病关联分数矩阵,从而获取到待预测环状RNA与所有疾病的关联分数、待预测疾病与所有环状RNA的关联分数。其中,所谓关联分数用于表示环状RNA与疾病之间存在关联关系的可能性大小,所谓关联分数越高,对应环状RNA与疾病存在关联关系的几率越大,进而实现了对待预测环状RNA与疾病、待预测药物与环状RNA的关联关系的预测。应当理解,按照关联分数进行排序而获知同一待预测环状RNA中哪些疾病与其最有可能存在关联关系,同时按照关联分数进行排序而获知同一待预测疾病中哪些环状RNA与其最有可能存在关联关系。应当说明,本专利技术得到环状RNA与疾病关联分数矩阵后,对非待预测药物以及非待预测环状RNA对应的关联分数不进行分析或处理,因为非待预测药物以及非待预测环状RNA在现有数据库中是已知环状RNA-药物的关联关系。关系邻接矩阵中每个元素的值是依据对应一种环状RNA与一种疾病的关联关系是否是已知的来进行编码时,是已知和未知时分别采用不同符号表示,例如数值编码,已知时对应元素值为1;未知时对应元素值为0。进一步优选,步骤5中所述环状RNA与疾病关联分数矩阵的计算公式如本文档来自技高网
...

【技术保护点】
1.一种环状RNA与疾病的关联关系预测方法,其特征在于:包括如下步骤:步骤1:获取环状RNA与疾病的关系邻接矩阵,并基于所述关系邻接矩阵构建环状RNA高斯核相似性第一矩阵以及疾病高斯核相似性第一矩阵;其中,所述关系邻接矩阵为Nc*Nd或Nd*Nc的矩阵,Nc为环状RNA的种类数量,Nd为疾病的种类数量,所述关系邻接矩阵中每个元素的值是依据对应一种环状RNA与一种疾病的关联关系是否是已知的来进行编码;所述环状RNA高斯核相似性第一矩阵为Nc*Nc的矩阵,所述疾病高斯核相似性第一矩阵为Nd*Nd的矩阵;步骤2:基于递减权重方法和所述关系邻接矩阵,并分别根据所述环状RNA高斯核相似性第一矩阵、所述疾病高斯核相似性第一矩阵计算待预测环状RNA与每种疾病、待预测疾病与每种环状RNA的关系初始值;其中,所述待预测环状RNA为所述关系邻接矩阵中与所有的疾病的关联关系均未知的环状RNA,所述待预测疾病为所述关系邻接矩阵中与所有的环状RNA的关联关系均未知的疾病;步骤3:更新所述关系邻接矩阵,再基于更新的关系邻接矩阵构建环状RNA高斯核相似性第二矩阵以及疾病高斯核相似性第二矩阵;其中,将步骤2中每种待预测环状RNA与所有疾病的关系初始值、每种待预测疾病与所有环状RNA的关系初始值来替换原始关系邻接矩阵中对应元素值;步骤4:分别根据所述环状RNA高斯核相似性第一矩阵和环状RNA高斯核相似性第二矩阵、所述疾病高斯核相似性第一矩阵和疾病高斯核相似性第二矩阵构建环状RNA相似性矩阵、疾病相似性矩阵;步骤5:根据更新的所述关系邻接矩阵、环状RNA相似性矩阵、疾病相似性矩阵采用克罗内克积最小二乘法计算出环状RNA与疾病关联分数矩阵,再获取待预测环状RNA与所有疾病的关联分数以及待预测疾病与所有环状RNA的关联分数;其中,关联分数越高,待预测环状RNA与疾病或待预测疾病与环状RNA存在关联关系的几率越大;所述环状RNA与疾病关联分数矩阵为Nc*Nd或Nd*Nc的矩阵,且每个元素值为对应一种环状RNA与一种疾病的关联分数。...

【技术特征摘要】
1.一种环状RNA与疾病的关联关系预测方法,其特征在于:包括如下步骤:步骤1:获取环状RNA与疾病的关系邻接矩阵,并基于所述关系邻接矩阵构建环状RNA高斯核相似性第一矩阵以及疾病高斯核相似性第一矩阵;其中,所述关系邻接矩阵为Nc*Nd或Nd*Nc的矩阵,Nc为环状RNA的种类数量,Nd为疾病的种类数量,所述关系邻接矩阵中每个元素的值是依据对应一种环状RNA与一种疾病的关联关系是否是已知的来进行编码;所述环状RNA高斯核相似性第一矩阵为Nc*Nc的矩阵,所述疾病高斯核相似性第一矩阵为Nd*Nd的矩阵;步骤2:基于递减权重方法和所述关系邻接矩阵,并分别根据所述环状RNA高斯核相似性第一矩阵、所述疾病高斯核相似性第一矩阵计算待预测环状RNA与每种疾病、待预测疾病与每种环状RNA的关系初始值;其中,所述待预测环状RNA为所述关系邻接矩阵中与所有的疾病的关联关系均未知的环状RNA,所述待预测疾病为所述关系邻接矩阵中与所有的环状RNA的关联关系均未知的疾病;步骤3:更新所述关系邻接矩阵,再基于更新的关系邻接矩阵构建环状RNA高斯核相似性第二矩阵以及疾病高斯核相似性第二矩阵;其中,将步骤2中每种待预测环状RNA与所有疾病的关系初始值、每种待预测疾病与所有环状RNA的关系初始值来替换原始关系邻接矩阵中对应元素值;步骤4:分别根据所述环状RNA高斯核相似性第一矩阵和环状RNA高斯核相似性第二矩阵、所述疾病高斯核相似性第一矩阵和疾病高斯核相似性第二矩阵构建环状RNA相似性矩阵、疾病相似性矩阵;步骤5:根据更新的所述关系邻接矩阵、环状RNA相似性矩阵、疾病相似性矩阵采用克罗内克积最小二乘法计算出环状RNA与疾病关联分数矩阵,再获取待预测环状RNA与所有疾病的关联分数以及待预测疾病与所有环状RNA的关联分数;其中,关联分数越高,待预测环状RNA与疾病或待预测疾病与环状RNA存在关联关系的几率越大;所述环状RNA与疾病关联分数矩阵为Nc*Nd或Nd*Nc的矩阵,且每个元素值为对应一种环状RNA与一种疾病的关联分数。2.根据权利要求1所述的方法,其特征在于:步骤5中所述环状RNA与疾病关联分数矩阵的计算公式如下:其中,式中,为环状RNA与疾病关联分数矩阵,vec为向量符号,K为环状RNA-疾病的核矩阵,σ为正则化参数,I为单位矩阵,Kc为环状RNA相似性矩阵,Kd为疾病相似性矩阵,∨c和∨d分别为环状RNA相似性矩阵Kc和疾病相似性矩阵Kd的特征向量的酉矩阵,∧c和∧d为环状RNA相似性矩阵Kc和疾病相似性矩阵Kd的特征值对角矩阵,T为转置符号,为克罗内克积。3.根据权利要求1所述的方法,其特征在于:步骤2中待预测环状RNA与每种疾病、待预测疾病与每种环状RNA的关系初始值的计算过程如下:S1:获取每个待预测环状RNA的环状RNA邻居集合、每个待预测疾病的疾病邻居集合;其中,将环状RNA高斯核相似性第一矩阵中所述待预测环状RNA与其他环状RNA的高斯核相似值按照从高到低进行排序,其中排名前k(ci)个的环状RNA构成所述待预测环状RNA的环状RNA邻居集合,k(ci)为自然数;将疾病高斯核相似性第一矩阵中所述待预测疾病与其他疾病的高斯核相似值从高到低排序,其中排名前k(dj)个的疾病构成所述待预测疾病的疾病邻居集合,k(dj)为自然数;S2:按照如下公式依次计算每种待预测环状RNA与每种疾病的关系初始值、每种待预测疾病与每种环状RNA的关系初始值;其中,一种待预测环状RNA与一种疾病的关系初始值的计算公式如下:式中,Uij为待预测环状RNAci与疾病dj的关系初始值,ci表示环状RNA集合中第i个环状RNA,dj表示疾病集合中第j个疾病,N(ci)为待预测环状RNAci的环状RNA邻居集合,为环状RNA高斯核相似性第一矩阵KOld,c中第i行l列的元素,ylj为所述关系邻接矩阵...

【专利技术属性】
技术研发人员:王建新严承李敏张雅妍
申请(专利权)人:中南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1