【技术实现步骤摘要】
模块标记物挖掘方法、装置、计算机设备及存储介质
本专利技术涉及一种模块标记物挖掘方法、装置、计算机设备及存储介质,属于模块标记物的挖掘领域。
技术介绍
复杂疾病是受多种遗传因子控制的,基于生物学和医学相关理论的推测,认为该类疾病的发病是受多个基因影响的,但每个基因的作用都很微弱,无主效应基因,称该现象为“微效性”,为找到这些微效基因,目前对于该类疾病的模块标物挖掘算法主要集中在基因层面,即mRNA层面。然而,此类分析没有考虑其他因素对于基因表达变化的影响,只是单一层面的分析,不够全面。而该层面的表达变化在一定程度上是受microRNA(通常缩写为miRNA)控制的,miRNA是一类小的、非编码RNA,通过转录后调控其靶基因的表达发挥作用,与其靶基因的表达呈现负相关,故基因的微效性也受其影响。
技术实现思路
有鉴于此,本专利技术提供了一种模块标记物挖掘方法、装置、计算机设备及存储介质,其结合了miRNA与mRNA两个层面的数据,并充分利用二者之间的生物学关系,挖掘复杂疾病的miRNA模块标记物,具有更加全面、系统和可移植性的特点。本专利技术的第一个目的在于提供一种模块标记物挖掘方法。本专利技术的第二个目的在于提供一种模块标记物挖掘装置。本专利技术的第三个目的在于提供一种计算机设备。本专利技术的第四个目的在于提供一种存储介质。本专利技术的第一个目的可以通过采取如下技术方案达到:一种模块标记物挖掘方法,所述模块标记物为复杂疾病的miRNA模块标记物 ...
【技术保护点】
1.一种模块标记物挖掘方法,所述模块标记物为复杂疾病的miRNA模块标记物,其特征在于,所述方法包括:/n基于miRNA表达谱数据,构建初始miDCN网络;/n基于miRNA表达谱数据和mRNA表达谱数据,构建mDCN网络和mi-m-DCN网络,对初始miDCN网络进行拓展,形成拓展miDCN网络;/n对初始miDCN网络和拓展miDCN网络进行模块挖掘,得到miDCN模块;/n获取金标准miRNA集合;其中,所述金标准miRNA集合包括公开数据库中与所研究疾病有关的miRNA;/n获取金标准miRNA集合在miDCN模块中的miRNA之间的连接关系;/n计算金标准miRNA集合中的miRNA与miDCN模块中其余miRNA的度的相似性,将miDCN模块中相似性最高的miRNA作为新标记物。/n
【技术特征摘要】
1.一种模块标记物挖掘方法,所述模块标记物为复杂疾病的miRNA模块标记物,其特征在于,所述方法包括:
基于miRNA表达谱数据,构建初始miDCN网络;
基于miRNA表达谱数据和mRNA表达谱数据,构建mDCN网络和mi-m-DCN网络,对初始miDCN网络进行拓展,形成拓展miDCN网络;
对初始miDCN网络和拓展miDCN网络进行模块挖掘,得到miDCN模块;
获取金标准miRNA集合;其中,所述金标准miRNA集合包括公开数据库中与所研究疾病有关的miRNA;
获取金标准miRNA集合在miDCN模块中的miRNA之间的连接关系;
计算金标准miRNA集合中的miRNA与miDCN模块中其余miRNA的度的相似性,将miDCN模块中相似性最高的miRNA作为新标记物。
2.根据权利要求1所述的模块标记物挖掘方法,其特征在于,所述基于miRNA表达谱数据,构建初始miDCN网络,具体包括:
根据miRNA表达谱数据,生成x行z列的矩阵;其中,每行表示一个miRNA,每列表示一个样本,设E表示miRNA表达谱数据,S表示所研究疾病的m个样本组成的疾病组表达谱数据,C表示对照组的z-m+1个样本组成的对照组表达谱数据;
用i-j表示任意一对miRNA,计算i-j在疾病组表达谱数据S、对照组表达谱数据C中的相关系数r与代表统计学意义的p值,其中在疾病组表达谱数据S中计算所得的相关系数r和p值分别记为rs,i-j及ps,i-j,在对照组表达谱数据C中计算所得的相关系数r和p值分别记为rc,i-j及pc,i-j;
若i-j在疾病组表达谱数据S中的p值和i-j在对照组表达谱数据C中的p值至少有一个小于或等于设定阈值,则进行DCi-j分数的计算;
将所有具有DC值的miRNA对构建为初始miDCN网络;其中,网络节点是miRNA,边的权重是DC值。
3.根据权利要求2所述的模块标记物挖掘方法,其特征在于,所述若i-j在疾病组表达谱数据S中的p值和i-j在对照组表达谱数据C中的p值至少有一个小于或等于设定阈值,则进行DCi-j分数的计算,具体包括:
若i-j在疾病组表达谱数据S中的p值和i-j在对照组表达谱数据C中的p值均小于或等于设定阈值,则按照下式计算DCi-j分数:
DCi-j=|rs,i-j*(1-ps,i-j)-rc,i-j*(1-pc,i-j)|
若i-j在疾病组表达谱数据S中的p值小于或等于设定阈值,且i-j在对照组表达谱数据C中的p值大于设定阈值,则按照下式计算DCi-j分数:
DCi-j=|rs,i-j*(1-ps,i-j)-rc,i-j*pc,i-j|
若i-j在对照组表达谱数据C中的p值小于或等于设定阈值,且i-j在疾病组表达谱数据S中的p值大于设定阈值,则按照下式计算DCi-j分数:
DCi-j=|rs,i-j*ps,i-j-rc,i-j*(1-pc,i-j)|。
4.根据权利要求2所述的模块标记物挖掘方法,其特征在于,所述将所有具有DC值的miRNA对构建为初始miDCN网络,具体包括:
构建疾病TBD-miDCN网络;其中,所述疾病TBD-miDCN网络包括所有ps,i-j及pc,i-j均具有统计学意义的miRNA关系对;
构建疾病生成-miDCN网络:其中,所述疾病生成-miDCN网络包括所有ps,i-j具有统计学意义的miRNA关系对;
构建疾病缺失-miDCN网络:其中,所述疾病缺失-miDCN网络包括所有pc,i-j具有统计学意义的miRNA关系对。
5.根据权利要求1所述的模块标记物挖掘方法,其特征在于,所述基于miRNA表达谱数据和mRNA表达谱数据,构建mDCN网络和mi-m-DCN网络,对初始miDCN网络进行拓展,形成拓展miDCN网络,具体包括:
根据mRNA表达谱数据,生成x行z列的矩阵;其中,每行表示一个miRNA,每列表示一个样本,设E1表示mRNA表达谱数据,S1表示所研究疾病的m个样本组成的疾病组表达谱数据,C1表示对照组的z-m+1个样本组成的对照组表达谱数据;
用i1-j1表示任意一对mRNA,计算i1-j1在疾病组表达谱数据S1、对照组表达谱数据C1中的相关系数r与代表统计学意义的p值,其中在疾病组表达谱数据S1中计算所得的相关系数r和p值分别记为rs1,i1-j1及ps1,i1-j1,在对照组表达谱数据C1中计算所得的相关系数r和p值分别记为rc1,i1-j1及pc1,i1-j1;
若i1-j1在疾病组表达谱数据S1中的p值和i1-j1在对照组表达谱数据C1中的p值至少有一个小于或等于设定阈值,则进行DCi1-j1分数的计算;
将所有具有DC值的mRNA对构建为mDCN网络;其中,网络节点是mRNA,边的权重是DC值;
根据miRNA表达谱数...
【专利技术属性】
技术研发人员:王莹莹,李克深,
申请(专利权)人:暨南大学附属第一医院广州华侨医院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。