模块标记物挖掘方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:26691856 阅读:41 留言:0更新日期:2020-12-12 02:44
本发明专利技术公开了一种模块标记物挖掘方法、装置、计算机设备及存储介质,所述方法包括:构建初始miDCN网络;构建mDCN网络和mi‑m‑DCN网络,对初始miDCN网络进行拓展,形成拓展miDCN网络;对初始miDCN网络和拓展miDCN网络进行模块挖掘,得到miDCN模块;获取金标准miRNA集合;获取金标准miRNA集合在miDCN模块中的miRNA之间的连接关系;计算金标准miRNA集合中的miRNA与miDCN模块中其余miRNA的度的相似性,将miDCN模块中相似性最高的miRNA作为新标记物。本发明专利技术结合了miRNA与mRNA两个层面的数据,并充分利用二者之间的生物学关系,挖掘复杂疾病的miRNA模块标记物,具有更加全面、系统和可移植性的特点。

【技术实现步骤摘要】
模块标记物挖掘方法、装置、计算机设备及存储介质
本专利技术涉及一种模块标记物挖掘方法、装置、计算机设备及存储介质,属于模块标记物的挖掘领域。
技术介绍
复杂疾病是受多种遗传因子控制的,基于生物学和医学相关理论的推测,认为该类疾病的发病是受多个基因影响的,但每个基因的作用都很微弱,无主效应基因,称该现象为“微效性”,为找到这些微效基因,目前对于该类疾病的模块标物挖掘算法主要集中在基因层面,即mRNA层面。然而,此类分析没有考虑其他因素对于基因表达变化的影响,只是单一层面的分析,不够全面。而该层面的表达变化在一定程度上是受microRNA(通常缩写为miRNA)控制的,miRNA是一类小的、非编码RNA,通过转录后调控其靶基因的表达发挥作用,与其靶基因的表达呈现负相关,故基因的微效性也受其影响。
技术实现思路
有鉴于此,本专利技术提供了一种模块标记物挖掘方法、装置、计算机设备及存储介质,其结合了miRNA与mRNA两个层面的数据,并充分利用二者之间的生物学关系,挖掘复杂疾病的miRNA模块标记物,具有更加全面、系统和可移植性的特点。本专利技术的第一个目的在于提供一种模块标记物挖掘方法。本专利技术的第二个目的在于提供一种模块标记物挖掘装置。本专利技术的第三个目的在于提供一种计算机设备。本专利技术的第四个目的在于提供一种存储介质。本专利技术的第一个目的可以通过采取如下技术方案达到:一种模块标记物挖掘方法,所述模块标记物为复杂疾病的miRNA模块标记物,所述方法包括:基于miRNA表达谱数据,构建初始miDCN网络;基于miRNA表达谱数据和mRNA表达谱数据,构建mDCN网络和mi-m-DCN网络,对初始miDCN网络进行拓展,形成拓展miDCN网络;对初始miDCN网络和拓展miDCN网络进行模块挖掘,得到miDCN模块;获取金标准miRNA集合;其中,所述金标准miRNA集合包括公开数据库中与所研究疾病有关的miRNA;获取金标准miRNA集合在miDCN模块中的miRNA之间的连接关系;计算金标准miRNA集合中的miRNA与miDCN模块中其余miRNA的度的相似性,将miDCN模块中相似性最高的miRNA作为新标记物。进一步的,所述基于miRNA表达谱数据,构建初始miDCN网络,具体包括:根据miRNA表达谱数据,生成x行z列的矩阵;其中,每行表示一个miRNA,每列表示一个样本,设E表示miRNA表达谱数据,S表示所研究疾病的m个样本组成的疾病组表达谱数据,C表示对照组的z-m+1个样本组成的对照组表达谱数据;用i-j表示任意一对miRNA,计算i-j在疾病组表达谱数据S、对照组表达谱数据C中的相关系数r与代表统计学意义的p值,其中在疾病组表达谱数据S中计算所得的相关系数r和p值分别记为rs,i-j及ps,i-j,在对照组表达谱数据C中计算所得的相关系数r和p值分别记为rc,i-j及pc,i-j;若i-j在疾病组表达谱数据S中的p值和i-j在对照组表达谱数据C中的p值至少有一个小于或等于设定阈值,则进行DCi-j分数的计算;将所有具有DC值的miRNA对构建为初始miDCN网络;其中,网络节点是miRNA,边的权重是DC值。进一步的,所述若i-j在疾病组表达谱数据S中的p值和i-j在对照组表达谱数据C中的p值至少有一个小于或等于设定阈值,则进行DCi-j分数的计算,具体包括:若i-j在疾病组表达谱数据S中的p值和i-j在对照组表达谱数据C中的p值均小于或等于设定阈值,则按照下式计算DCi-j分数:DCi-j=|rs,i-j*(1-ps,i-j)-rc,i-j*(1-pc,i-j)|若i-j在疾病组表达谱数据S中的p值小于或等于设定阈值,且i-j在对照组表达谱数据C中的p值大于设定阈值,则按照下式计算DCi-j分数:DCi-j=|rs,i-j*(1-ps,i-j)-rc,i-j*pc,i-j|若i-j在对照组表达谱数据C中的p值小于或等于设定阈值,且i-j在疾病组表达谱数据S中的p值大于设定阈值,则按照下式计算DCi-j分数:DCi-j=|rs,i-j*ps,i-j-rc,i-j*(1-pc,i-j)|。进一步的,所述将所有具有DC值的miRNA对构建为初始miDCN网络,具体包括:构建疾病TBD-miDCN网络;其中,所述疾病TBD-miDCN网络包括所有ps,i-j及pc,i-j均具有统计学意义的miRNA关系对;构建疾病生成-miDCN网络:其中,所述疾病生成-miDCN网络包括所有ps,i-j具有统计学意义的miRNA关系对;构建疾病缺失-miDCN网络:其中,所述疾病缺失-miDCN网络包括所有pc,i-j具有统计学意义的miRNA关系对。进一步的,所述基于miRNA表达谱数据和mRNA表达谱数据,构建mDCN网络和mi-m-DCN网络,对初始miDCN网络进行拓展,形成拓展miDCN网络,具体包括:根据mRNA表达谱数据,生成x行z列的矩阵;其中,每行表示一个miRNA,每列表示一个样本,设E1表示mRNA表达谱数据,S1表示所研究疾病的m个样本组成的疾病组表达谱数据,C1表示对照组的z-m+1个样本组成的对照组表达谱数据;用i1-j1表示任意一对mRNA,计算i1-j1在疾病组表达谱数据S1、对照组表达谱数据C1中的相关系数r与代表统计学意义的p值,其中在疾病组表达谱数据S1中计算所得的相关系数r和p值分别记为rs1,i1-j1及ps1,i1-j1,在对照组表达谱数据C1中计算所得的相关系数r和p值分别记为rc1,i1-j1及pc1,i1-j1;若i1-j1在疾病组表达谱数据S1中的p值和i1-j1在对照组表达谱数据C1中的p值至少有一个小于或等于设定阈值,则进行DCi1-j1分数的计算;将所有具有DC值的mRNA对构建为mDCN网络;其中,网络节点是mRNA,边的权重是DC值;根据miRNA表达谱数据和mRNA表达谱数据,生成x行z列的矩阵;其中,每行表示一个一个miRNA-mRNA对,每列表示一个样本,设E2表示miRNA-mRNA表达谱数据,S2表示所研究疾病的m个样本组成的疾病组表达谱数据,C2表示对照组的z-m+1个样本组成的对照组表达谱数据;用i2-j2表示任意一个miRNA-mRNA对,计算i2-j2在疾病组表达谱数据S2、对照组表达谱数据C2中的相关系数r与代表统计学意义的p值,其中在疾病组表达谱数据S2中计算所得的相关系数r和p值分别记为rs2,i2-j2及ps2,i2-j2,在对照组表达谱数据C2中计算所得的相关系数r和p值分别记为rc2,i2-j2及pc2,i2-j2;若i2-j2在疾病组表达谱数据S2中的p值和i2-j2在对照组表达谱数据C2中的p值至少有一个小于或等于设定阈值,且相关系数r<0,则进行DCi2-j2分数的计本文档来自技高网...

【技术保护点】
1.一种模块标记物挖掘方法,所述模块标记物为复杂疾病的miRNA模块标记物,其特征在于,所述方法包括:/n基于miRNA表达谱数据,构建初始miDCN网络;/n基于miRNA表达谱数据和mRNA表达谱数据,构建mDCN网络和mi-m-DCN网络,对初始miDCN网络进行拓展,形成拓展miDCN网络;/n对初始miDCN网络和拓展miDCN网络进行模块挖掘,得到miDCN模块;/n获取金标准miRNA集合;其中,所述金标准miRNA集合包括公开数据库中与所研究疾病有关的miRNA;/n获取金标准miRNA集合在miDCN模块中的miRNA之间的连接关系;/n计算金标准miRNA集合中的miRNA与miDCN模块中其余miRNA的度的相似性,将miDCN模块中相似性最高的miRNA作为新标记物。/n

【技术特征摘要】
1.一种模块标记物挖掘方法,所述模块标记物为复杂疾病的miRNA模块标记物,其特征在于,所述方法包括:
基于miRNA表达谱数据,构建初始miDCN网络;
基于miRNA表达谱数据和mRNA表达谱数据,构建mDCN网络和mi-m-DCN网络,对初始miDCN网络进行拓展,形成拓展miDCN网络;
对初始miDCN网络和拓展miDCN网络进行模块挖掘,得到miDCN模块;
获取金标准miRNA集合;其中,所述金标准miRNA集合包括公开数据库中与所研究疾病有关的miRNA;
获取金标准miRNA集合在miDCN模块中的miRNA之间的连接关系;
计算金标准miRNA集合中的miRNA与miDCN模块中其余miRNA的度的相似性,将miDCN模块中相似性最高的miRNA作为新标记物。


2.根据权利要求1所述的模块标记物挖掘方法,其特征在于,所述基于miRNA表达谱数据,构建初始miDCN网络,具体包括:
根据miRNA表达谱数据,生成x行z列的矩阵;其中,每行表示一个miRNA,每列表示一个样本,设E表示miRNA表达谱数据,S表示所研究疾病的m个样本组成的疾病组表达谱数据,C表示对照组的z-m+1个样本组成的对照组表达谱数据;
用i-j表示任意一对miRNA,计算i-j在疾病组表达谱数据S、对照组表达谱数据C中的相关系数r与代表统计学意义的p值,其中在疾病组表达谱数据S中计算所得的相关系数r和p值分别记为rs,i-j及ps,i-j,在对照组表达谱数据C中计算所得的相关系数r和p值分别记为rc,i-j及pc,i-j;
若i-j在疾病组表达谱数据S中的p值和i-j在对照组表达谱数据C中的p值至少有一个小于或等于设定阈值,则进行DCi-j分数的计算;
将所有具有DC值的miRNA对构建为初始miDCN网络;其中,网络节点是miRNA,边的权重是DC值。


3.根据权利要求2所述的模块标记物挖掘方法,其特征在于,所述若i-j在疾病组表达谱数据S中的p值和i-j在对照组表达谱数据C中的p值至少有一个小于或等于设定阈值,则进行DCi-j分数的计算,具体包括:
若i-j在疾病组表达谱数据S中的p值和i-j在对照组表达谱数据C中的p值均小于或等于设定阈值,则按照下式计算DCi-j分数:
DCi-j=|rs,i-j*(1-ps,i-j)-rc,i-j*(1-pc,i-j)|
若i-j在疾病组表达谱数据S中的p值小于或等于设定阈值,且i-j在对照组表达谱数据C中的p值大于设定阈值,则按照下式计算DCi-j分数:
DCi-j=|rs,i-j*(1-ps,i-j)-rc,i-j*pc,i-j|
若i-j在对照组表达谱数据C中的p值小于或等于设定阈值,且i-j在疾病组表达谱数据S中的p值大于设定阈值,则按照下式计算DCi-j分数:
DCi-j=|rs,i-j*ps,i-j-rc,i-j*(1-pc,i-j)|。


4.根据权利要求2所述的模块标记物挖掘方法,其特征在于,所述将所有具有DC值的miRNA对构建为初始miDCN网络,具体包括:
构建疾病TBD-miDCN网络;其中,所述疾病TBD-miDCN网络包括所有ps,i-j及pc,i-j均具有统计学意义的miRNA关系对;
构建疾病生成-miDCN网络:其中,所述疾病生成-miDCN网络包括所有ps,i-j具有统计学意义的miRNA关系对;
构建疾病缺失-miDCN网络:其中,所述疾病缺失-miDCN网络包括所有pc,i-j具有统计学意义的miRNA关系对。


5.根据权利要求1所述的模块标记物挖掘方法,其特征在于,所述基于miRNA表达谱数据和mRNA表达谱数据,构建mDCN网络和mi-m-DCN网络,对初始miDCN网络进行拓展,形成拓展miDCN网络,具体包括:
根据mRNA表达谱数据,生成x行z列的矩阵;其中,每行表示一个miRNA,每列表示一个样本,设E1表示mRNA表达谱数据,S1表示所研究疾病的m个样本组成的疾病组表达谱数据,C1表示对照组的z-m+1个样本组成的对照组表达谱数据;
用i1-j1表示任意一对mRNA,计算i1-j1在疾病组表达谱数据S1、对照组表达谱数据C1中的相关系数r与代表统计学意义的p值,其中在疾病组表达谱数据S1中计算所得的相关系数r和p值分别记为rs1,i1-j1及ps1,i1-j1,在对照组表达谱数据C1中计算所得的相关系数r和p值分别记为rc1,i1-j1及pc1,i1-j1;
若i1-j1在疾病组表达谱数据S1中的p值和i1-j1在对照组表达谱数据C1中的p值至少有一个小于或等于设定阈值,则进行DCi1-j1分数的计算;
将所有具有DC值的mRNA对构建为mDCN网络;其中,网络节点是mRNA,边的权重是DC值;
根据miRNA表达谱数...

【专利技术属性】
技术研发人员:王莹莹李克深
申请(专利权)人:暨南大学附属第一医院广州华侨医院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1