【技术实现步骤摘要】
一种基于miRNA-基因调控模块的癌症相关MicroRNA识别方法
本专利技术涉及生物信息学中的数据挖掘,特别是涉及一种对癌症生物信息学数据的挖掘。具体涉及通过miRNA-基因调控模块识别癌症相关的miRNA的方法。
技术介绍
MicroRNA(miRNA)是一类长约20-24个核苷酸的非编码小RNA,参与细胞增殖、发育和凋亡等多种生物学过程。它们通过识别mRNA非翻译区的互补靶位点,通过切割或翻译抑制来调节基因的表达。越来越多的证据表明,miRNAs在乳腺癌、卵巢癌、肺癌等多种癌症的发生发展过程中起着重要的作用。因此,识别癌症相关的miRNA的可用于癌症诊断、预后和药物靶点的发现。虽然实验方法,如微阵列分析和QRT-PCR已经被用来确定癌症与miRNA的关系。但是,微阵列的假阳性结果和昂贵的实验成本限制了这些方法的应用。而生物信息学的计算方法能够系统地识别与癌症相关的miRNAs,但miRNA涉及到广泛的生物学过程,而且miRNA和基因之间的调控关系可能在不同的生物条件下发生变化,这导致生物信息学的方法仍有许多亟待解决的难题。目前通过生物信息学计算识别与癌症相关 ...
【技术保护点】
1.一种基于基因‑miRNA调控模块的癌症相关MicroRNA识别方法,其特征在于实施步骤为:(1)对基因表达进行差异比较,使用患病样本的基因表达数据集和对照样本(未患病样本)基因表达数据集,通过Edger和Limma两个R语言包,获得有表达差异的基因;(2)对样本数据进行预处理,预处理包括样本匹配、缺失值处理、数据标准化三个步骤,获得miRNA和基因表达数据,其行为miRNA或基因名称,列为样本名;(3)使用miRTarBase数据库中已被验证的miRNA‑基因关系数据,将miRNA‑基因转换成一个数值为0和1的miRNA‑基因交互矩阵,1表示该行对应的miRNA与该列对 ...
【技术特征摘要】
1.一种基于基因-miRNA调控模块的癌症相关MicroRNA识别方法,其特征在于实施步骤为:(1)对基因表达进行差异比较,使用患病样本的基因表达数据集和对照样本(未患病样本)基因表达数据集,通过Edger和Limma两个R语言包,获得有表达差异的基因;(2)对样本数据进行预处理,预处理包括样本匹配、缺失值处理、数据标准化三个步骤,获得miRNA和基因表达数据,其行为miRNA或基因名称,列为样本名;(3)使用miRTarBase数据库中已被验证的miRNA-基因关系数据,将miRNA-基因转换成一个数值为0和1的miRNA-基因交互矩阵,1表示该行对应的miRNA与该列对应基因有调节关系,0则表示没有调控关系;(4)在预处理后的miRNA和基因表达数据的基础上,计算miRNA与基因之间的皮尔森相关性,得到miRNA-基因的相关矩阵。在miRNA-基因相关矩阵的基础上,对miRNA进行模糊聚类,将各个miRNA归属到最相近的类中;(5)合并miRNA-基因交互矩阵和miRNA-基因相关矩阵,在合并后的矩阵基础上,计算每个基因与每个miRNA类中的miRNA中的绝对平均相关度,将基因逐一添加到最大平均相关度的miRNA类中,构成一系列miRNA-基因交互模块。(6)在每个模块中,计算模块内每个miRNA与模块内的基因的平均相关度,只考虑相关系数为负的情况,且要求其绝对值大于设定的阈值,根据每个miRNA的相关度值对miRNA进行排序。2.根据权利要求1所述的基于基因-miRNA调控模块的癌症相关MicroRNA识别方法,其特征在于本方法在对基因表达进行差异比较阶段:(1)对患病样本和正常样本的基因顺序进行一致化处理;(2)使用Edger和Limma两个R语言依赖包进行差异比较;(3)从差异比较的结果中获取具有表达差异的基因列表。3.根据权利要求1所述的基于基因-miRNA调控模块的癌症相关MicroRNA识别方法,其特征在于本方法在数据预处理阶段:(1)根据基因表达数据的差异比较结果所得的基因列表,剔除患病样本基因表达数据中那些没有表达差异的数据;(2)对miRNA表达数据、修正后的基因表达数据进行样本一致性处理,使二者的样本名顺序一致;(3)删除患病样本的miRNA...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。