当前位置: 首页 > 专利查询>湖南大学专利>正文

一种基于miRNA-基因调控模块的癌症相关MicroRNA识别方法技术

技术编号:21037474 阅读:26 留言:0更新日期:2019-05-04 06:51
本发明专利技术涉及本发明专利技术涉及生物信息学中的数据挖掘,具体涉及一种通过miRNA‑基因调控模块识别癌症相关的miRNA的方法。本发明专利技术的方法包括基因表达数据的差异比较;基因表达数据和miRNA表达数据的处理;miRNA‑基因交互矩阵的构建;miRNA‑基因相关系数的计算,获取miRNA‑基因相关矩阵,对miRNA进行模糊聚类;合并miRNA‑基因交互矩阵的构建、miRNA‑基因相关矩阵,计算基因与各个miRNA类的绝对平均相关度,根据绝对平均相关度将基因逐一加入miRNA类中,构建miRNA‑基因调控模块;在每个模块中计算miRNA的相关度,根据相关度对其进行排序。其主要流程如图1所示。本发明专利技术可用于获取癌症相关的miRNA以研究其在癌症发展发生过程中的作用机理,筛选癌症早期诊断所用的miRNA生物标记,获取癌症靶向治疗中所需的靶标等。

A cancer-related microRNA recognition method based on microRNA-gene regulatory module

【技术实现步骤摘要】
一种基于miRNA-基因调控模块的癌症相关MicroRNA识别方法
本专利技术涉及生物信息学中的数据挖掘,特别是涉及一种对癌症生物信息学数据的挖掘。具体涉及通过miRNA-基因调控模块识别癌症相关的miRNA的方法。
技术介绍
MicroRNA(miRNA)是一类长约20-24个核苷酸的非编码小RNA,参与细胞增殖、发育和凋亡等多种生物学过程。它们通过识别mRNA非翻译区的互补靶位点,通过切割或翻译抑制来调节基因的表达。越来越多的证据表明,miRNAs在乳腺癌、卵巢癌、肺癌等多种癌症的发生发展过程中起着重要的作用。因此,识别癌症相关的miRNA的可用于癌症诊断、预后和药物靶点的发现。虽然实验方法,如微阵列分析和QRT-PCR已经被用来确定癌症与miRNA的关系。但是,微阵列的假阳性结果和昂贵的实验成本限制了这些方法的应用。而生物信息学的计算方法能够系统地识别与癌症相关的miRNAs,但miRNA涉及到广泛的生物学过程,而且miRNA和基因之间的调控关系可能在不同的生物条件下发生变化,这导致生物信息学的方法仍有许多亟待解决的难题。目前通过生物信息学计算识别与癌症相关的miRNAs的方法本文档来自技高网...

【技术保护点】
1.一种基于基因‑miRNA调控模块的癌症相关MicroRNA识别方法,其特征在于实施步骤为:(1)对基因表达进行差异比较,使用患病样本的基因表达数据集和对照样本(未患病样本)基因表达数据集,通过Edger和Limma两个R语言包,获得有表达差异的基因;(2)对样本数据进行预处理,预处理包括样本匹配、缺失值处理、数据标准化三个步骤,获得miRNA和基因表达数据,其行为miRNA或基因名称,列为样本名;(3)使用miRTarBase数据库中已被验证的miRNA‑基因关系数据,将miRNA‑基因转换成一个数值为0和1的miRNA‑基因交互矩阵,1表示该行对应的miRNA与该列对应基因有调节关系,0...

【技术特征摘要】
1.一种基于基因-miRNA调控模块的癌症相关MicroRNA识别方法,其特征在于实施步骤为:(1)对基因表达进行差异比较,使用患病样本的基因表达数据集和对照样本(未患病样本)基因表达数据集,通过Edger和Limma两个R语言包,获得有表达差异的基因;(2)对样本数据进行预处理,预处理包括样本匹配、缺失值处理、数据标准化三个步骤,获得miRNA和基因表达数据,其行为miRNA或基因名称,列为样本名;(3)使用miRTarBase数据库中已被验证的miRNA-基因关系数据,将miRNA-基因转换成一个数值为0和1的miRNA-基因交互矩阵,1表示该行对应的miRNA与该列对应基因有调节关系,0则表示没有调控关系;(4)在预处理后的miRNA和基因表达数据的基础上,计算miRNA与基因之间的皮尔森相关性,得到miRNA-基因的相关矩阵。在miRNA-基因相关矩阵的基础上,对miRNA进行模糊聚类,将各个miRNA归属到最相近的类中;(5)合并miRNA-基因交互矩阵和miRNA-基因相关矩阵,在合并后的矩阵基础上,计算每个基因与每个miRNA类中的miRNA中的绝对平均相关度,将基因逐一添加到最大平均相关度的miRNA类中,构成一系列miRNA-基因交互模块。(6)在每个模块中,计算模块内每个miRNA与模块内的基因的平均相关度,只考虑相关系数为负的情况,且要求其绝对值大于设定的阈值,根据每个miRNA的相关度值对miRNA进行排序。2.根据权利要求1所述的基于基因-miRNA调控模块的癌症相关MicroRNA识别方法,其特征在于本方法在对基因表达进行差异比较阶段:(1)对患病样本和正常样本的基因顺序进行一致化处理;(2)使用Edger和Limma两个R语言依赖包进行差异比较;(3)从差异比较的结果中获取具有表达差异的基因列表。3.根据权利要求1所述的基于基因-miRNA调控模块的癌症相关MicroRNA识别方法,其特征在于本方法在数据预处理阶段:(1)根据基因表达数据的差异比较结果所得的基因列表,剔除患病样本基因表达数据中那些没有表达差异的数据;(2)对miRNA表达数据、修正后的基因表达数据进行样本一致性处理,使二者的样本名顺序一致;(3)删除患病样本的miRNA...

【专利技术属性】
技术研发人员:雷佳伟王树林
申请(专利权)人:湖南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1