鉴定长链非编码核糖核酸-转录因子-基因调控模体的方法技术

技术编号:24013002 阅读:50 留言:0更新日期:2020-05-02 02:23
鉴定长链非编码核糖核酸‑转录因子‑基因调控模体的方法,步骤1,获得基因表达数据;步骤2,基因表达数据的过滤;步骤3,获得生物分子之间的调控关系;步骤4,获得高表达和低表达的长链非编码RNA;步骤5,设计多元线性回归模型;步骤6,结果处理;本发明专利技术可用于鉴定复杂疾病中lncRNA‑TF‑gene调控模体,采用严格的过滤条件获得可靠的lncRNA、TF和gene表达数据,以及可靠的TF‑gene调控关系数据,令后续多元线性回归模型输出的结果更为可靠和可信,降低系统误差。

Identification of long-chain non coding RNA transcription factor gene regulatory motifs

【技术实现步骤摘要】
鉴定长链非编码核糖核酸-转录因子-基因调控模体的方法
本专利技术属于鉴定lncRNA-TF-gene调控模体
,尤其涉及一种有效的基于多元线性回归模型鉴定lncRNA-TF-gene调控模体的方法。
技术介绍
目前,仍有许多重大疾病在威胁着人们的健康、甚至危及生命。癌症无疑是众多重大疾病中最受关注的一种复杂疾病。从全球情况看,约15%的死亡由癌症造成。癌症的诊断和治疗仍然面临巨大挑战。2019年1月我国国家癌症中心在《ChineseJournalofOncology》上刊载了《2019年中国最新癌症报告》。该报告指出:中国平均每分钟有7.5人被确诊罹患癌症。随着我国人口老龄化进程不断加快,同比患癌率不断攀升,癌症患病和死亡人数不断增多。癌症防治工作已引起党、国家、人民群众各方高度重视。一项极具挑战性的世界性难题摆在我们面前:探讨和研究癌症发生、发展的机制,试图找到预防、诊断、监控和治疗癌症的有效方法。癌症是一种与基因突变有关的慢性复杂疾病,包括表观遗传学改变、DNA缺失和增加、拷贝数变异、染色体易位等。非编码RNA是一类不能翻译为蛋白质的本文档来自技高网...

【技术保护点】
1.鉴定长链非编码核糖核酸-转录因子-基因调控模体的方法,其特征在于,包括以下步骤:/n步骤1,获得基因表达数据/n从XENA数据库下载各类癌症相关的基因及其数量、诊断基础数据,癌症基因组图谱提供了33种常见癌症组织和癌旁组织中转录组测序数据,癌症基因组图谱中的这些样本用于分析表达谱,癌症基因组图谱提供的原始RNA-seq测序数据用于计算出lncRNA、TF和gene的表达水平,以每百万个匹配上的读段中匹配到外显子的每一千个碱基上的片段个数的形式来表示表达水平;/n步骤2,基因表达数据的过滤/n对lncRNA、TF和gene进行了过滤,首先,仅保留FPKM表达水平在至少50%样本中大于1的ln...

【技术特征摘要】
1.鉴定长链非编码核糖核酸-转录因子-基因调控模体的方法,其特征在于,包括以下步骤:
步骤1,获得基因表达数据
从XENA数据库下载各类癌症相关的基因及其数量、诊断基础数据,癌症基因组图谱提供了33种常见癌症组织和癌旁组织中转录组测序数据,癌症基因组图谱中的这些样本用于分析表达谱,癌症基因组图谱提供的原始RNA-seq测序数据用于计算出lncRNA、TF和gene的表达水平,以每百万个匹配上的读段中匹配到外显子的每一千个碱基上的片段个数的形式来表示表达水平;
步骤2,基因表达数据的过滤
对lncRNA、TF和gene进行了过滤,首先,仅保留FPKM表达水平在至少50%样本中大于1的lncRNA、TF和gene,在后续分析步骤中舍去不满足过滤条件的生物分子;其次,根据生物分子的类别将整个基因表达数据划分为若干个数据集,分别为:过滤后的lncRNA表达数据、过滤后的转录因子表达数据、过滤后的基因表达数据;
步骤3,获得生物分子之间的调控关系
从TRANSFAC数据库和TRRUST数据库获得TF-gene相互调控关系数据,对于两个数据库获得的数据,取其中的交集,这样的数据更为可靠;对于TF-gene,进一步过滤,TF-gene中的TF必须要表达,也就是TF的FPKM必须在至少一半的样本中的值大于1,gene也必须表达,gene的FPKM必须在至少一半的样本中的值大于1;
步骤4,获得高表达和低表达的长链非编码RNA
把现有的癌症样本按照每个lncRNA的表达水平从低到高的表达值进行排序,每个lncRNA独立分析,对每个lncRNA而言,按照ln...

【专利技术属性】
技术研发人员:李爱民刘雅君刘光明费蓉周红芳黑新宏王磊赵中明
申请(专利权)人:西安理工大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1