一种基于DNA链特异性的长链非编码RNA的综合鉴定方法技术

技术编号:41510712 阅读:30 留言:0更新日期:2024-05-30 14:49
本发明专利技术公开了一种基于DNA链特异性的长链非编码RNA的综合鉴定方法,包括:构建目标转录本筛选池子;为强化转录本的lncRNA忠实性,特别放低了isoforms的转录水平,综合物种基因组特征、序列内在特征和蛋白结构域特征评估DNA链特异性编码潜力,并开创地结合一级序列和二级结构考察转录本中潜在的其他非编码RNA序列;最后根据候选lncRNA的核酸序列分析其基本特征。本方法适用于分析所有生物类型所有样本的RNA‑seq数据,普适性强;最大程度地使转录本贴合lncRNA基本特征,解决了现有技术中lncRNA鉴定方法不全面不忠实的问题。与现有技术相比,本发明专利技术大幅提高了挖掘lncRNA转录本能力和准确度,为后续深入开展lncRNA的功能及机制研究提供技术支撑与参考方法。

【技术实现步骤摘要】

本专利技术涉及高通量测序和生物信息技术分析领域,尤其涉及一种基于dna链特异性的长链非编码rna的综合鉴定方法。


技术介绍

1、长链非编码rna(long noncoding rna,lncrna)是一类长度大于200个核苷酸(nt)的生物分子,它们最初被认为是基因组的转录垃圾。近年来,通过比较基因组学、进化生物学、分子生物学和生物化学等方法,lncrna已经被发现有如下特征:广泛的类型和起源机制;转录水平低;缺乏或丧失蛋白质编码能力;可检测的序列保守性低;组织乃至细胞特异性强;分子功能和生物功能多样。一系列的序列、结构、功能乃至进化特征可以很好的将lncrna基因与其他基因,尤其是蛋白编码基因区分开来。已有很多研究表明,lncrna不仅与动物的生殖发育、多器官建成、代谢衰老和多种疾病进程紧密相关,也在植物的生长发育、信号转导,以及对生物和非生物胁迫的响应中扮演重要的角色。显然,系统地鉴定和筛选lncrna是开展lncrna研究的必要条件和重要基础。

2、随着下一代测序(next-generation sequencing,ngs)技术的发展和本文档来自技高网...

【技术保护点】

1.一种基于DNA链特异性的长链非编码RNA的综合鉴定方法,包括如下步骤:

2.如权利要求1所述的综合鉴定方法,其特征在于,步骤S1包括:

3.如权利要求2所述的综合鉴定方法,其特征在于,步骤S1.2中利用fastqc和fastx_toolkit软件去除低质量reads和reads中的接头;步骤1.4中使用bowtie2软件构建基因组检索索引,然后联合软件Tophat2与cufflinks将reads读段回帖至基因组并完成转录组组装。

4.如权利要求1所述的综合鉴定方法,其特征在于,在步骤S2中,基于物种基因组特征的评估方法是:利用CPAT软件计算目标...

【技术特征摘要】

1.一种基于dna链特异性的长链非编码rna的综合鉴定方法,包括如下步骤:

2.如权利要求1所述的综合鉴定方法,其特征在于,步骤s1包括:

3.如权利要求2所述的综合鉴定方法,其特征在于,步骤s1.2中利用fastqc和fastx_toolkit软件去除低质量reads和reads中的接头;步骤1.4中使用bowtie2软件构建基因组检索索引,然后联合软件tophat2与cufflinks将reads读段回帖至基因组并完成转录组组装。

4.如权利要求1所述的综合鉴定方法,其特征在于,在步骤s2中,基于物种基因组特征的评估方法是:利用cpat软件计算目标物种基因组特异的coding probability cutoffscore和performance,进而对转录本进行筛选,保留非编码转录本。

5.如权利要求1所述的综合鉴定方法,其特征在于,在步骤s2中,基于序列内在特征的评估方法包括:使用cpc2软件考察序列的fickett score、orf长度、orf完整性和等电点,计算coding probability得分;使用lgc软件计算序列的gc含量和orf长度,判定转录本的coding potential得分;同时满足coding prob...

【专利技术属性】
技术研发人员:韩生成张凡凡王英典郑凯峰
申请(专利权)人:北京师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1