一种测定待测基因组区域表达水平的方法及系统技术方案

技术编号:10316114 阅读:158 留言:0更新日期:2014-08-13 17:34
本发明专利技术提供了一种检测基因组区域表达水平(RPKM)的方法和系统,采用本发明专利技术,一方面,可以检测出整个基因的表达水平及其所有外显子各自的表达水平;另一个方面可以检测出同一个基因不同的同源异构体的表达水平及其所有外显子各自的表达水平;最后还可以检测出基因组任意指定区间的表达水平。

【技术实现步骤摘要】
一种测定待测基因组区域表达水平的方法及系统
本专利技术涉及生物技术和生物信息学领域,具体涉及一种测定基因组区域表达水平的方法及系统。
技术介绍
生命遗传信息的表达调控既是生物学研究的重点领域,也是揭示生物学各种生命现象的重要手段,尤其是随着21世纪大量物种基因组序列的测定以及大量测序技术推陈出新,使得基因表达定量方面的研究突飞猛进。测序技术也从传统Sanger测序技术,迅速发展为多种第二代高通量测序技术,如罗氏454、IlluminaHiSeq和AB公司的SOLiD,以及第三代的单分子实时DNA测序技术。其中,Sanger测序技术和罗氏454测序技术的测序读长在700-1000bp,Illumina测序技术的测序读长平均100bp左右,而单分子实时DNA测序技术的读长达到了2500-3000bp。第二代测序技术也被称为新一代测序技术(NGS,NextGenerationSequencing),目前主要是Illumina公司出的HiSeq为主,它通过从物种中提取出的RNA转录本中随机进行的短片段测序(通常平均读长50bp、75bp、100bp)获得所测样本的整体表达谱。转录本是通过以连本文档来自技高网...
一种测定待测基因组区域表达水平的方法及系统

【技术保护点】
一种测定待测基因组区域表达水平的方法,其特征在于,包括以下步骤:(1)对待测样本进行测序,获得包含待测基因组区域转录本的转录组测序数据;(2)将获得的转录组测序数据与同一物种的基因组序列进行比对;(3)对定位到基因组的转录组测序读段进行筛选,所述筛选包括去除测序质量≤99.9%的转录组测序读段;(4)将筛选后的转录组测序读段,按照其定位到基因组上的起始位置进行排序,并对排序结果建立索引;(5)根据待测基因组区域的位置信息,构建出计算RPKM的基因注释文件;(6)计算能够映射到基因组上的所有测序读段的总数M;(7)根据上述步骤(5)构建的基因注释文件计算出定位至待测DNA区间上所有测序读段的总数...

【技术特征摘要】
1.一种测定待测基因组区域表达水平的方法,其特征在于,包括以下步骤:(1)对待测样本进行测序,获得包含待测基因组区域转录本的转录组测序数据;(2)将获得的转录组测序数据与同一物种的基因组序列进行比对;(3)对定位到基因组的转录组测序读段进行筛选,所述筛选包括去除测序质量≤99.9%的转录组测序读段;(4)将筛选后的转录组测序读段,按照其定位到基因组上的起始位置进行排序,并对排序结果建立索引;(5)根据待测基因组区域的位置信息,构建出计算RPKM的基因注释文件;(6)计算能够映射到基因组上的所有测序读段的总数M;(7)根据上述步骤(5)构建的基因注释文件计算出定位至待测DNA区间上所有测序读段的总数R;(8)根据上述步骤(5)构建的基因注释文件,计算出待测DNA区间所有被测序读段定位的序列长度L;和(9)根据上述步骤(6)-(8)的计算结果,将步骤(7)得到的R除以步骤(6)得到的M与步骤(8)得到的L乘以109,得待测基因组区域的RPKM值,即为待测基因组区域的表达水平,计算公式如下,其中,所述待测基因组区域包含N个同源异构体,且N≥2;并且,在测定过程中还包括步骤:将各同源异构体的所有外显子进行整合,对于重复的序列区间,仅保留单一序列,从而将同一待测基因组区域中的不同同源异构体的外显子整合成单一序列,将该单一序列的长度作为计算该基因组区域表达水平时的序列长度L。2.如权利要求1所述的方法,其特征在于,N为2、3、4、5、6、7、8、9、10或大于10。3.如权利要求2所述的方法,其特征在于,所述方法还包括结果验证步骤,所述结果验证步骤包括:提取待测样品的总RNA,经过反转录得到其cDNA,以cDNA作为模板进行PCR检测,验证待测基因组区域的表达水平。4.如权利要求3所述的方法,其特征在于,所述待测基因组区域表达水平,为单个基因的表达水平、同一个基因不同的同源异构体的表达水平、所有外显子的表达水平、单个外显子的表达水平以及基因组任意指定区间的表达水平,其中所述基因组任意指定区间包含染色体名称、基因组起始位置和基因组终止位置。5.如权利要求1所述的方法,其特征在于,所述步骤(1)中,所述转录组序列数据由罗氏454测序技术...

【专利技术属性】
技术研发人员:杨力朱闪闪薛尉
申请(专利权)人:中国科学院上海生命科学研究院
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1