【技术实现步骤摘要】
一种鉴定SL序列反式剪切所形成的基因编码框的方法
[0001]本专利技术涉及生物
,特别是涉及一种鉴定SL序列反式剪切所形成的基因编码框的方法。
技术介绍
[0002]基因编码框(Openreading frame,ORF)在基因组中的注释对于后续的生物学研究和应用至关重要。近年来,研究人员开发了各种算法来预测基因组中的ORF,但是这些算法和工具均是以模式物种的研究为出发点所进行的,虽然在大部分物种的研究中都是适用的,但是一些特殊物种的研究需求则没有被考虑。
[0003]在自然界中,大部分真核生物基因转录后形成信使RNA(mRNA),随后通过顺式剪切去掉内含子(Intron)以后形成最终的成熟mRNA,进行翻译,合成蛋白质。然而,有另外一类真核生物,它们的mRNA成熟过程中除了需要经历内含子的顺式剪切,还需要经历前导(spliced leader,SL)序列的反式剪切。具体来说,在这类生物中,基因转录成mRNA以后,在其5
’
端进行反式剪切,添加上一段特定的SL序列,然后才能形成成熟的mRNA ...
【技术保护点】
【技术特征摘要】
1.一种鉴定SL序列反式剪切所形成的基因编码框的方法,其特征在于,包括:获得全部的基因组所有转录本和已知编码框序列;根据所述转录本和已知编码框序列获取所述基因组的比对文件;基于转录组测序数据,根据所述比对文件筛选局部比对的序列,并提取未成功比对上的序列;对所述未成功比对上的序列与指定的SL序列进行比较,若所提取的序列为指定SL序列的末端至少8个碱基序列,则确定该序列为SL剪切位点所产生的序列;根据所述比对文件中所记录的位置信息推算SL序列的剪切位点,并将所述剪切位点转换成转录组坐标;根据所述转录组坐标和所述转录本得到完整的mRNA序列;利用核糖体印迹测序数据,根据所述完整的mRNA序列获得完整的mRNA对应的编码框。2.根据权利要求1所述的一种鉴定SL序列反式剪切所形成的基因编码框的方法,其特征在于,所述位置信息包括:第3列的比对染色体信息和第4列的比对坐标。3.根据权利要求1所述的一种鉴定SL序列反式剪切所形成的基因编码框的方法,其特征在于,所述根据所述转录组坐标和所述转录本得到完整的mRNA序列包括:将SL剪切位点以前的序列删除,并替换成指定的SL序列以得到完整的mRNA序列。4.根据权利要求1所述的一种鉴定SL序列反式剪切所形成的基因编码框的方法,其特征在于,根据基因组中所...
【专利技术属性】
技术研发人员:李午佼,孟青,朱纯青,陈运生,
申请(专利权)人:深圳市儿童医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。