一种鉴定SL序列反式剪切所形成的基因编码框的方法技术

技术编号:36691526 阅读:24 留言:0更新日期:2023-02-27 19:59
本发明专利技术提供了鉴定SL序列反式剪切所形成的基因编码框的方法,包括:获得基因组所有转录本和已知编码框序列;获取基因组比对文件;基于转录组测序数据,根据比对文件筛选局部比对序列,提取未成功比对上的部分序列;对未成功比对上的序列与指定的SL序列进行比较,若所提取的序列为指定SL序列的末端至少8个碱基序列,确定该序列为SL剪切位点产生的序列;根据比对文件中记录的位置信息推算SL序列的剪切位点,将剪切位点转换成转录组坐标;根据转录组坐标和转录本得到完整的mRNA序列;根据完整的mRNA序列,利用核糖体印迹测序数据,获得完整的mRNA对应的编码框。本发明专利技术解决了现有技术中SL序列的添加引入新的翻译起始位点,使原始基因组注释信息失效的问题。基因组注释信息失效的问题。基因组注释信息失效的问题。

【技术实现步骤摘要】
一种鉴定SL序列反式剪切所形成的基因编码框的方法


[0001]本专利技术涉及生物
,特别是涉及一种鉴定SL序列反式剪切所形成的基因编码框的方法。

技术介绍

[0002]基因编码框(Openreading frame,ORF)在基因组中的注释对于后续的生物学研究和应用至关重要。近年来,研究人员开发了各种算法来预测基因组中的ORF,但是这些算法和工具均是以模式物种的研究为出发点所进行的,虽然在大部分物种的研究中都是适用的,但是一些特殊物种的研究需求则没有被考虑。
[0003]在自然界中,大部分真核生物基因转录后形成信使RNA(mRNA),随后通过顺式剪切去掉内含子(Intron)以后形成最终的成熟mRNA,进行翻译,合成蛋白质。然而,有另外一类真核生物,它们的mRNA成熟过程中除了需要经历内含子的顺式剪切,还需要经历前导(spliced leader,SL)序列的反式剪切。具体来说,在这类生物中,基因转录成mRNA以后,在其5

端进行反式剪切,添加上一段特定的SL序列,然后才能形成成熟的mRNA,进行翻译。由于很多本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种鉴定SL序列反式剪切所形成的基因编码框的方法,其特征在于,包括:获得全部的基因组所有转录本和已知编码框序列;根据所述转录本和已知编码框序列获取所述基因组的比对文件;基于转录组测序数据,根据所述比对文件筛选局部比对的序列,并提取未成功比对上的序列;对所述未成功比对上的序列与指定的SL序列进行比较,若所提取的序列为指定SL序列的末端至少8个碱基序列,则确定该序列为SL剪切位点所产生的序列;根据所述比对文件中所记录的位置信息推算SL序列的剪切位点,并将所述剪切位点转换成转录组坐标;根据所述转录组坐标和所述转录本得到完整的mRNA序列;利用核糖体印迹测序数据,根据所述完整的mRNA序列获得完整的mRNA对应的编码框。2.根据权利要求1所述的一种鉴定SL序列反式剪切所形成的基因编码框的方法,其特征在于,所述位置信息包括:第3列的比对染色体信息和第4列的比对坐标。3.根据权利要求1所述的一种鉴定SL序列反式剪切所形成的基因编码框的方法,其特征在于,所述根据所述转录组坐标和所述转录本得到完整的mRNA序列包括:将SL剪切位点以前的序列删除,并替换成指定的SL序列以得到完整的mRNA序列。4.根据权利要求1所述的一种鉴定SL序列反式剪切所形成的基因编码框的方法,其特征在于,根据基因组中所...

【专利技术属性】
技术研发人员:李午佼孟青朱纯青陈运生
申请(专利权)人:深圳市儿童医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1