一种基于三代测序的转录组嵌合体的切分方法、装置制造方法及图纸

技术编号:36556551 阅读:30 留言:0更新日期:2023-02-04 17:11
本发明专利技术涉及一种基于三代测序的转录组嵌合体的切分方法、装置,其方法包括:获取待测转录组的三代测序数据;基于参考基因组,对所述三代测序数据进行比对分析,得到一条或多条reads;将每条reads中的多个片段,与位于参考基因组的多个不同位置的基因片段匹配;根据匹配到的多个不同位置的基因片段是否包含引物序列,判断每条reads是否为嵌合reads;根据每条嵌合reads的引物序列在reads的位置,确定嵌合位点并根据其对所述转录组数据进行切分。本发明专利技术将基因片段和引物序列的位置作为嵌合reads的判据,并结合模糊匹配能更精确地确定嵌合reads,进而实现对转录组的大量嵌合reads的切分。的切分。的切分。

【技术实现步骤摘要】
一种基于三代测序的转录组嵌合体的切分方法、装置


[0001]本专利技术属于生物信息
,涉及转录组测序领域,尤其涉及一种基于三代测序的转录组嵌合体的切分方法、装置。

技术介绍

[0002]纳米孔测序是Oxford Nanopore公司研发的三代测序技术,其原理为使待测的DNA或者RNA分子通过一张带有很多纳米孔的生物膜,膜的两侧带有电压,在DNA或者RNA分子通过纳米孔的过程中,会导致纳米孔位置的电流发生变化,不同碱基(A、T、C、G)引起的电流变化会有不同,因此可以通过识别电流信号的波动趋势来识别待测分子上的碱基,从而达到对DNA或者RNA分子的序列进行测定的目的。
[0003]但是纳米孔测序的数据中,会有一定比例的嵌合体reads,其形成原因有两种:一种为在对DNA分子进行PCR扩增的过程中,由于引物与DNA模版的非特异性结合,会导致错误的将不同的DNA分子连接到一起,成为嵌合体;第二个形成嵌合体的原因是一条DNA分子在通过纳米孔后,有一定的概率其他的DNA分子会立刻通过相同的纳米孔,由于两个DNA分子过孔的间隔太短,使测序仪器本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于三代测序的转录组嵌合体的切分方法,其特征在于,包括:获取待测转录组的三代测序数据;基于参考基因组,对所述三代测序数据进行比对分析,得到一条或多条reads;判断每条reads中的多个片段,是否与位于参考基因组的多个不同位置的基因片段匹配;根据匹配到的多个不同位置的基因片段对应的reads片段内,是否包含引物序列,判断每条reads是否为嵌合reads;根据每条嵌合reads的引物序列在reads的位置,确定嵌合位点并根据其对所述转录组数据进行切分。2.根据权利要求1所述的基于三代测序的转录组嵌合体的切分方法,其特征在于,所述判断每条reads中的多个片段,是否与位于参考基因组的多个不同位置的基因片段匹配包括:将每条reads与参考基因组进行比对,判断所述reads是否与参考基因组中位于不同位置的多个基因的片段匹配。3.根据权利要求1所述的基于三代测序的转录组嵌合体的切分方法,其特征在于,所述根据匹配到的多个不同位置的基因片段对应的reads片段内,是否包含引物序列,判断每条reads是否为嵌合reads包括:基于edlib局部比对算法,将参考引物序列与每条reads做双序列比对:若至少匹配到一条引物序列,则判断所述reads为嵌合reads。4.根据权利要求3所述的基于三代测序的转录组嵌合体的切分方法,其特征在于,所述基于edlib局部比对算法,将参考引物序列与每条reads做双序列比对包括:通过edlib局部比对算法的HW模式在允许错误匹配的情况下,在reads中找到与引物序列最相似的reads片段。5.根据权利要求4所述的基于三代测序的转录组嵌合体的切分方法,其特征在于,所述允许错误匹配包括模糊匹配。6.根据权利要求1至5任一项所述的基于三代测序的转录组嵌合体的切分方法,所述根据每条嵌合reads的引物序列在reads的位置,确定嵌合位点并根据...

【专利技术属性】
技术研发人员:胡江封力王洋汪德鹏
申请(专利权)人:武汉希望组生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1