一种高通量测序数据的分析方法、试剂盒及分析系统技术方案

技术编号:26175384 阅读:37 留言:0更新日期:2020-10-31 14:08
本发明专利技术涉及基因信息数据处理领域,具体讲,涉及一种高通量测序数据的分析方法、试剂盒及分析系统。本发明专利技术开发了一种新的分析方法用于分析高通量测序数据中的部分串联重复,实现了对部分串联重复的快速、准确鉴定,并提高检测的灵敏度。

【技术实现步骤摘要】
一种高通量测序数据的分析方法、试剂盒及分析系统
本专利技术涉及基因信息数据处理领域,具体讲,涉及一种高通量测序数据的分析方法、试剂盒及分析系统。
技术介绍
传统细胞遗传学方法如核型分析和FISH由于检测灵敏度限制,无法鉴别部分串联重复(partialtandemduplication,PTD)。当前临床检测部分串联重复的主流方法是基于PCR分子技术。逆转录PCR(RT-PCR)可以用于检测部分串联重复,采用琼脂糖凝胶电泳判定阳性或阴性结果,这种方法虽然可快速获取结果,但容易发生污染,干扰对检测结果的分析。定量实时聚合酶链反应(qRT-PCR)能够追踪部分串联重复在白血病细胞中的表达水平,但存在非特异扩增,而且需要在正常人群中建立基本阈值,比较复杂。此外,部分串联重复融合类型多样,不同人群的序列可能存在差异,临床工作中采用qRT-PCR技术往往需要提前获悉人群序列,对于既往未知的新融合位点无法鉴别。长距离反向PCR(LDI-PCR)可用于发现已知和未知的重排,包括部分串联重复,但需要DNA量达1μg,实验操作以及结果分析较为复杂,因此这种诊断方法本文档来自技高网...

【技术保护点】
1.一种高通量测序数据的分析方法,其特征在于,包括:/n获得待测基因的高通量测序数据;/n提取所述待测基因的转录本信息,得到参考序列;/n对所述高通量测序数据进行处理,得到合并数据;/n将所述合并数据与所述参考序列进行对比,找到所述合并数据中的指定外显子;/n将所述指定外显子拼接成为大片段剪切片段,根据所述大片段剪切片段中所述指定外显子的排列顺序判定是否存在部分串联重复;/n查找存在部分串联重复的所述大片段剪切片段,并输出部分串联重复的数据。/n

【技术特征摘要】
1.一种高通量测序数据的分析方法,其特征在于,包括:
获得待测基因的高通量测序数据;
提取所述待测基因的转录本信息,得到参考序列;
对所述高通量测序数据进行处理,得到合并数据;
将所述合并数据与所述参考序列进行对比,找到所述合并数据中的指定外显子;
将所述指定外显子拼接成为大片段剪切片段,根据所述大片段剪切片段中所述指定外显子的排列顺序判定是否存在部分串联重复;
查找存在部分串联重复的所述大片段剪切片段,并输出部分串联重复的数据。


2.根据权利要求1所述的方法,其特征在于,所述获得待测基因的高通量测序数据,包括:
以RNA为模板、采用单端特异引物扩增设计方法得到待测基因的高通量测序数据。


3.根据权利要求1所述的方法,其特征在于,所述提取所述待测基因的转录本信息,得到参考序列,包括:
通过UCSC数据库下载人类参考基因组hg19fasta文件、通过Ensemble数据库提取所述待测基因的转录本信息的gtf文件,将hg19fasta文件和gtf文件对比后,提取待测基因的转录本信息所对应的待测基因的外显子序列,并处理生成fasta文件作为参考序列。


4.根据权利要求1所述的方法,其特征在于,所述对所述高通量测序数据进行处理,得到合并数据,包括:
所述高通量测序数据包括正向测序数据read1和反向测序数据read2,将所述read1和所述read2进行比对后查到所述read1和所述read2的重合部分,所述重合部分位于所述read1的尾部、所述read2的头部,所述read2的数据除去所述重合部分的剩余部分为read2’,将所述read1的数据与所述read2’的数据连接,得到所述合并数据。


5.根据权利要求1所述的方法,其特征在于,所述将所述指定外显子拼接成为大片段剪切片段,包括:
利用外显子的核苷酸顺序,按照头尾相接的规则,将所述指定外显子拼接成为大片段剪切片段。


6.根据权利要求1所述的方法,其特征在于,所述根据所述大片段剪切片段中所述指定外显子的排列顺序判定是否存在部分串联重复,包括:<...

【专利技术属性】
技术研发人员:陈冰戴兵俞浩熊慧
申请(专利权)人:上海交通大学医学院附属瑞金医院苏州云泰生物医药科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1