【技术实现步骤摘要】
基于NGS的染色体平衡易位检测分析系统及应用
本专利技术涉及基因检测生物信息
,特别是涉及一种基于NGS的染色体平衡易位检测分析系统及应用。
技术介绍
染色体平衡易位指的是两条染色体各发生一处断裂并相互交换其无着丝粒片断,形成两条新的衍生染色体称为相互易位。它包括同源和非同源染色体之间的相互易位。相互易位虽然引起染色体片段位置的改变,但仍保留了基因的总数,故称为平衡易位。平衡易位携带者在习惯性流产夫妇中的检出率比一般群体约高10倍。染色体平衡易位患者怀孕的流产率很高,或者说怀孕率很低,解决这个问题的办法就是做第三代试管婴儿,即PGD技术,可以对胚胎的染色体进行筛选,挑选健康的胚胎移植。因此对产前或者胚胎植入前的染色体平衡易位的筛查有助于优生优育。目前传统的对染色体平衡易位的检测分析方法有染色体核型分析和FISH(荧光原位杂交技术),染色体核型分析能够找出分辨率5-10MB的染色体平衡易位在内的重排异常,FISH能够找出分辨率为100KB的染色体平衡易位。但是由于这两种技术都涉及到细胞的培养,需要的时间较长。另外,随着二代测序(NGS)的发展,基于NGS检测染色体平衡易位也逐渐被开发。目前基于NGS检测染色体平衡易位的方法主要有:(1)通过检测结构性变异(SV:structuralvariants)的方法筛查潜在的平衡易位,再通过染色体可视化,比如IGV等进行观察确定。但该方法具有需要后续的人工观察,不能批量处理的缺陷。(2)基于大片段文库的pair-end的两条成对的reads分别比对到不同染色 ...
【技术保护点】
1.一种基于NGS的染色体平衡易位检测分析系统,其特征在于,包括:/n数据获取模块:用于获取NGS检测得到的reads数据;/n基因组比对模块:用于将上述reads分别与人类参考基因组进行比对,得到无法匹配人类参考基因组的第一reads集;/n滑动切割模块:用于将上述第一reads集中各reads进行滑动切割,得到各reads的子序列,并使用等差数列标记编号,得到上述子序列组成的第二reads集;/n短序列比对模块:用于将上述第二reads集中各子序列分别与人类参考基因组进行比对,得到第二reads集中各子序列比对到人类参考基因组上的起始位置数据;以染色体为单位,根据上述起始位置数据进行聚类分析,确定子序列比对到基因组染色体的区域,并通过基因组位置与对应子序列编号的相关性分析和协方差分析,还原母序列在染色体的最佳比对区域,得到两端分别比对到人类参考基因组不同染色体的第三reads集;/n断点分析模块:用于分析上述第三reads集中分别比对到人类参考基因组不同染色体子序列的起始位置数据,计算得到平衡易位断点;/n结果输出模块:用于输出显示所述断点分析模块得到的结果。/n
【技术特征摘要】
1.一种基于NGS的染色体平衡易位检测分析系统,其特征在于,包括:
数据获取模块:用于获取NGS检测得到的reads数据;
基因组比对模块:用于将上述reads分别与人类参考基因组进行比对,得到无法匹配人类参考基因组的第一reads集;
滑动切割模块:用于将上述第一reads集中各reads进行滑动切割,得到各reads的子序列,并使用等差数列标记编号,得到上述子序列组成的第二reads集;
短序列比对模块:用于将上述第二reads集中各子序列分别与人类参考基因组进行比对,得到第二reads集中各子序列比对到人类参考基因组上的起始位置数据;以染色体为单位,根据上述起始位置数据进行聚类分析,确定子序列比对到基因组染色体的区域,并通过基因组位置与对应子序列编号的相关性分析和协方差分析,还原母序列在染色体的最佳比对区域,得到两端分别比对到人类参考基因组不同染色体的第三reads集;
断点分析模块:用于分析上述第三reads集中分别比对到人类参考基因组不同染色体子序列的起始位置数据,计算得到平衡易位断点;
结果输出模块:用于输出显示所述断点分析模块得到的结果。
2.根据权利要求1所述的基于NGS的染色体平衡易位检测分析系统,其特征在于,所述短序列比对模块中,获取可比对到人类参考基因组的子序列编号,按照每条reads中子序列的比对编号及比对到基因组的起始位置进行排序,以染色体为单位,通过相关性及聚类分析结果,得到两端分别比对到人类参考基因组不同染色体的reads。
3.根据权利要求2所述的基于NGS的染色体平衡易位检测分析系统,其特征在于,所述短序列比对模块中,所述聚类分析为:根据某一reads子序列比对到人类参考基因组上的起始位置数据,以染色体为单位,按照各子序列比对到人类参考基因组相同染色体上的起始位置的升序排序后,相邻两起始位置之间最大差值≤5进行聚类分析。
4.根据权利要求3所述的基于NGS的染色体平衡易位检测分析系统,其特征在于,短序列比对模块中,将聚类分析后得到的每个聚类的簇,与其对应子序列的编号进行相关性和协方差分析,筛选相关性为1或者-1的聚类的簇,并对相关性和协方差值的绝对值和进行加权计算,根据最大加权值找出该read对应...
【专利技术属性】
技术研发人员:蒙裕欢,陈美君,严慧,孟博,于世辉,
申请(专利权)人:广州市金域转化医学研究院有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。