The present invention relates to genomics and bioinformatics technology, discloses a gene mutation causes analysis method and system by reading compared with the reference sequence, and according to the ratio of the distance and the direction of alignment, determining the abnormal reading; the abnormal reading cluster; according to the dynamic programming algorithm will be split in each cluster the reading compared with the reference sequence, to analyze the cause of formation. The invention simplifies the method for analyzing the causes of structural variation and improves the applicable range.
【技术实现步骤摘要】
一种基因变异成因分析方法及系统
本专利技术涉及基因组学及生物信息学技术,尤其涉及一种基因变异成因分析方法及系统。
技术介绍
随着测序成本的下降,使得在全基因组水平研究结构变异变得可能。在全基因水平识别结构变异,有助于揭示癌症的遗传学因素与致病机理,同时也加快了精准医疗的步伐。双末端测序的广泛应用使得在全基因组水平检测结构变异及形成机制变得更加灵敏,这是因为双末端测序数据不仅有读片信息,而且还包含了插入距离信息。针对双末端测序数据,目前对于结构变异的识别主要有四种方法:覆盖率分析方法,基于双末端映射的方法,拆分测序片段对映射以及序列拼接方法。覆盖率分析方法只适用于对非平衡性结构变异类型进行检测,基于覆盖率来识别结构变异的算法主要有CNVnator,SegSeq,ReadDepth和CNV-seq等,这种方法的适用范围有限。
技术实现思路
本专利技术提供一种基因变异成因分析方法及系统,解决现有技术中基因结构变异的识别方法适用范围有限,操作复杂的技术问题。本专利技术的目的是通过以下技术方案实现的:一种基因变异成因分析方法,包括:将读片与参考序列进行比对,并根据比对距离以及比对方向,判断出异常读片;对异常读片进行聚类处理;根据动态规划算法将每个聚类中的拆分读片与参考序列进行比对,以进行成因分析。一种基因变异成因分析系统,包括:异常读片判断模块,用于将读片与参考序列进行比对,并根据比对距离以及比对方向,判断出异常读片;聚类处理模块,用于对异常读片进行聚类处理;成因分析模块,用于根据动态规划算法将每个聚类中的拆分读片与参考序列进行比对,以进行成因分析。本专利技术提供一种基 ...
【技术保护点】
一种基因变异成因分析方法,其特征在于,包括:将读片与参考序列进行比对,并根据比对距离以及比对方向,判断出异常读片;对异常读片进行聚类处理;根据动态规划算法将每个聚类中的拆分读片与参考序列进行比对,以进行成因分析。
【技术特征摘要】
1.一种基因变异成因分析方法,其特征在于,包括:将读片与参考序列进行比对,并根据比对距离以及比对方向,判断出异常读片;对异常读片进行聚类处理;根据动态规划算法将每个聚类中的拆分读片与参考序列进行比对,以进行成因分析。2.根据权利要求1所述的基因变异成因分析方法,其特征在于,所述根据动态规划算法将每个聚类中的拆分读片与参考序列进行比对,以进行成因分析,包括:根据动态规划算法将每个聚类中的拆分读片与参考序列进行比对,识别出该结构变异的间断点;基于所述间断点处序列的同源性判断结构变异对应的成因。3.根据权利要求1所述的基因变异成因分析方法,其特征在于,所述将读片与参考序列进行比对,并根据比对距离以及比对方向,判断出异常读片的步骤,包括:将读片与参考序列进行比对,当至少满足以下一项时,确定为异常读片:映射方向异常;成对读片比对到不同染色体上;插入距离异常。4.根据权利要求1所述的基因变异成因分析方法,其特征在于,所述对异常读片进行聚类处理的步骤包括:首先将异常测序片段对i的比对位置(POS,PNEXT)记为(xi,yi),并计算异常测序片段对i的比对中间值M(xi,yi)=(xi+yi)/2;同一类的异常读片满足M(,)-M(,)<Dmax,其中,Dmax=lmax,lmax=max(l1,l2,l3…ln),ln为第n个读片的插入距离,n为自然数;同一类中的异常读片之间的插入距离还需满足maxij((,)-(,))≤2lmax。5.一种基因变异成因分析系统,其特征...
【专利技术属性】
技术研发人员:魏清晨,
申请(专利权)人:深圳昆腾生物信息有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。