一种用于复杂结构变异的可视化检测方法及系统技术方案

技术编号:40956327 阅读:44 留言:0更新日期:2024-04-18 20:33
本发明专利技术涉及生物信息处理技术领域,公开一种用于复杂结构变异的可视化检测方法及系统,基于若干基于测序的结构变异检测算法构建植物结构变异图谱,避免单一算法无法识别和鉴定所有结构变异类型的缺陷,利用测序深度信号和reads比对信息解析相似结构变异发生区域,根据Kmer提取序列特征确定锚点区域以及得到精确定位SV发生区域,排除重复序列对SV定位的干扰,同时准确判断两个基因组的对应区域是否真实发生了SV,基于二分法和线段树理论,利用相似性原则,精准判定SV碱基级别断点和边界以及对结构变异的断点和类型信息进行可视化,有效提高在植物育种研究中检测复杂结构变异的准确性,有助于全面了解物种基因间的全部遗传变异。

【技术实现步骤摘要】

本专利技术涉及生物信息处理,尤其涉及一种用于复杂结构变异的可视化检测方法及系统


技术介绍

1、为了破译物种适应性的遗传基础,需要全面了解物种基因组间的全部遗传变异。此前,遗传变异的研究重心一直集中在单核苷酸多态性(single nucleotidepolymorphism,snp),因为这些变异在目前的测序技术和检测算法下更容易被准确检测。在近10年研究中,研究者对结构变异(structural variation,sv)的定义和作用有了更深入的了解。sv是指在基因组上产生大规模序列变化和位置变化的dna变异,可能改变蛋白编码基因组成导致功能增强、丧失或新功能产生,或者通过改变基因的调控元件来影响整个调控网络。现在sv是进化过程的重要驱动力已经成为了一种共识,sv比snp和indel(insertion and deletion,插入和缺失)在核苷酸水平上贡献了更多的遗传变异,因此能够解释更多的表型变化,是最主要的遗传力来源。

2、为了研究遗传变异对典型复杂性状的影响,传统gwas(genome-wide associationstudy,全本文档来自技高网...

【技术保护点】

1.一种用于复杂结构变异的可视化检测方法,其特征在于,包括:

2.根据权利要求1所述的用于复杂结构变异的可视化检测方法,其特征在于,所述根据植物参考基因组信息和植物样本组装基因组信息,通过若干基于测序的结构变异检测算法,得到结构变异初始数据集并构建植物结构变异图谱,包括:

3.根据权利要求2所述的用于复杂结构变异的可视化检测方法,其特征在于,所述对大致结构变异发生区域的侧翼序列进行扩增,得到扩增后区域的比对reads,将比对reads与样本组装基因组进行比对得到CIGAR值,根据CIGAR值评估序列比对特征,得到植物样本组装基因组的相似结构变异发生区域,包括:...

【技术特征摘要】

1.一种用于复杂结构变异的可视化检测方法,其特征在于,包括:

2.根据权利要求1所述的用于复杂结构变异的可视化检测方法,其特征在于,所述根据植物参考基因组信息和植物样本组装基因组信息,通过若干基于测序的结构变异检测算法,得到结构变异初始数据集并构建植物结构变异图谱,包括:

3.根据权利要求2所述的用于复杂结构变异的可视化检测方法,其特征在于,所述对大致结构变异发生区域的侧翼序列进行扩增,得到扩增后区域的比对reads,将比对reads与样本组装基因组进行比对得到cigar值,根据cigar值评估序列比对特征,得到植物样本组装基因组的相似结构变异发生区域,包括:

4.根据权利要求3所述的用于复杂结构变异的可视化检测方法,其特征在于,所述基于相似结构变异发生区域,根据植物参考基因组的位点范围和植物样本组装基因组的位点范围,得到侧翼序列扩增阈值,包括:

5.根据权利要求4所述的用于复杂结构变异的可视化检测方法,其特征在于,所述将扩增后的植物样本组装基因组的序列切割成片段与扩增后的植物参考基因组的序列进行kmer比对,确定相似结构变异发生区域...

【专利技术属性】
技术研发人员:周姚崔雪刘小琳孙淼赵启悦尹航
申请(专利权)人:中国科学院植物研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1