同源四倍体基因组分型组装的方法和装置、构建染色体的方法和装置及其应用制造方法及图纸

技术编号:35156735 阅读:117 留言:0更新日期:2022-10-05 10:39
本发明专利技术公开了一种同源四倍体基因组分型组装的方法和装置、构建染色体的方法和装置及其应用。该分型组装的方法包括:步骤1、将样本的测序数据集与近缘二倍体物种的分型后的参考基因组分别进行比对;根据比对结果鉴定基因组变异信息并分型,得到能分型的且与参考基因组相似的测序数据集I、能分型的且与参考基因组不相似的测序数据集II,以及无法分型的测序数据集III;步骤2、提取单碱基深度≥1/2平均深度的测序数据集IV;步骤3、将测序数据集I与测序数据集III组装;将测序数据集II与测序数据集III、测序数据集IV组装。本发明专利技术的方法和装置具有良好的分型组装效果,可以应用于高度同源的同源四倍体样本,而且花费较低,取样容易。取样容易。取样容易。

【技术实现步骤摘要】
同源四倍体基因组分型组装的方法和装置、构建染色体的方法和装置及其应用


[0001]本专利技术涉及生物
,具体地,涉及一种同源四倍体基因组分型组装的方法和装置、构建染色体的方法和装置、通过上述方法和/或装置得到的基因组和染色体序列及其应用。

技术介绍

[0002]基因组组装技术的应用极大地推动了基础生命科学和医学研究领域的发展。传统的基因组组装策略由于忽略同源染色体之间的差异,不可避免的会组装为嵌合体基因组,无法区分同源染色体的等位基因表达的差异,同源染色体修饰差异等。为了打破这种局限性,单体型基因组组装技术顺势而生,已成为高精确基因组组装和精准位点筛选的突破性技术。
[0003]目前针对同源四倍体的基因组分型组装技术有2种思路,但是这两种思路都有自己的局限性。
[0004]第一种方法是基于ALLHiC方法的四倍体基因组分型技术,目前主要成功应用的四倍体主要有甘蔗和苜蓿,首先是根据近缘物种的注释进行,将研究物种分群;第二步是根据构建的同源片段文件,去除同源染色体之间的hic互作关系;第三步是根据修剪后的bam文件,对cont本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种同源四倍体基因组的分型组装方法,包括:步骤1、将同源四倍体基因组样本的测序数据集与所述样本的近缘二倍体物种的分型后的参考基因组分别进行比对;根据比对结果鉴定基因组变异信息并分型,得到能分型的且与参考基因组相似的测序数据集I、能分型的且与参考基因组不相似的测序数据集II,以及无法分型的测序数据集III;步骤2、将所述样本的测序数据集与所述参考基因组中的任意一组进行比对,获得单碱基深度,提取单碱基深度≥1/2平均深度的测序数据集IV;步骤3、将所述测序数据集I与所述测序数据集III合并组装,得到同源四倍体基因组的第一基因组、第二基因组;将测序数据集II与所述测序数据集III、测序数据集IV合并组装,得到同源四倍体基因组的第三基因组、第四基因组。2.根据权利要求1所述的分型组装方法,其特征在于,所述样本的测序数据集包括同源四倍体基因组的长reads。3.根据权利要求2所述的分型组装方法,其特征在于,所述同源四倍体基因组的长reads为三代测序方法得到的长reads。4.根据权利要求3所述的分型组装方法,其特征在于,所述三代测序方法选自Pacbio和/或Nanopore。5.根据权利要求4所述的分型组装方法,其特征在于,所述Pacbio选自HiFi。6.根据权利要求1

5中任一项所述的分型组装方法,其特征在于,步骤1之前还包括:对样本的近缘二倍体物种进行分型,得到参考基因组A和参考基因组a。7.根据权利要求6所述的分型组装方法,其特征在于,步骤2包括:将同源四倍体基因组样本的测序数据长reads与所述参考基因组A或参考基因组a进行比对,获得单碱基深度,提取单碱基深度为1/2

1倍的平均深度的测序数据IV 。8.根据权利要求1

5中任一项所述的分型组装方法,其特征在于,所述基因组变异信息选自SNP、Indel和SV中的一种或多种。9.根据权利要求1

5中任一项所述的分型组装方法,其特征在于,所述分型的方法包括whatshap、longphase中的一种或多种。10.一种根据权利要求1

9中任一项所述的分型组装方法得到的同源四倍体样本的四组基因组。...

【专利技术属性】
技术研发人员:李志民杨伟飞王娟张雪梅李晓波涂成芳刘涛王众司
申请(专利权)人:安诺优达基因科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1