基因组性染色体非同源区域的鉴定方法和装置制造方法及图纸

技术编号:29529277 阅读:33 留言:0更新日期:2021-08-03 15:16
本申请提供了一种基因组性染色体非同源区域的鉴定方法和装置。该鉴定方法包括获取XY型或ZW型个体以及XX型或ZZ型个体的二代测序数据,各个体的测序深度为第一测序深度;获取通过三代测序数据组装得到的XY型或ZW型个体的组装基因组;分别计算XY型或ZW型个体以及XX型或ZZ型个体的二代测序数据与组装基因组的比对结果中每个contig或scaffold测序深度,分别记为第二测序深度和第三测序深度;第二测序深度为第一测序深度的1/2~2/3,且第三测序深度小于第一测序深度的1/10的contig或scaffold是性染色体非同源区域。利用两种性别个体的reads深度共同鉴定的非同源区域更准确。

【技术实现步骤摘要】
基因组性染色体非同源区域的鉴定方法和装置
本申请涉及基因组组装领域,具体而言,涉及一种基因组性染色体非同源区域的鉴定方法和装置。
技术介绍
每一个物种的参考基因组序列(referencegenome)的产生都要先通过测序的方法,获得基因组的测序读段(reads),然后再进行从头拼接或组装(英文名称为denovogenomeassembly),最后还原测序物种的各条染色体的序列,即ATGC四种碱基的排列顺序。由于目前的高通量测序技术虽然通量较高,但读段较短,无法直接测序获取一整条染色体的序列。其中,一代测序(Sanger测序)一般可测1kb左右的序列;二代测序(next-generationsequencing),一般可测50~500bp;三代测序虽然可测100kb甚至更长的序列,但现在三代测序技术的测序错误率相对较高。目前基因组测序数据的从头组装过程简单描述为:测序读段(reads)---->重叠群(contig)---->支架(scaffold)---->染色体(chromosome)。具体地,基因组测序产生本文档来自技高网...

【技术保护点】
1.一种基因组性染色体非同源区域的鉴定方法,其特征在于,所述鉴定方法包括:/n获取XY型或ZW型个体的二代测序数据,同时获取XX型或ZZ型个体的二代测序数据,其中,各个体的所述二代测序数据的测序深度为第一测序深度;/n获取XY型或ZW型个体的组装基因组,所述组装基因组通过三代测序数据组装得到;/n计算所述XY型或ZW型个体的所述二代测序数据与所述组装基因组的比对结果中,每个重叠群contig或支架scaffold的测序深度,记为第二测序深度;/n计算所述XX型或ZZ型个体的所述二代测序数据与所述组装基因组的比对结果中,每个重叠群contig或支架scaffold的测序深度,记为第三测序深度;/...

【技术特征摘要】
1.一种基因组性染色体非同源区域的鉴定方法,其特征在于,所述鉴定方法包括:
获取XY型或ZW型个体的二代测序数据,同时获取XX型或ZZ型个体的二代测序数据,其中,各个体的所述二代测序数据的测序深度为第一测序深度;
获取XY型或ZW型个体的组装基因组,所述组装基因组通过三代测序数据组装得到;
计算所述XY型或ZW型个体的所述二代测序数据与所述组装基因组的比对结果中,每个重叠群contig或支架scaffold的测序深度,记为第二测序深度;
计算所述XX型或ZZ型个体的所述二代测序数据与所述组装基因组的比对结果中,每个重叠群contig或支架scaffold的测序深度,记为第三测序深度;
其中,所述第二测序深度为所述第一测序深度的1/2~2/3,且所述第三测序深度小于所述第一测序深度的1/10的重叠群contig或者支架scaffold是所述性染色体非同源区域。


2.根据权利要求1所述的鉴定方法,其特征在于,计算所述第二测序深度和所述第三测序深度包括:
对所述XY型或ZW型个体的所述组装基因组使用比对软件构建索引,得到基因组的索引文件;
对所述XY型或ZW型个体的所述二代测序数据使用比对软件比对回所述XY型或ZW型个体的所述组装基因组上,得到比对的第一bam文件;
对所述XX型或ZZ型个体的所述二代测序数据使用比对软件比对回所述XY型或ZW型个体的所述组装基因组上,得到比对的第二bam文件;
对所述第一bam文件和所述第二bam文件进行排序,并分别计算所述第一bam文件和所述第二bam文件中每条重叠群contig或支架scaffold的测序深度,得到所述第二测序深度和所述第三测序深度。


3.根据权利要求2所述的鉴定方法,其特征在于,所述比对软件为BWA软件。


4.根据权利要求2所述的鉴定方法,其特征在于,采用samtools软件对所述第一bam文件和所述第二bam文件进行排序,并利用所述samtools软件分别计算所述第一bam文件和所述第二bam文件中每条重叠群contig或支架scaffold的测序深度。


5.根据权利要求1至4中任一项所述的鉴定方法,其特征在于,所述第一测序深度为30~35×;所述第二测序深度为15~20×;第三测序深度为0~3×。


6.一种基因组性染色体非同源区域的鉴定装置,其特征在于,所述鉴定装置包括:
第一获取模块,用于获取XY型或ZW型个体的二代测序数据,同时获取XX型或Z...

【专利技术属性】
技术研发人员:周勋赵勇陶琳娜苏亚南王龙
申请(专利权)人:天津诺禾致源生物信息科技有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1