一种多倍体基因组survey的方法技术

技术编号:24882298 阅读:55 留言:0更新日期:2020-07-14 18:08
一种多倍体基因组survey的方法,所属分子生物学技术领域,本发明专利技术方法通过更新的算法,能准确获得多倍体物种的基因组特征信息。具体由以下步骤完成:基因组DNA提取与测序;基因组测序产出数据质量控制;多倍体基因组特征评估;多倍体基因组倍性变化分析。本方法在设计的时已考虑到了多倍体物种基因组序列之间复杂关系,专门设计了针对多倍体物种基因组大小、杂合率、同源率的分析方法,能有效避免现有方法对多倍体基因组评估错误率高的问题。本方法理论上可以对任何真核多倍体基因组进行survey分析,因而本方法可以在多倍体基因组评估上得到广泛应用,为多倍体基因组大小、杂合率、同源率评估等应用提供了准确有效的分析方法。

【技术实现步骤摘要】
一种多倍体基因组survey的方法
本专利技术属于分子生物学
,具体涉及一种多倍体基因组survey的方法。
技术介绍
基因组survey是指在没有参考基因组对物种基因组特征进行评估的情况下,利用二代测序技术,通过统计K-mer频率,有效的评估基因组大小、杂合度、重复序列比例等信息,为后续基因组denovo组装(从头组装)提供参考。现在的大型基因组测序普遍使用全基因组鸟枪法(Whole-Genome-Shotgun,WGS),其中不乏高重复和高杂合的基因组。这类基因组将显著增加基因组组装的难度,导致结果的不完整和碎片化,并且仅根据测序得到的重复序列信息无法准确推算该物种基因组大小。此外,当基因组有极高的重复序列和杂合序列比例时,或该物种为多倍体物种时,直接使用当下的组装算法很难得到理想的组装结果。因此在基因组测序前,对物种基因组特征进行准确评估以便制定合适的测序和组装方案十分重要。估算物种基因组大小通常有三方法:一是用流式细胞仪检测细胞核内DNA的总量;二是用核型分析的方法,在显微镜下识别中期染色体数量、倍性以及大小,实现染色体长度和染色体大小的相对定量;三是基于K-mer分析,通过二代基因组测序估算基因组大小等信息。K-mer分析因其成本低,难度低,能得到更多分析结果,已成为目前获取基因组信息使用最多的技术手段。随着高通量测序技术的快速发展和测序成本的迅速降低,基因组测序的需求不断增加。为了应对越来越多的多倍体物种测序的需求,我们需要对更多更复杂的多倍体物种基因组特征进行评估。但是目前的基因组特征评估方法仅对二倍体物种有较高准确度,而多倍体物种的基因组评估结果与真实结果往往有很大差异,因此急需一种可靠的多倍体基因组survey方法。
技术实现思路
为了克服目前基因组特征评估方法对多倍体物种评估准确率低的问题,本专利技术提供了一种多倍体基因组survey方法,能准确评估多倍体物种的基因组特征,提高评估准确率,其具体技术方案如下:一种多倍体基因组survey的方法,包含如下步骤:步骤1,基因组DNA提取与测序:(1)选取生物个体的肌肉组织,切取5-20mg组织到2ml离心管中,用手术剪剪碎,再用匀浆机打碎;(2)加入400ulACL溶液和20ul的蛋白酶K;(3)震荡1~2min使之混匀,然后置于55℃放置3h,在此期间每半小时取出混匀,使之充分裂解,裂解完全的样品为澄清透明;(4)取出样品,待降至室温后轻轻震荡均匀;(5)在经过处理好的样品中,依次加入300ulExt溶液和300ulAB溶液,用力摇匀后进行离心处理,使溶液分层,上层为蓝色的抽提层,下层为透明水相,两层中间会有部分沉淀层,DNA在下层水相中;(6)将枪头穿过上层溶液,深入到下层溶液,将下层溶液仔细吸出到吸附柱中,尽量避免吸到上层溶液和中间层的沉淀;(7)将吸附柱放入离心机,进行离心处理,然后取下吸附柱,倒掉收集管中的废液;(8)将吸附柱放回收集管中,加入500ul漂洗液,进行离心处理;(9)重复步骤(8)一次;(10)取下吸附柱,弃去收集管中的废液,将吸附柱放回收集管中,进行离心处理,以除去残留漂洗液;(11)将柱放入新的洁净离心管中,在柱中央加入50~100ul洗脱缓冲液,室温放置2~3min,然后进行离心处理,离心管中的液体即为基因组DNA,样品置于-4℃或-20℃保存;(12)利用NanoDrop-1000浓度测试仪准确测定样本DNA浓度和OD比值(A260/A280、A260/A230);要求样品DNA浓度在100ng/ul以上,样品DNA体积至少60ul,A260/A280值在1.8~2.0,A260/A230值在2.0~2.4;(13)质控合格的样品使用IllunimaHiseq2000平台进行高通量测序;步骤2,基因组测序产出数据质量控制:基于多倍体基因组二代高通量测序数据的质量控制:使用fastqc软件对测序数据质量进行评估,保证测序数据符合后续的分析需求;使用Trimmomatic软件过滤低质量的reads,即任何一端含有接头的双端reads;单端reads中未测出碱基超过该reads长度10%的双端reads;单端reads中低质量碱基数超过该reads碱基数50%的双端reads;随机抽取10000对双端reads用blast软件与NT数据库(NucleotideSequenceDatabase)比对,确保测序的样品没有明显污染;步骤3,多倍体基因组特征评估:基于高质量的多倍体物种基因组测序数据的K-mer分析:利用步骤2质量控制方法获得的高质量测序数据,用K=17参数计算K-mer数量和K-mer频率分布情况,公式计算多倍体物种的基因组大小,其中,G:估算的基因组大小;nbase:高质量测序数据中的总碱基数;L:一条read的长度;K:K-mer中的参数K;CKmer:多倍体主峰对应的K-mer深度;同时将K小于2的情况认为是错误,用公式Grevise=G×(1-ErrorRate)对基因组大小进行校正,其中,Grevise:矫正后基因组大小;ErrorRate:错误率;用公式计算多倍体物种基因组杂合度,其中,φ:估算的基因组杂合度;a1/2:多倍体主峰二分之一位置包含的K-mer比例;步骤4,多倍体基因组倍性变化分析:基于渐渗模型的基因组倍性变化分析:利用渐渗模型公式计算多倍体物种基因组同源率和二倍化率,其中,M:基因组K-mer总数;N:重复区域K-mer总数;ɑ同源区域所占比率;1-ɑ:二倍化率;β:二倍体重复序列所占比例;k:基因组杂合率;所述步骤1(5)中,所述离心参数设置为12000rmp,离心5~6min;所述步骤1(7)中,所述离心参数设置为8000rmp离心1~2min;所述步骤1(8)中,所述离心参数设置为8000rmp离心1~2min;所述步骤1(10)中,所述离心参数设置为12000rmp,室温离心1~2min;所述步骤1(11)中,所述离心参数设置为12000rmp,室温离心1~2min。本专利技术的一种多倍体基因组survey方法,与现有技术相比,有益效果为:一、本专利技术方法设计的时已考虑到了多倍体物种基因组序列之间复杂关系,专门设计了针对多倍体物种基因组大小、杂合率的分析方法,能有效解决现有方法评估多倍体基因组评估准确率低的问题;二、本专利技术创造性地提出并构建了多倍体基因组的渐渗模型。基于所述步骤4中,渐渗模型的基因组被性分析可以计算多倍体基因组同源率和二倍化率,填补了现有分析方法中这一结果的空缺三、本方法理论上可以对任何真核多倍体基因组进行survey分析,因而本方法可以在多倍体基因组评估上得到广泛应用,为多倍体基因组大小、杂合率、同源率评估等应用提供了准确有效的分析方法。四、与现有技术相比,本方法提高了90%的评估准确率。...

【技术保护点】
1.一种多倍体基因组survey的方法,其特征在于,包含如下步骤:/n步骤1,基因组DNA提取与测序:/n(1)选取生物个体的肌肉组织,切取5-20mg组织到2ml离心管中,用手术剪剪碎,再用匀浆机打碎;/n(2)加入400ulACL溶液和20ul的蛋白酶K;/n(3)震荡1~2min使之混匀,然后置于55℃放置3h,在此期间每半小时取出混匀,使之充分裂解,裂解完全的样品为澄清透明;/n(4)取出样品,待降至室温后轻轻震荡均匀;/n(5)在经过处理好的样品中,依次加入300ul Ext溶液和300ulAB溶液,用力摇匀后进行离心处理,使溶液分层,上层为蓝色的抽提层,下层为透明水相,两层中间会有部分沉淀层,DNA在下层水相中;/n(6)将枪头穿过上层溶液,深入到下层溶液,将下层溶液仔细吸出到吸附柱中,尽量避免吸到上层溶液和中间层的沉淀;/n(7)将吸附柱放入离心机,进行离心处理,然后取下吸附柱,倒掉收集管中的废液;/n(8)将吸附柱放回收集管中,加入500ul漂洗液,进行离心处理;/n(9)重复步骤(8)一次;/n(10)取下吸附柱,弃去收集管中的废液,将吸附柱放回收集管中,进行离心处理,以除去残留漂洗液;/n(11)将柱放入新的洁净离心管中,在柱中央加入50~100ul洗脱缓冲液,室温放置2~3min,然后进行离心处理,离心管中的液体即为基因组DNA,样品置于-4℃或-20℃保存;/n(12)利用NanoDrop-1000浓度测试仪准确测定样本DNA浓度和OD比值,即A260/A280、A260/A230;要求样品DNA浓度在100ng/ul以上,样品DNA体积至少60ul,A260/A280值在1.8~2.0,A260/A230值在2.0~2.4;/n(13)质控合格的样品使用Illunima Hiseq 2000平台进行高通量测序;/n步骤2,基因组测序产出数据质量控制:/n基于多倍体基因组二代高通量测序数据的质量控制:使用fastqc软件对测序数据质量进行评估,保证测序数据符合后续的分析需求;/n使用Trimmomatic软件过滤低质量的reads,即任何一端含有接头的双端reads;单端reads中未测出碱基超过该reads长度10%的双端reads;单端reads中低质量碱基数超过该reads碱基数50%的双端reads;/n随机抽取10000对双端reads用blast软件与NT数据库(Nucleotide SequenceDatabase)比对,确保测序的样品没有明显污染;/n步骤3,多倍体基因组特征评估:/n基于高质量的多倍体物种基因组测序数据的K-mer分析:利用步骤2质量控制方法获得的高质量测序数据,用K=17参数计算K-mer数量和K-mer频率分布情况,公式...

【技术特征摘要】
1.一种多倍体基因组survey的方法,其特征在于,包含如下步骤:
步骤1,基因组DNA提取与测序:
(1)选取生物个体的肌肉组织,切取5-20mg组织到2ml离心管中,用手术剪剪碎,再用匀浆机打碎;
(2)加入400ulACL溶液和20ul的蛋白酶K;
(3)震荡1~2min使之混匀,然后置于55℃放置3h,在此期间每半小时取出混匀,使之充分裂解,裂解完全的样品为澄清透明;
(4)取出样品,待降至室温后轻轻震荡均匀;
(5)在经过处理好的样品中,依次加入300ulExt溶液和300ulAB溶液,用力摇匀后进行离心处理,使溶液分层,上层为蓝色的抽提层,下层为透明水相,两层中间会有部分沉淀层,DNA在下层水相中;
(6)将枪头穿过上层溶液,深入到下层溶液,将下层溶液仔细吸出到吸附柱中,尽量避免吸到上层溶液和中间层的沉淀;
(7)将吸附柱放入离心机,进行离心处理,然后取下吸附柱,倒掉收集管中的废液;
(8)将吸附柱放回收集管中,加入500ul漂洗液,进行离心处理;
(9)重复步骤(8)一次;
(10)取下吸附柱,弃去收集管中的废液,将吸附柱放回收集管中,进行离心处理,以除去残留漂洗液;
(11)将柱放入新的洁净离心管中,在柱中央加入50~100ul洗脱缓冲液,室温放置2~3min,然后进行离心处理,离心管中的液体即为基因组DNA,样品置于-4℃或-20℃保存;
(12)利用NanoDrop-1000浓度测试仪准确测定样本DNA浓度和OD比值,即A260/A280、A260/A230;要求样品DNA浓度在100ng/ul以上,样品DNA体积至少60ul,A260/A280值在1.8~2.0,A260/A230值在2.0~2.4;
(13)质控合格的样品使用IllunimaHiseq2000平台进行高通量测序;
步骤2,基因组测序产出数据质量控制:
基于多倍体基因组二代高通量测序数据的质量控制:使用fastqc软件对测序数据质量进行评估,保证测序数据符合后续的分析需求;
使用Trimmomatic软件过滤低质量的reads,即任何一端含有接头的双端reads;单端reads中未测出碱基超过该reads长度10%的双端reads;单端reads中低质量碱基数超过该reads碱基数...

【专利技术属性】
技术研发人员:袁晓辉刘海平肖世俊
申请(专利权)人:武汉古奥基因科技有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1