【技术实现步骤摘要】
获得目标样本的目标测序数据的方法及对目标样本的序列进行组装的方法
本文涉及一种混合样本的三代基因组的测序策略和分析方法,本文的技术方案是对混合样本中的单一样本的测序数据进行组装的方案。
技术介绍
Denovo组装也叫基因组从头组装,是指不依赖于参考基因组的序列,拼接获得全新的基因组序列的过程,为研究物种起源进化及特定环境适应性奠定基础。传统的基于二代测序(Next-GenerationSequencing,NGS)数据的组装方法,作为研究动植物基因组的重要技术,为基因组学的发展做出了重要贡献。该方法作为传统的Denovo技术,有成本低、准确性较高的优点,同时也存在测序读长短、拼接的长度较短和难以解决长重复序列的缺点。PacBio公司的单分子测序技术(SingleMolecule,Real-Time,SMRT)技术的出现,弥补了NGS在组装应用中的一些缺点,相比较二代测序技术,PacBio的单分子测序技术具有无需PCR扩增、超长读长(最长可达40-70KB)和无GC偏好等优点,经常也被称为三代测序技术( ...
【技术保护点】
1.一种获得目标样本的目标测序数据的方法,其包括:/n对第一样本进行第一测序,得到第一样本的第一序列集;/n对第二样本进行第二测序,得到第二样本的第二序列集;/n采用第一样本的第一序列集对第二样本的第二序列集进行筛选,获得第一样本的第二序列集;/n所述第一样本为目标样本,所述第一样本的第二序列集为目标样本的目标测序数据。/n
【技术特征摘要】
1.一种获得目标样本的目标测序数据的方法,其包括:
对第一样本进行第一测序,得到第一样本的第一序列集;
对第二样本进行第二测序,得到第二样本的第二序列集;
采用第一样本的第一序列集对第二样本的第二序列集进行筛选,获得第一样本的第二序列集;
所述第一样本为目标样本,所述第一样本的第二序列集为目标样本的目标测序数据。
2.根据权利要求1所述的方法,其中,
所述第一样本为单一样本;以及
所述第二样本为包含所述单一样本的混合样本。
3.根据权利要求2所述的方法,其中,
所述单一样本在所述混合样本中所占的比例为70%以上。
4.根据权利要求1所述的方法,其中,
所述第一测序为高通量测序,所述第二测序为单分子测序。
5.根据权利要求1~4中任一项所述的方法,其中,
在采用第一样本的第一序列集对第二样本的第二序列集进行筛选,获得第一样本的第二序列集的步骤中,包括如下步骤:
将所述第一样本的第一序列集中的序列与所述第二样本的第二序列集中的序列进行比对,获得第二样本的第二序列集中的每条序列的匹配信息,
根据所述匹配信息对第二样本的第二序列集中的序列进行筛选以获得第一样本的第二序列集。
6.根据权利要求5所述的方法,其中,
所述匹配信息是第一样本的第一序列集中的序列与所述第二样本的第二序列集中的各序列的匹配比例。
7.根据权利要求6所述的方法,其中,根据所述匹配信息对第二样本的第二序列集中的序列进行筛选包括:序列纠错和/或序列过滤:将匹配信息在设定值以下的第二样本的第二序列集中的序列从第二样本的第二序列集中剔除,经过所述序列纠错和序列过滤得到的剩余序列组成的滤过序列集为第一样本的第二序列集。
8.根据权利要求1~4中任一项所述的方法,其还包括:
对第二样本进行第一测序,得到第二样本的第一序列集。
9.根据权利要求8所述的方法,其中,
第二样本的第一序列集的测序结果包括基于第一测序获得的第二样本的基因组大小,第一样本的第一序列集的测序结果包括基于第一测序获得的第一样本的基因组大小,
将...
【专利技术属性】
技术研发人员:李志民,王娟,任雪,刘涛,占伟,杨伟飞,孙雪光,
申请(专利权)人:安诺优达基因科技北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。