遗传图谱构建方法和装置、单体型分析方法和装置制造方法及图纸

技术编号:8384211 阅读:288 留言:0更新日期:2013-03-07 01:56
本发明专利技术涉及基于单细胞全基因组测序的遗传图谱构建和单体型分析方法,以及用于所述方法的装置。遗传图谱构建方法包括将某物种单细胞的全基因组序列与参考序列进行比对,得到单核苷酸多态性位点基因型的统计结果;对基因型结果进行亲本分型,分为最合适的父本/母本(a/b)结果,使得所有细胞的统计结果中出现的重组次数最少;根据分型后的结果,将其划分为连锁区域(bin);通过计算a/b的变化比率得到所有相邻bin之间的重组率;根据每个重组位点的重组率,最终获得遗传图谱。本发明专利技术的方法能够利用单细胞获得高分辨率的遗传图谱,其不仅可用于人,还可用于一些繁殖能力有限的高等生物,特别是濒危物种。

【技术实现步骤摘要】

本专利技术涉及遗传学和生物信息学领域,具体涉及遗传图谱的构建方法和装置,以及单体型分析方法和装置,特别是涉及基于单细胞全基因组测序的遗传图谱构建方法和装置,以及单体型分析 方法和装置。
技术介绍
遗传图谱的构建基于遗传学第三定律——基因的连锁和交换定律,即是以具有遗传多态性的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,I %的重组率称为IcM)为图距的基因组图。遗传图谱的构建对于各物种的研究具有重大的意义,能够阐释物种的遗传规律、特点,利用这一功能,我们能够研究很多与人类相关的生物功能的遗传规律。比如,在农作物研究中遗传图谱的构建能够使我们了解与作物高产、抗病相关基因的遗传重组规律,指导我们进行育种工作,获得高产耐性强的产品;而对于人类自身,遗传图谱的构建能够更好的让我们进行某些遗传病的研究,以及指导优生。但是目前遗传图谱构建的传统方法,不能很好的运用于人类自身。由于遗传图谱的构建是基于减数分裂中产生的同源重组事件随机分配到子代个体中的统计分析,因此需要选取每一代的大量个体进行研究,而哺乳动物缺少构图的大量后代,这就直接限制了人类遗传谱图的构建过程,因为很难选取一个如此庞大的家系来满足统计学随机性的条件进行研究。N. ARNHEIM, H. LI等利用单精子来构建遗传图谱(Genetic mapping by singlesperm typing, Animal Genetics 1991, 22,105-115),解决了样本选取问题,但是仍然存在很大的局限。文中所采用的方法只能对已知的部分基因作扩增进行后续分析,不仅依赖引物的效果,而且对于未知基因以及不易扩增出的片段无能为力,因此该方法得到的遗传图谱相对片面、不完善。以Illumina Solexa、ABI SOLiD和Roche 454为代表的第二代高通量测序技术,以及第三代测序技术(即单分子测序技术),主要包括Helic0s公司的真实单分子测序技术、Pacific Biosciences 公司的单分子实时测序技术和 Oxford Nanopore Technologies公司的纳米孔测序技术等在近几年得到快速发展,已成为基因组学研究的重要工具。
技术实现思路
本专利技术利用全基因组测序技术,获得单细胞全基因组序列数据,对数据进行生物信息学分析和处理,最终能够获得高分辨率的遗传图谱并进行单体型分析。本专利技术的第一方面涉及基于单细胞测序的遗传图谱构建方法,其包括以下步骤通过全基因组测序获得某物种单细胞的全基因组序列;将获得的全基因组序列与该物种的参考序列进行比对,得到包括所有单细胞个体的单核苷酸多态性(SNP)位点的基因型(genotype)数据;根据获得的基因型数据,运用最小重组法(maximum parsimony ofrecombination, MPR法),推断出发生重组事件最少情况下的父本和母本两套染色体各自的基因型,进而确定出各个单细胞SNP基因型的父本/母本(a/b)分型结果;根据分型后的SNP的基因型结果,在染色体上划分出连锁区域(linkage region,LR,也可称为bin),划分为一个bin的标准是(1)连续相同SNP (即都为a或b)的数量至少为5个;(2)选取的bin的物理长度大于250kb ;得到bin的分型后,通过对所有细胞bin的情况进行统计,计算出a/b的变化比率,进而可得出每连续两个bin与bin之间的重组率; 根据每连续两个bin与bin之间的重组率,得到重组图谱;其中a型与b型bin交界的位点即为重组位点,通过统计多个样本在重组位点的重组情况,得到每个重组位点的重组率,最终获得遗传图谱。根据本专利技术第一方面的构建方法,其中所述的某物种为子代数目有限的高等生物,例如为哺乳动物;在本专利技术的实施方案中,所述的某物种为人。根据本专利技术第一方面的构建方法,其中所述的单细胞可以为生殖细胞,在本专利技术的实施方案中,所述的单细胞为精子细胞。根据本专利技术第一方面的构建方法,其中所述的获得某物种单细胞全基因组序列的方法为本领域技术人员知晓和使用的常规方法,其中包括获得细胞的全基因组DNA、扩增全基因组DNA和全基因组DNA测序的步骤;根据本专利技术第一方面的构建方法,所述的扩增全基因组DNA的方法为本领域技术人员知晓和使用的常规方法,例如可以为简并寡核苷酸引物PCR (degenerateoligonucleotide-primed PCR, D0P-PCR)、连接反应介导的 PCR(ligation mediated PCR,LM-PCR)、改良的扩增前引物延伸反应(improved primer extension preamplification,I-PEP)、多重链转换扩增(multiple displacement amplification, MDA)或基于引物酶的全基因组扩增技术(primase-based whole ge-nome amplification,pWGA)等方法,在本专利技术的一个实施方案中,所述的扩增全基因组DNA的方法为基于链置换反应的DNA等温扩增方法,例如为MDA方法。根据本专利技术第一方面的构建方法,可以采用本领域常规的高通量测序方法进行全基因组测序,例如以Illumina Solexa、ABI SOLiD和Roche 454为代表的第二代测序技术,以及第三代测序技术,即单分子测序技术,例如Helic0S公司的真实单分子测序技术、Pacific Biosciences公司的单分子实时测序技术和Oxford Nanopore Technologies公司的纳米孔测序技术;在本专利技术的实施方案中,采用Illumina Solexa第二代测序技术。根据本专利技术第一方面的构建方法,其中所述的获得细胞全基因组DNA的方法中包括使用微量盐酸胍的步骤。在本专利技术的实施方案中,采用室温碱裂解细胞、并加入微量盐酸胍的方法。其中所述微量盐酸胍的终浓度为2X 10_3 3X K^mol/L,在本专利技术的一个实施方案中,所述微量盐酸胍的终浓度为2X10_3mol/L。在本专利技术的一个实施方案中,所述的单细胞为精子细胞。根据本专利技术第一方面的构建方法,其中将获得的全基因组序列与该物种的参考序列进行比对,得到SNP位点基因型的统计结果的方法为本领域技术人员知晓和常用的方法,在本专利技术的一个实施方案中,其包括以下步骤以所述物种例如人类的参考序列例如Hgl9为对照建立索引,将测序获得的全基因组序列数据通过核酸序列比对软件例如SOAP的比对分析得到比对结果;以参考序列例如人类Hgl9的fasta文件和dbSNP作为参照,将上述比对结果通过SNP探测软件例如SOAPsnp得到call SNP的结果cns文件;通过对cns文件的进一步处理,即可筛选得到可靠的SNP位点数据;通过将不同单细胞的SNP位点数据整合到一个文件中,得到一个包括所有单细胞的各个SNP位点基因型的统计结果。本专利技术的第二方面涉及基于单细胞测序的遗传图谱构建装置(图2),其包括单细胞全基因组测序单元,用于获得某物种单细胞的全基因组序列; SNP位点基因型统计单元,与所述的单细胞全基因组测序单元相连,用于将某物种单细胞的全基因组序列与该物种的参考本文档来自技高网
...

【技术保护点】
基于单细胞测序的遗传图谱构建方法,其包括以下步骤:通过全基因组测序获得某物种单细胞的全基因组序列;将获得的全基因组序列与该物种的参考序列进行比对,得到包括所有单细胞SNP位点的基因型的统计结果数据;根据获得的基因型数据,运用最小重组法推断出发生重组事件最少情况下的父本和母本两套染色体各自的基因型,进而确定出各个单细胞SNP基因型的父本/母本(a/b)分型结果;根据分型后的SNP的基因型结果,在染色体上将其划分为连锁区域(bin),划分为一个bin的标准是:(1)连续相同a或b的SNP数量至少为5个;(2)选取的bin的物理长度大于250kb;得到bin的分型后,通过对所有细胞bin的情况进行统计,计算出连续两个bin之间a/b的变化比率,进而可得出每连续两个bin与bin之间的重组率;根据每连续两个bin与bin之间的重组率,得到重组图谱;其中a与b交界的位点即为重组位点,通过统计多个样本在重组位点的重组情况,得到每个重组位点的重组率,最终获得遗传图谱。

【技术特征摘要】

【专利技术属性】
技术研发人员:宋卢挺邵迪郑泽群郑智俊吴逵梁舒恒陶晔侯勇
申请(专利权)人:深圳华大基因科技有限公司深圳华大基因研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1