确定胚胎基因组中预定区域碱基信息的方法、系统和计算机可读介质技术方案

技术编号:12293987 阅读:85 留言:0更新日期:2015-11-11 06:19
提供了确定胚胎基因组中预定区域碱基信息的方法、系统和计算机可读介质。其中,确定胚胎基因组中预定区域碱基信息的方法,包括下列步骤:获得胚胎细胞基因组DNA样本的测序结果,以及胚胎遗传相关个体基因组样本的测序结果;基于胚胎细胞基因组DNA样本的测序结果,构建该胚胎的遗传草图,以便确定胚胎初始基因型;基于胚胎遗传相关个体基因组样本的测序结果,确定胚胎父母的单倍体型;以及根据隐马尔可夫模型,以该胚胎初始基因型作为观察序列,基于该胚胎父母的单倍体型,确定胚胎基因组中预定区域的碱基信息。

【技术实现步骤摘要】
【国外来华专利技术】确定胚胎基因组中预定区域碱基信息的方法、系统和计算机可读介质优先权信息无
本专利技术涉及确定胚胎基因组中预定区域碱基信息的方法、系统和计算机可读介质。
技术介绍
遗传性疾病是由于遗传物质发生改变而造成的疾病,具有先天性、家族性、终身性和遗传性的特点。遗传性疾病可分为3个大类:单基因遗传病、多基因遗传病及染色体异常。其中单基因病多由于单个致病基因的显性或隐性遗传所致基因功能异常;而多基因遗传病则是由多个基因变化影响所致的疾病,会在一定程度上受到外界环境因素的影响;染色体异常包括数目异常和结构异常,最为多见的是由于第21号染色体三体所致的唐氏综合症,患儿表现为先天愚型和肢体形状异常等其他先天性特征。由于目前对遗传性疾病尚无有效的治疗方式,只能针对性地进行支持治疗或者药物缓解,费用昂贵,给社会和家庭带来沉重经济和精神负担。因此,在孩子出生前就对孩子的患病状态进行检测,做好预防工作,以达到优生优育的目的,是十分必要的。例如在体外生殖过程中,在胚胎植入子宫之前,对胚胎的患病状态进行检测,将具有重大意义。对配子或植入到子宫腔之前的胚胎进行遗传学分析,将排除致病因素的正常胚胎植入子宫,从而防止患有遗传病的孩子的妊娠。对具有高风险妊娠遗传缺陷胚胎的夫妇实施植入前胚胎的患病状态的检测,无疑能有效降低患病孩子的出生,并且避免选择性终止妊娠给孕妇及家庭带来的诸多危害。然而,目前的相关检测手段仍有待改进。
技术实现思路
本专利技术是基于专利技术人的下列发现而完成的:专利技术人发现,植入前胚胎中可以活检取样进行检测的细胞数有限。例如培养至第三天的卵裂球仅有4-8个细胞,可以进行活检取样的仅1-2个细胞。即使在培养至第五天的囊胚,进行外滋养层细胞活检取样也只能取到3-10个细胞。由于单个或少数胚胎细胞的DNA量有限,难以直接进行全面的遗传变异检测,必需经过全基因组扩增(WholeGenomeAmplification,WGA),达到足够DNA量,才能对遗传变异做全面分析。而全基因组扩增常存在偏好性,会产生一定的杂合缺失或等位基因脱扣(AlleleDropOut)等现象,这些都为胚胎细胞的遗传病相关的遗传变异检测带来风险。因此,很有必要开发能够对扩增引起的等位基因脱扣等错误进行定位和矫正的方法,以提高遗传变异检测的准确性。本专利技术旨在至少解决现有技术中存在的技术问题之一。通过本专利技术方法推算胚胎单倍体型,可以对发生等位基因脱扣的位点进行定位,并能够进行矫正。而胚胎单倍体型分析方法可以基于家系成员如父母和先证者的遗传信息,或者基于来自同一父母的其他胚胎细胞的遗传信息进行推算。在本专利技术的一个方面,本专利技术提出了一种确定胚胎基因组中预定区域碱基信息的方法。该方法结合系谱推断和统计算法来进行胚胎单体型的确定,通过家系中相关个体的基因型,即追溯染色体片段的传递,结合统计算法来推断单体型状态。根据本专利技术的实施例,该方法包括下列步骤:获得胚胎细胞基因组DNA样本的测序结果,以及胚胎遗传相关个体基因组样本的测序结果;基于胚胎细胞基因组DNA样本的测序结果,构建所述胚胎的遗传草图,以便确定胚胎初始基因型;基于所述胚胎遗传相关个体基因组样本的测序结果,确定胚胎父母的单倍体型;以及根据隐马尔可夫模型,以所述胚胎初始基因型作为观察序列,基于所述胚胎父母的单倍体型,确定胚胎基因组中预定区域的碱基信息。需要说明的是,子代的基因组形成过程,相当于亲代基因组的一次随机重组(即连锁互换单倍体型重组,以及配子的随机组合)。将胚胎的单倍型作为隐含状态(hiddenstates),将胚胎单细胞全基因组扩增后的测序数据作为观察序列(observations),利用贝叶斯算法借助先验数据推算出状态转移概率(transitionprobabilities),构建观察序列概率分布(observationsymbolprobabilities)和初始状态概率分布(initialstatedistribution),然后通过惠特比算法(Viterbialgorithm)可以推断出最可能的胚胎单体型组合。因而,根据本专利技术的实施例,借助隐马尔可夫模型,例如可以通过利用惠特比算法(Viterbialgorithm),参考胚胎遗传相关个体的遗传信息,可以确定胚胎基因组中特定区域的核酸序列,由此,可以有效地对胚胎基因组的遗传信息进行植入前检测。对于在胚胎细胞全基因组扩增DNA测序结果中覆盖程度较低,存在杂合缺失或等位基因脱扣(AlleleDropOut)的位点或DNA序列,可以通过本方法准确地推断得到。因此通过本方法,可以对杂合缺失或等位基因脱扣(AlleleDropOut)的位点或序列进行校正,使检测结果更加准确可靠。在本专利技术的又一方面,本专利技术提出了一种用于确定胚胎基因组中预定区域碱基信息的系统。根据本专利技术的实施例,该系统包括:文库构建装置,所述文库构建装置适于针对胚胎基因组DNA样本以及胚胎遗传相关个体的基因组DNA样本,分别构建测序文库;测序装置,所述测序装置与所述文库构建装置相连,并且适于对所述测序文库进行测序,以便获得胚胎以及胚胎遗传相关个体的测序结果;以及分析装置,所述分析装置与所述测序装置相连,并且适于:基于胚胎基因组DNA样本的测序结果,构建所述胚胎的遗传草图,以便确定胚胎初始基因型;基于所述胚胎遗传相关个体基因组样本的测序结果,确定胚胎父母的单倍体型;以及根据隐马尔可夫模型,以所述胚胎初始基因型作为观察序列,基于所述胚胎父母的单倍体型,确定胚胎基因组中预定区域的碱基信息。根据本专利技术的实施例,还可以进一步包括胚胎活检装置,所述胚胎活检装置适于针对体外培养的胚胎进行活检,对胚胎细胞进行取样。利用该系统,能够有效地实施前面所述的确定胚胎基因组中预定区域碱基信息的方法,可以借助隐马尔可夫模型,例如可以通过利用惠特比算法(Viterbialgorithm),参考胚胎遗传相关个体的遗传信息,可以确定胚胎基因组中特定区域的核酸序列,由此,可以有效地对胚胎基因组的遗传信息进行植入前检测,从而可以有效地对胚胎基因组的遗传信息进行确定。在本专利技术的另一方面,本专利技术还提出了一种计算机可读介质。根据本专利技术的实施例,基于胚胎细胞基因组DNA样本的测序结果,构建胚胎的遗传草图,以便确定胚胎初始基因型;基于所述胚胎遗传相关个体基因组样本的测序结果,确定胚胎父母的单倍体型;以及以根据隐马尔可夫模型,所述胚胎初始基因型作为观察序列,基于所述胚胎父母的单倍体型,确定胚胎基因组中预定区域的碱基信息。利用本专利技术的计算机可读介质,能够有效地被处理器执行其存储的指令,以便借助隐马尔可夫模型,例如可以通过利用惠特比算法(Viterbialgorithm),基于胚胎细胞的测序结果,参考胚胎遗传相关个体的遗传信息,可以确定胚胎基因组中特定区域的核酸序列,由此,可以有效地对胚胎基因组的遗传信息进行植入前检测。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1为根据本专利技术一个实施例的利用隐马尔可夫模型进行分析的流程示意图;以及图2为根据本专利技术的一个实施例的用于确定胚胎基因组中预定区域核本文档来自技高网...
确定胚胎基因组中预定区域碱基信息的方法、系统和计算机可读介质

【技术保护点】
PCT国内申请,权利要求书已公开。

【技术特征摘要】
【国外来华专利技术】1.一种确定胚胎基因组中预定区域碱基信息的方法,所述方法用于非诊断目的,其特征在于,包括下列步骤:获得胚胎细胞基因组DNA样本的测序结果,以及胚胎遗传相关个体基因组样本的测序结果;基于胚胎细胞基因组DNA样本的测序结果,构建所述胚胎的遗传草图,以便确定胚胎初始基因型;基于所述胚胎遗传相关个体基因组样本的测序结果,确定胚胎父母的单倍体型;以及根据隐马尔可夫模型,以所述胚胎初始基因型作为观察序列,基于所述胚胎父母的单倍体型,确定胚胎基因组中预定区域的碱基信息,其中,根据隐马尔可夫模型,确定胚胎基因组中预定区域的碱基信息进一步包括:构建初始状态概率分布向量、隐藏状态转移的概率矩阵以及观察序列概率矩阵;利用惠特比算法确定最终状态并回溯最优路径,以便确定胚胎基因组中预定区域的碱基信息,所述隐马尔可夫模型采用下列参数:初始状态概率分布为π={πi},(i∈S,πi=0.5),隐藏状态转移的概率矩阵为A={aij},(i,j∈S),其中,Nr、Np分别表示期望重组数和单核苷酸多态性位点数,Nr为自然数,取值范围20-40,观察序列概率矩阵为B={bi(k)},(i∈S,k∈V),其中,#sites(L>0,Must-hom.)为子代一定为纯合的位点的数目,#sites(L>0,Must-hom.orMust-het.)为子代一定为纯合的位点的数目以及子代一定为杂合的位点的数目的总和;局部概率为δt(j)=max[δt-1(i)·aij]·bj(K)t∈{1...N},逆向指针为Ψi(j)=argmaxδt-1(i)·aijt∈{1...N},递归得最终状态为回溯最优路径,确定最可能的胚胎预定区域的碱基信息为qt*=Ψt+1(q*t+1)(t=1,2,3,...,N-1)。2.根据权利要求1所述的方法,其特征在于,所述胚胎基因组DNA样本是从微量胚胎细胞获得的,其中,所述微量胚胎细胞来自于卵裂球、囊胚或受精卵。3.根据权利要求2所述的方法,其特征在于,所述胚胎基因组DNA样本是从胚胎单细胞获得的。4.根据权利要求1所述的方法,其特征在于,所述测序结果是利用选自Illumina-Solexa/Hiseq、ABI-SOLiD、LifeTechnologies-IonTorrent/Proton、Roche-454和单分子测序装置的至少一种获得的。5.根据权利要求1所述的方法,其特征在于,通过将胚胎细胞基因组DNA样本的测序结果与参考序列进行比对,构建所述胚胎的遗传草图。6.根据权利要求1所述的方法,其特征在于,通过将所述胚胎遗传相关个体基因组样本的测序结果与参考序列进行比对,确定所述胚胎遗传相关个体的基因型;以及基于所述胚胎遗传相关个体的基因型,确定所述胚胎父母的单倍体型。7.根据权利要求5或6所述的方法,其特征在于,所述参考序列为人类参考基因组。8.根据权利要求1所述的方法,其特征在于,所述胚胎遗传相关个体包括所述胚胎的父母以及先证者。9.根据权利要求8所述的方法,其特征在于,所述先证者为所述胚胎父母的其他子女。10.根据权利要求1所述的方法,其特征在于,进一步包括:所述预定区域为已知存在遗传多态性的位点...

【专利技术属性】
技术研发人员:殷旭阳蒋慧陈盛培龚淳陈芳张春雷潘小瑜
申请(专利权)人:深圳华大基因股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1