胎儿浓度定量的方法和装置及胎儿基因分型的方法和装置制造方法及图纸

技术编号:23769124 阅读:34 留言:0更新日期:2020-04-11 21:44
本发明专利技术提供了一种胎儿浓度定量的方法和装置及胎儿基因分型的方法和装置。胎儿浓度定量方法包括获取含有多个SNP位点的测序数据;统计测序数据中在各SNP位点的变异频率,并将变异频率为1%~25%的SNP位点归为第一类频率,将变异频率为75%~99%的SNP位点归为第二类频率,第二类频率=1‑变异频率;计算两类频率形成的数据集的中位数或均值,中位数或均值的2倍即为胎儿浓度。基于胎儿与母体的差异SNP位点,实现对男胎和女胎胎儿浓度的准确定量,进而结合孕妇白细胞样本提供的母体背景,能准确检测出胎儿在有母亲突变背景下是否遗传来源于母亲或者父亲的突变,解决了难以在有母体突变背景下进行胎儿基因分型的问题。

Methods and devices of fetal concentration quantification and fetal genotyping

【技术实现步骤摘要】
胎儿浓度定量的方法和装置及胎儿基因分型的方法和装置
本专利技术涉及高通量测序
,具体而言,涉及一种胎儿浓度定量的方法和装置及胎儿基因分型的方法和装置。
技术介绍
2012年发布的中国出生缺陷防治报告显示我国出生缺陷总发生率为5.6%,每年新增患儿约90万例,给患儿、家庭及社会带来严重的经济和精神负担。约有15-25%的出生缺陷与染色体异常相关,因此准确有效的胎儿基因分型方法,将能够对这部分出生缺陷的诊断提供有力的证据,极大的降低出生缺陷发生率。目前用于胎儿基因分型的产前诊断方法所用的胎儿样本多通过有创的方式获取,如羊水穿刺、绒毛取样及脐带血穿刺,均有相当比例的流产及宫内感染风险。1997年,香港中文大学卢煜明教授发现在孕妇血浆游离DNA中含有胎儿的遗传物质,胎儿遗传物质的比例约占10%,具有个体差异性,并且随孕妇的孕周而变化。由此,打开了通过孕妇血浆游离DNA对胎儿进行无创检测的大门,目前,该技术已经广泛应用于胎儿染色体非整倍体检测。也有利用孕妇血浆中含有的胎儿遗传物质进行单基因遗传病检测的报道,不过大多集中于已知的无母体背景的来源于父亲的突变或者新发突变的检测。对于具有母体突变背景的位点检测,有报道通过单倍型的方法实现,不过需要构建父亲及母亲的单倍型费时费力,过程繁琐。因此,需要开发一种简单准确的胎儿基因分型方法,满足临床应用。
技术实现思路
本专利技术的主要目的在于提供一种胎儿浓度定量的方法和装置及胎儿基因分型的方法和装置,以解决现有技术对胎儿基因分型过程繁琐,需要构建双亲单倍型信息的问题。为了实现上述目的,根据本专利技术的一个方面,提供了一种胎儿浓度定量的方法,该方法包括:获取含有多个SNP位点的测序数据;统计测序数据中在各SNP位点的变异频率,并将变异频率为1%~25%的SNP位点归为第一类频率,将变异频率为75%~99%的SNP位点归为第二类频率,第二类频率=1-变异频率;计算第一类频率和第二类频率形成的数据集的中位数或均值,中位数或均值的2倍即为胎儿浓度。进一步地,在获取含有多个SNP位点的测序数据之前,方法还包括挑选多个SNP位点;优选地,挑选多个SNP位点包括:从千人基因组数据库中挑选多个候选SNP位点;以及从多个候选SNP位点中剔除符合以下至少之一情形的SNP位点:(1)位于参考基因组重复区域的SNP位点;(2)覆盖SNP位点侧翼100~150bp区域,且比对到参考基因组多个位置的SNP位点;更优选地,多个候选SNP位点的等位基因频率为0.4~0.6。进一步地,多个SNP位点为表1所示的150个SNP位点中的100~150个。根据本申请的第二个方面,还提供了一种胎儿基因分型的方法,方法包括:分别获取来源于孕妇的血浆游离DNA和白细胞基因组DNA的测序数据;将两组测序数据与参考基因组比对,获得变异SNP位点;计算各变异SNP位点的变异基因型的频率及胎儿浓度,并根据白细胞基因组DNA的测序数据确定各变异SNP位点上孕妇的基因型,推断得出胎儿的基因型;其中,胎儿浓度按照上述任一种方法进行定量。进一步地,计算变异SNP位点的变异基因型的频率及胎儿浓度,并根据白细胞基因组DNA的测序数据确定变异SNP位点上孕妇的基因型,推断得出胎儿的基因型包括:根据白细胞基因组DNA的测序数据确定变异SNP位点上孕妇的基因型为Aa,计算变异SNP位点在白细胞中的变异基因型频率fre_wbc和在血浆游离DNA中的变异基因型频率fre_plasma,Δ=frq_plasma-frq_wbc;判断||Δ|-FF/2|是否满足第一阈值,优选第一阈值大于0.03,若是,则胎儿基因型为Aa;若否,则进一步判断Δ是大于0还是小于0,若是大于0,则胎儿基因型为aa,若是小于0,胎儿基因型为AA,其中,FF为胎儿浓度。进一步地,计算变异SNP位点的变异基因型的频率及胎儿浓度,并根据白细胞基因组DNA的测序数据确定各变异SNP位点上孕妇的基因型,推断得出胎儿的基因型还包括:根据白细胞基因组DNA的测序数据确定变异SNP位点上孕妇的基因型为AA;计算变异SNP位点在血浆游离DNA中的变异基因型频率fre_plasma;若fre_plasma满足第二阈值,优选第二阈值大于0.005,则胎儿基因型为Aa,若fre_plasma满足第三阈值,优选第三阈值小于0.005,则胎儿基因型为AA。进一步地,计算变异SNP位点的变异基因型的频率及胎儿浓度,并根据白细胞基因组DNA的测序数据确定各变异SNP位点上孕妇的基因型,推断得出胎儿的基因型还包括:根据白细胞基因组DNA的测序数据确定变异SNP位点上孕妇的基因型为aa;计算变异SNP位点在血浆游离DNA中的参考基因型频率fre_ref;若fre_fre满足第四阈值,优选第四阈值大于0.005,则胎儿基因型为Aa,若fre_ref满足第五阈值,优选第五阈值小于0.005,则胎儿基因型为aa。为了实现上述目的,根据本专利技术的第三个方面,提供了一种胎儿浓度定量的装置,装置包括:第一获取模块,用于获取含有多个SNP位点的测序数据;统计归类模块,用于统计测序数据中在各SNP位点的变异频率,并将变异频率为1%~25%的SNP位点归为第一类频率,将变异频率为75%~99%的SNP位点归为第二类频率,第二类频率=1-变异频率;第一计算模块,用于计算第一类频率和第二类频率形成的数据集的中位数或均值,中位数或均值的2倍即为胎儿浓度。进一步地,装置还包括挑选模块,用于挑选多个SNP位点;优选地,挑选模块包括:挑选单元,用于从千人基因组数据库中挑选多个候选SNP位点;以及剔除单元,用于从多个候选SNP位点中剔除符合以下至少之一情形的SNP位点:(1)位于参考基因组重复区域的SNP位点;(2)覆盖SNP位点120bp区域能比对到参考基因组多个位置的SNP位点;更优选地,多个候选SNP位点的等位基因频率为0.4~0.6。进一步地,多个SNP位点为表1所示的150个SNP位点中的100~150个。为了实现上述目的,根据本专利技术的第四个方面,提供了一种胎儿基因分型的装置,装置包括:第二获取模块,用于分别获取来源于孕妇的血浆游离DNA和白细胞基因组DNA的测序数据;比对模块,用于将测序数据与参考基因组比对,获得变异SNP位点;推断模块,用于计算各变异SNP位点的变异基因型的频率及胎儿浓度,并根据白细胞基因组DNA的测序数据确定各变异SNP位点上孕妇的基因型,推断得出胎儿的基因型;其中,胎儿浓度按照上述任一种的定量装置进行定量。进一步地,推断模块包括:第一孕妇基因型确定模块,用于根据白细胞基因组DNA的测序数据确定变异SNP位点上孕妇的基因型为Aa,第二计算模块,用于计算变异SNP位点在白细胞中的变异基因型频率fre_wbc和在血浆游离DNA中的变异基因型频率fre_plasma,Δ=frq_plasma-frq_wbc;第一判断模块,用于判断||Δ|-FF/2|是否满足第一阈值,优选第一阈值大于0.03,若是,则胎儿基因型为Aa;若否,则进一步判本文档来自技高网...

【技术保护点】
1.一种胎儿浓度定量的方法,其特征在于,所述方法包括:/n获取据库中挑选多个候选SNP位点;以及/n从多个所述候选SNP含有多个SNP位点的测序数据;/n统计所述测序数据中在各所述SNP位点的变异频率,并将所述变异频率为1%~25%的所述SNP位点归为第一类频率,将所述变异频率为75%~99%的所述SNP位点归为第二类频率,所述第二类频率=1-所述变异频率;/n计算所述第一类频率和所述第二类频率形成的数据集的中位数或均值,所述中位数或均值的2倍即为所述胎儿浓度。/n

【技术特征摘要】
1.一种胎儿浓度定量的方法,其特征在于,所述方法包括:
获取据库中挑选多个候选SNP位点;以及
从多个所述候选SNP含有多个SNP位点的测序数据;
统计所述测序数据中在各所述SNP位点的变异频率,并将所述变异频率为1%~25%的所述SNP位点归为第一类频率,将所述变异频率为75%~99%的所述SNP位点归为第二类频率,所述第二类频率=1-所述变异频率;
计算所述第一类频率和所述第二类频率形成的数据集的中位数或均值,所述中位数或均值的2倍即为所述胎儿浓度。


2.根据权利要求1所述的方法,其特征在于,在获取含有多个SNP位点的测序数据之前,所述方法还包括挑选多个所述SNP位点;
优选地,挑选多个所述SNP位点包括:
从千人基因组数据库中挑选多个候选SNP位点;以及
从多个所述候选SNP位点中剔除符合以下至少之一情形的SNP位点:
(1)位于参考基因组重复区域的SNP位点;
(2)覆盖SNP位点侧翼100~150bp区域,且比对到参考基因组多个位置的SNP位点;
更优选地,多个所述候选SNP位点的等位基因频率为0.4~0.6。


3.根据权利要求1所述的方法,其特征在于,多个所述SNP位点为表1所示的150个SNP位点中的100~150个。


4.一种胎儿基因分型的方法,其特征在于,所述方法包括:
分别获取来源于孕妇的血浆游离DNA和白细胞基因组DNA的测序数据;
将两组测序数据与参考基因组比对,获得变异SNP位点;
计算各所述变异SNP位点的变异基因型的频率及胎儿浓度,并根据所述白细胞基因组DNA的测序数据确定各所述变异SNP位点上所述孕妇的基因型,推断得出所述胎儿的基因型;
其中,所述胎儿浓度按照权利要求1至3中任一项所述的方法进行定量。


5.根据权利要求4所述的方法,其特征在于,计算所述变异SNP位点的变异基因型的频率及胎儿浓度,并根据所述白细胞基因组DNA的测序数据确定所述变异SNP位点上所述孕妇的基因型,推断得出所述胎儿的基因型包括:
根据所述白细胞基因组DNA的测序数据确定所述变异SNP位点上所述孕妇的基因型为Aa,
计算所述变异SNP位点在白细胞中的变异基因型频率fre_wbc和在血浆游离DNA中的变异基因型频率fre_plasma,Δ=frq_plasma-frq_wbc;
判断||Δ|-FF/2|是否满足第一阈值,优选所述第一阈值大于0.03,若是,则胎儿基因型为Aa;若否,则进一步判断Δ是大于0还是小于0,若是大于0,则胎儿基因型为aa,若是小于0,胎儿基因型为AA,其中,FF为所述胎儿浓度。


6.根据权利要求5所述的方法,其特征在于,计算所述变异SNP位点的变异基因型的频率及胎儿浓度,并根据所述白细胞基因组DNA的测序数据确定各所述变异SNP位点上所述孕妇的基因型,推断得出所述胎儿的基因型还包括:
根据所述白细胞基因组DNA的测序数据确定所述变异SNP位点上所述孕妇的基因型为AA;
计算所述变异SNP位点在血浆游离DNA中的变异基因型频率fre_plasma;
若所述fre_plasma满足第二阈值,优选所述第二阈值大于0.005,则胎儿基因型为Aa,若所述fre_plasma满足第三阈值,优选所述第三阈值小于0.005,则胎儿基因型为AA。


7.根据权利要求5所述的方法,其特征在于,计算所述变异SNP位点的变异基因型的频率及胎儿浓度,并根据所述白细胞基因组DNA的测序数据确定各所述变异SNP位点上所述孕妇的基因型,推断得出所述胎儿的基因型还包括:
根据所述白细胞基因组DNA的测序数据确定所述变异SNP位点上所述孕妇的基因型为aa;
计算所述变异SNP位点在血浆游离DNA中的参考基因型频率fre_ref;
若所述fre_fre满足第四阈值,优选所述第四阈值大于0.005,则胎儿基因型为Aa,若所述fre_ref满足第五阈值,优选所述第五阈值小于0.005,则胎儿基因型为aa。


8.一种胎儿浓度定量的装置,其特征在于,所述装置包括:
第一获取模块,用于获取含有多个SNP位点的测序数据;
统计归类模块,用于统计所述...

【专利技术属性】
技术研发人员:白灵单广宇高权权张红程岩岩徐冰刘运超方楠伍启熹王建伟刘倩唐宇
申请(专利权)人:北京科迅生物技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1