建立胎儿浓度校正模型的方法及装置与胎儿浓度定量的方法及装置制造方法及图纸

技术编号:23769123 阅读:90 留言:0更新日期:2020-04-11 21:44
本发明专利技术提供了一种建立胎儿浓度校正模型的方法及装置与胎儿浓度定量的方法及装置。建立胎儿浓度校正模型的方法包括:获取多个已知胎儿浓度的样本的测序数据,测序数据为靶向捕获文库的测序数据;分别统计每个第一类样本的测序数据中的AAAB型SNP位点的总个数及平均覆盖深度,并计算得到胎儿的计算浓度;根据已知胎儿浓度、计算浓度、AAAB型SNP位点的总个数及平均覆盖深度,建立胎儿的校正浓度与计算浓度、AAAB型SNP位点的总个数及平均覆盖深度之间的关系模型,得到校正模型;AAAB型SNP位点是指母本为AA纯合型而胎儿为AB杂合型的SNP位点。利用该矫正模型能够使得到的胎儿浓度更接近真实值。

The method and device of establishing fetal concentration correction model and the method and device of fetal concentration quantification

【技术实现步骤摘要】
建立胎儿浓度校正模型的方法及装置与胎儿浓度定量的方法及装置
本专利技术涉及高通量测序
,具体而言,涉及一种建立胎儿浓度校正模型的方法及装置与胎儿浓度定量的方法及装置。
技术介绍
在单基因病的临床实践中,利用孕妇外周血检测胎儿浓度是一项非常重要的工作。目前常用的方法是制备产前诊断文库进行胎儿浓度定量。目前,单基因病产前检测需要同时制备两个文库:产前诊断文库和靶向捕获文库,其中,产前诊断文库用于胎儿浓度定量,靶向捕获文库用于变异检测。这对于本来样本量就少的临床样本来说,靶向捕获测序文库的数据并未充分利用,不仅浪费了捕获文库的信息,而且还浪费了珍贵的临床样本。然而,目前对于这一状况尚无有效的解决方案。
技术实现思路
本专利技术的主要目的在于提供一种建立胎儿浓度校正模型的方法及装置与胎儿浓度定量的方法及装置,以解决现有技术无法有效利用捕获文库的测序数据对胎儿浓度进行准确定量的问题。为了实现上述目的,根据本专利技术的一个方面,提供了一种建立胎儿浓度校正模型的方法,该方法包括:获取多个第一类样本的测序数据,第一类样本为已知胎儿浓度的样本,测序数据为靶向捕获文库的测序数据;分别统计每个第一类样本的测序数据中的AAAB型SNP位点的总个数及平均覆盖深度,并计算得到胎儿的计算浓度;根据已知胎儿浓度、计算浓度、AAAB型SNP位点的总个数及平均覆盖深度,建立胎儿的校正浓度与计算浓度、AAAB型SNP位点的总个数及平均覆盖深度之间的关系模型,得到校正模型;其中,AAAB型SNP位点是指母本为AA纯合型而胎儿为AB杂合型的SNP位点。进一步地,得到校正模型包括:从AAAB型SNP位点的总个数中去除覆盖深度低于深度阈值的位点,得到剩余SNP位点的总数;利用剩余SNP位点的总数及剩余SNP位点的平均覆盖深度,计算得到有效的计算浓度;根据已知的胎儿浓度、有效的计算浓度、剩余SNP位点的总数及剩余SNP位点的平均覆盖深度,建立胎儿的校正浓度与有效的计算浓度、剩余SNP位点的总数及剩余SNP位点的平均覆盖深度之间的关系模型,得到校正模型。进一步地,剩余SNP位点的总数满足数量阈值,数量阈值为大于等于100,优选地,深度阈值为大于等于100×。进一步地,利用剩余SNP位点的总数及剩余SNP位点的平均覆盖深度,计算得到有效的计算浓度包括:按照(2*B-DP)/DP计算出剩余SNP位点中每个SNP位点的胎儿浓度值,其中DP表示支持每个SNP位点的总reads数,B-DP表示支持每个SNP位点的来源于胎儿B等位基因型的reads数,2*B-DP表示支持每个SNP位点的来源于胎儿的A和B两种等位基因型的reads数;将剩余SNP位点的胎儿浓度值的中位数,记为有效的计算浓度。进一步地,分别统计每个第一类样本的测序数据中的AAAB型SNP位点的总个数之前,方法还包括:利用FetalQuant找出测序数据中的AAAB型SNP位点。进一步地,校正模型为:其中,CFF’为校正浓度,CFF为计算浓度,Counts-of-AAAB为剩余SNP位点的总数,avgdp为剩余SNP位点的平均覆盖深度。根据本申请的第二个方面,还提供了一种胎儿浓度定量的方法,该方法包括获取待测样本的测序数据;统计待测样本的测序数据中的AAAB型SNP位点的总个数及平均覆盖深度,并计算得到待测样本中胎儿的计算浓度;将待测样本中胎儿的计算浓度、AAAB型SNP位点的总个数及平均覆盖深度,代入胎儿浓度的校正模型,得到待测样本中胎儿的校正浓度;其中,AAAB型SNP位点是指母本为AA纯合型而胎儿为AB杂合型的SNP位点,校正模型为上述任一种校正模型。进一步地,统计待测样本的测序数据中的AAAB型SNP位点的总个数及平均覆盖深度,并计算得到待测样本中胎儿的计算浓度包括:从待测样本的测序数据中的AAAB型SNP位点的总个数中去除覆盖深度低于深度阈值的位点,得到待测样本中剩余SNP位点的总数;利用待测样本中剩余SNP位点的总数及待测样本中剩余SNP位点的平均覆盖深度,计算得到待测样本中胎儿的有效的计算浓度。进一步地,待测样本中剩余SNP位点的总数满足数量阈值,数量阈值为大于等于100,优选地,深度阈值为大于等于100×。根据本申请的第三个方面,还提供了一种建立胎儿浓度校正模型的装置,该装置包括:第一获取模块、第一统计计算模块和模型建立模块,第一获取模块,用于获取多个第一类样本的测序数据,第一类样本为已知胎儿浓度的样本,测序数据为靶向捕获文库的测序数据;第一统计计算模块,用于分别统计每个第一类样本的测序数据中的AAAB型SNP位点的总个数及平均覆盖深度,并计算得到胎儿的计算浓度;模型建立模块,用于根据已知胎儿浓度、计算浓度、AAAB型SNP位点的总个数及平均覆盖深度,建立胎儿的校正浓度与计算浓度、AAAB型SNP位点的总个数及平均覆盖深度之间的关系模型,得到校正模型;其中,AAAB型SNP位点是指母本为AA纯合型而胎儿为AB杂合型的SNP位点。进一步地,第一统计计算模块包括:第一去除模块,用于从AAAB型SNP位点的总个数中去除覆盖深度低于深度阈值的位点,得到剩余SNP位点的总数;第一计算浓度模块,用于利用剩余SNP位点的总数及剩余SNP位点的平均覆盖深度,计算得到有效的计算浓度;模型建立模块用于根据已知的胎儿浓度、有效的计算浓度、剩余SNP位点的总数及剩余SNP位点的平均覆盖深度,建立胎儿的校正浓度与有效的计算浓度、剩余SNP位点的总数及剩余SNP位点的平均覆盖深度之间的关系模型,得到校正模型。进一步地,剩余SNP位点的总数满足数量阈值,数量阈值为大于等于100,优选地,深度阈值为大于等于100×。进一步地,第一计算浓度模块包括:位点浓度模块,用于按照(2*B-DP)/DP计算出剩余SNP位点中每个SNP位点的胎儿浓度值,其中DP表示支持每个SNP位点的总reads数,B-DP表示支持每个SNP位点的来源于胎儿B等位基因型的reads数,2*B-DP表示支持每个SNP位点的来源于胎儿的A和B两种等位基因型的reads数;中位数模块,用于将剩余SNP位点的胎儿浓度值的中位数,记为有效的计算浓度。进一步地,该装置还包括AAAB基因型筛选模块,优选为FetalQuant。进一步地,校正模型为:CFF'=1.107*CFF+0.099*ln(avgdp)-0.1447*ln(Counts-of-AAAB)+0.3948,其中,CFF’为校正浓度,CFF为计算浓度,Counts-of-AAAB为剩余SNP位点的总数,avgdp为剩余SNP位点的平均覆盖深度。根据本申请的第四个方面,还提供了一种胎儿浓度定量的装置,该装置包括:第二获取模块、第二统计计算模块和校正模块,第二获取模块,用于获取待测样本的测序数据;第二统计计算模块,用于统计待测样本的测序数据中的AAAB型SNP位点的总个数及平均覆盖深度,并计算得到待测样本中胎儿的计算浓度;校正模块,用于将待测样本中胎本文档来自技高网...

【技术保护点】
1.一种建立胎儿浓度校正模型的方法,其特征在于,所述方法包括:/n获取多个第一类样本的测序数据,所述第一类样本为已知胎儿浓度的样本,所述测序数据为靶向捕获文库的测序数据;/n分别统计每个所述第一类样本的所述测序数据中的AAAB型SNP位点的总个数及平均覆盖深度,并计算得到胎儿的计算浓度;/n根据所述已知胎儿浓度、所述计算浓度、所述AAAB型SNP位点的总个数及所述平均覆盖深度,建立胎儿的校正浓度与所述计算浓度、所述AAAB型SNP位点的总个数及所述平均覆盖深度之间的关系模型,得到所述校正模型;/n其中,所述AAAB型SNP位点是指母本为AA纯合型而胎儿为AB杂合型的SNP位点。/n

【技术特征摘要】
1.一种建立胎儿浓度校正模型的方法,其特征在于,所述方法包括:
获取多个第一类样本的测序数据,所述第一类样本为已知胎儿浓度的样本,所述测序数据为靶向捕获文库的测序数据;
分别统计每个所述第一类样本的所述测序数据中的AAAB型SNP位点的总个数及平均覆盖深度,并计算得到胎儿的计算浓度;
根据所述已知胎儿浓度、所述计算浓度、所述AAAB型SNP位点的总个数及所述平均覆盖深度,建立胎儿的校正浓度与所述计算浓度、所述AAAB型SNP位点的总个数及所述平均覆盖深度之间的关系模型,得到所述校正模型;
其中,所述AAAB型SNP位点是指母本为AA纯合型而胎儿为AB杂合型的SNP位点。


2.根据权利要求1所述的方法,其特征在于,得到所述校正模型包括:
从所述AAAB型SNP位点的总个数中去除覆盖深度低于深度阈值的位点,得到剩余SNP位点的总数;
利用所述剩余SNP位点的总数及所述剩余SNP位点的平均覆盖深度,计算得到有效的计算浓度;
根据已知的所述胎儿浓度、有效的所述计算浓度、所述剩余SNP位点的总数及所述剩余SNP位点的平均覆盖深度,建立胎儿的校正浓度与有效的所述计算浓度、所述剩余SNP位点的总数及所述剩余SNP位点的平均覆盖深度之间的关系模型,得到所述校正模型。


3.根据权利要求2所述的方法,其特征在于,所述剩余SNP位点的总数满足数量阈值,所述数量阈值为大于等于100,优选地,所述深度阈值为大于等于100×。


4.根据权利要求2所述的方法,其特征在于,利用所述剩余SNP位点的总数及所述剩余SNP位点的平均覆盖深度,计算得到有效的计算浓度包括:
按照(2*B-DP)/DP计算出所述剩余SNP位点中每个SNP位点的胎儿浓度值,其中DP表示支持每个所述SNP位点的总reads数,B-DP表示支持每个所述SNP位点的来源于胎儿B等位基因型的reads数,2*B-DP表示支持每个所述SNP位点的来源于胎儿的A和B两种等位基因型的reads数;
将所述剩余SNP位点的所述胎儿浓度值的中位数,记为有效的所述计算浓度。


5.根据权利要求1至4中任一项所述的方法,其特征在于,分别统计每个所述第一类样本的所述测序数据中的AAAB型SNP位点的总个数之前,所述方法还包括:
利用FetalQuant找出所述测序数据中的所述AAAB型SNP位点。


6.根据权利要求2至4中任一项所述的方法,其特征在于,所述校正模型为:
CFF'=1.107*CFF+0.099*ln(avgdp)-0.1447*ln(Counts-of-AAAB)+0.3948,
其中,CFF’为所述校正浓度,CFF为所述计算浓度,Counts-of-AAAB为所述剩余SNP位点的总数,avgdp为所述剩余SNP位点的平均覆盖深度。


7.一种胎儿浓度定量的方法,其特征在于,所述方法包括:
获取待测样本的测序数据;
统计所述待测样本的所述测序数据中的AAAB型SNP位点的总个数及平均覆盖深度,并计算得到所述待测样本中胎儿的计算浓度;
将所述待测样本中胎儿的所述计算浓度、所述AAAB型SNP位点的总个数及所述平均覆盖深度,代入胎儿浓度的校正模型,得到所述待测样本中胎儿的校正浓度;
其中,所述AAAB型SNP位点是指母本为AA纯合型而胎儿为AB杂合型的SNP位点,所述校正模型为权利要求1至6中任一项所述的方法建立的校正模型。


8.根据权利要求7所述的方法,其特征在于,统计所述待测样本的所述测序数据中的AAAB型SNP位点的总个数及平均覆盖深度,并计算得到所述待测样本中胎儿的计算浓度包括:
从所述待测样本的所述测序数据中的所述AAAB型SNP位点的所述总个数中去除覆盖深度低于深度阈值的位点,得到所述待测样本中剩余SNP位点的总数;
利用所述待测样本中所述剩余SNP位点的总数及所述待测样本中所述剩余SNP位点的平均覆盖深度,计算得到所述待测样本中胎儿的有效的计算浓度。


9.根据权利要求8所述的方法,其特征在于,所述待测样本中剩余SNP位点的总数满足数量阈值,所述数量阈值为大于等于100,优选地,所述深度阈值为大于等于100×。


10.一种建立胎儿浓度校正模型的装置,其特征在于,所述装置包括:
第一获取模块,用于获取多个第一类样本的测序数据,所述第一类样本为已知胎儿浓度的样本,所述测序数据为靶向捕获文库的测序数据;<...

【专利技术属性】
技术研发人员:单光宇徐冰张静波刘文伍启熹王建伟刘倩唐宇
申请(专利权)人:北京科迅生物技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1