【技术实现步骤摘要】
建立胎儿浓度校正模型的方法及装置与胎儿浓度定量的方法及装置
本专利技术涉及高通量测序
,具体而言,涉及一种建立胎儿浓度校正模型的方法及装置与胎儿浓度定量的方法及装置。
技术介绍
在单基因病的临床实践中,利用孕妇外周血检测胎儿浓度是一项非常重要的工作。目前常用的方法是制备产前诊断文库进行胎儿浓度定量。目前,单基因病产前检测需要同时制备两个文库:产前诊断文库和靶向捕获文库,其中,产前诊断文库用于胎儿浓度定量,靶向捕获文库用于变异检测。这对于本来样本量就少的临床样本来说,靶向捕获测序文库的数据并未充分利用,不仅浪费了捕获文库的信息,而且还浪费了珍贵的临床样本。然而,目前对于这一状况尚无有效的解决方案。
技术实现思路
本专利技术的主要目的在于提供一种建立胎儿浓度校正模型的方法及装置与胎儿浓度定量的方法及装置,以解决现有技术无法有效利用捕获文库的测序数据对胎儿浓度进行准确定量的问题。为了实现上述目的,根据本专利技术的一个方面,提供了一种建立胎儿浓度校正模型的方法,该方法包括:获取多个第一类样本的测序数据,第一类样本为已知胎儿浓度的样本,测序数据为靶向捕获文库的测序数据;分别统计每个第一类样本的测序数据中的AAAB型SNP位点的总个数及平均覆盖深度,并计算得到胎儿的计算浓度;根据已知胎儿浓度、计算浓度、AAAB型SNP位点的总个数及平均覆盖深度,建立胎儿的校正浓度与计算浓度、AAAB型SNP位点的总个数及平均覆盖深度之间的关系模型,得到校正模型;其中,AAAB型SNP位点 ...
【技术保护点】
1.一种建立胎儿浓度校正模型的方法,其特征在于,所述方法包括:/n获取多个第一类样本的测序数据,所述第一类样本为已知胎儿浓度的样本,所述测序数据为靶向捕获文库的测序数据;/n分别统计每个所述第一类样本的所述测序数据中的AAAB型SNP位点的总个数及平均覆盖深度,并计算得到胎儿的计算浓度;/n根据所述已知胎儿浓度、所述计算浓度、所述AAAB型SNP位点的总个数及所述平均覆盖深度,建立胎儿的校正浓度与所述计算浓度、所述AAAB型SNP位点的总个数及所述平均覆盖深度之间的关系模型,得到所述校正模型;/n其中,所述AAAB型SNP位点是指母本为AA纯合型而胎儿为AB杂合型的SNP位点。/n
【技术特征摘要】
1.一种建立胎儿浓度校正模型的方法,其特征在于,所述方法包括:
获取多个第一类样本的测序数据,所述第一类样本为已知胎儿浓度的样本,所述测序数据为靶向捕获文库的测序数据;
分别统计每个所述第一类样本的所述测序数据中的AAAB型SNP位点的总个数及平均覆盖深度,并计算得到胎儿的计算浓度;
根据所述已知胎儿浓度、所述计算浓度、所述AAAB型SNP位点的总个数及所述平均覆盖深度,建立胎儿的校正浓度与所述计算浓度、所述AAAB型SNP位点的总个数及所述平均覆盖深度之间的关系模型,得到所述校正模型;
其中,所述AAAB型SNP位点是指母本为AA纯合型而胎儿为AB杂合型的SNP位点。
2.根据权利要求1所述的方法,其特征在于,得到所述校正模型包括:
从所述AAAB型SNP位点的总个数中去除覆盖深度低于深度阈值的位点,得到剩余SNP位点的总数;
利用所述剩余SNP位点的总数及所述剩余SNP位点的平均覆盖深度,计算得到有效的计算浓度;
根据已知的所述胎儿浓度、有效的所述计算浓度、所述剩余SNP位点的总数及所述剩余SNP位点的平均覆盖深度,建立胎儿的校正浓度与有效的所述计算浓度、所述剩余SNP位点的总数及所述剩余SNP位点的平均覆盖深度之间的关系模型,得到所述校正模型。
3.根据权利要求2所述的方法,其特征在于,所述剩余SNP位点的总数满足数量阈值,所述数量阈值为大于等于100,优选地,所述深度阈值为大于等于100×。
4.根据权利要求2所述的方法,其特征在于,利用所述剩余SNP位点的总数及所述剩余SNP位点的平均覆盖深度,计算得到有效的计算浓度包括:
按照(2*B-DP)/DP计算出所述剩余SNP位点中每个SNP位点的胎儿浓度值,其中DP表示支持每个所述SNP位点的总reads数,B-DP表示支持每个所述SNP位点的来源于胎儿B等位基因型的reads数,2*B-DP表示支持每个所述SNP位点的来源于胎儿的A和B两种等位基因型的reads数;
将所述剩余SNP位点的所述胎儿浓度值的中位数,记为有效的所述计算浓度。
5.根据权利要求1至4中任一项所述的方法,其特征在于,分别统计每个所述第一类样本的所述测序数据中的AAAB型SNP位点的总个数之前,所述方法还包括:
利用FetalQuant找出所述测序数据中的所述AAAB型SNP位点。
6.根据权利要求2至4中任一项所述的方法,其特征在于,所述校正模型为:
CFF'=1.107*CFF+0.099*ln(avgdp)-0.1447*ln(Counts-of-AAAB)+0.3948,
其中,CFF’为所述校正浓度,CFF为所述计算浓度,Counts-of-AAAB为所述剩余SNP位点的总数,avgdp为所述剩余SNP位点的平均覆盖深度。
7.一种胎儿浓度定量的方法,其特征在于,所述方法包括:
获取待测样本的测序数据;
统计所述待测样本的所述测序数据中的AAAB型SNP位点的总个数及平均覆盖深度,并计算得到所述待测样本中胎儿的计算浓度;
将所述待测样本中胎儿的所述计算浓度、所述AAAB型SNP位点的总个数及所述平均覆盖深度,代入胎儿浓度的校正模型,得到所述待测样本中胎儿的校正浓度;
其中,所述AAAB型SNP位点是指母本为AA纯合型而胎儿为AB杂合型的SNP位点,所述校正模型为权利要求1至6中任一项所述的方法建立的校正模型。
8.根据权利要求7所述的方法,其特征在于,统计所述待测样本的所述测序数据中的AAAB型SNP位点的总个数及平均覆盖深度,并计算得到所述待测样本中胎儿的计算浓度包括:
从所述待测样本的所述测序数据中的所述AAAB型SNP位点的所述总个数中去除覆盖深度低于深度阈值的位点,得到所述待测样本中剩余SNP位点的总数;
利用所述待测样本中所述剩余SNP位点的总数及所述待测样本中所述剩余SNP位点的平均覆盖深度,计算得到所述待测样本中胎儿的有效的计算浓度。
9.根据权利要求8所述的方法,其特征在于,所述待测样本中剩余SNP位点的总数满足数量阈值,所述数量阈值为大于等于100,优选地,所述深度阈值为大于等于100×。
10.一种建立胎儿浓度校正模型的装置,其特征在于,所述装置包括:
第一获取模块,用于获取多个第一类样本的测序数据,所述第一类样本为已知胎儿浓度的样本,所述测序数据为靶向捕获文库的测序数据;<...
【专利技术属性】
技术研发人员:单光宇,徐冰,张静波,刘文,伍启熹,王建伟,刘倩,唐宇,
申请(专利权)人:北京科迅生物技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。