用于胎儿无创产前检测的系统技术方案

技术编号:37851851 阅读:11 留言:0更新日期:2023-06-14 22:42
本发明专利技术公开了用于胎儿无创产前检测的系统,包括测序装置、数据分析装置和结果输出装置。在获得血浆游离DNA的测序数据后,利用自有算法进行染色体拷贝数分析、染色体微缺失微重复分析、单基因病分析。在检测成本和检测时间几乎不增加的基础上,实现了微缺失微重复综合征的检测,利用神经网络来预估总体胎儿DNA占比百分比,数据显示可以提高检测精度到2M的分辨率。辨率。辨率。

【技术实现步骤摘要】
用于胎儿无创产前检测的系统


[0001]本专利技术涉及产前诊断领域,具体涉及用于胎儿无创产前检测的系统。

技术介绍

[0002]遗传性疾病是指人类遗传物质发生改变或异常而导致胎儿出生时或出生后机体结构和功能发生异常或受损的疾病。遗传性疾病主要有染色体异常和单基因遗传病,其严重威胁着人类的健康,是社会重大的公共卫生问题。
[0003]染色体异常主要包括拷贝数异常和结构异常,最常见的染色体异常是染色体非整倍体,即染色体数目改变(多于或少于46条,或某染色体数目不是正常的两条而是三条或一条或四条或其它的数目)。临床上最常见的染色体非整倍体疾病是21

三体(唐氏综合征)、18

三体(爱德华综合征)、13

三体(帕托综合征)。微缺失微重复综合症是除染色体非整倍体之外的另一大类出生新生儿出生缺陷。有数据显示,截止2012年11月,已发表的染色体微缺失疾病211种,染色体微重复疾病79种。染色体微缺失/微重复综合征的发病率1/4000~1/2000000不等,缺失和重复片段较小,通常小于5Mb,容易被产前诊断漏检。有数据显示大多数染色体微缺失/微重复疾病为新发突变,并且发病风险与年龄无显著相关性。致病或可能致病的染色体微缺失/微重复为1.7%,且再发风险较高。单基因遗传病是指由单个基因突变引起的遗传病,单一发病率低,但种类繁多、总发病率较高。根据世界卫生组织(WHO)统计,全球出生人口所有单基因遗传病累计发病率高达10/1000。
[0004]通过对遗传病的研究,可以有效的预防和治疗遗传病,为人类带来福音。其中,对遗传疾病的早诊早治非常关键。临床上传统的筛查方式包括血清学检查和影像学检查,当结果表现为阳性时,将通过侵入性检测(胎盘绒毛膜取样或羊水穿刺等)进行产前诊断。然而这些方法的灵敏度不高,存在一定的假阳性,且侵入性检查有一定的流产风险。
[0005]中国香港学者卢煜明教授在1997年发现母体血浆中3~13%的游离核酸来自胎儿,从而开启了利用孕妇血浆进行无创伤性产前诊断的新历程。最初,由于受大量母体游离DNA影响,无创产前DNA分析非常具有挑战性,但随着高通量测序技术快速发展,千万级数量的DNA片段得以量化,从而检测出21

三体、18

三体和13

三体综合征等染色体非整倍体,目前该技术已被临床实践广泛验证和认可,其对染色体非整倍体的特异性约为97

99%,且假阳性率低(<0 .1%)。目前常规的无创胎儿产前检测的方法有WGS方法和SNP方法。相比于WGS方法,SNP方法(对特定序列进行扩增)可检测的胎儿浓度更低,但检测时间长,开发难度大,且检测的范围有限,非SNP位点区域的序列无法检测。已有机构尝试使用芯片捕获的方法进行无创产前检测,即对选定的特殊和重要区域设计探针,然后对孕妇外周血游离DNA进行捕获,再建库测序。该方法相比于WGS的方法来说,增加了芯片捕获的步骤和成本,检测时间长,成本高。虽然,相比于SNP方法,WGS方法需要更高的数据量,但是目前测序成本在检测中占比不断降低,未来测序成本还会不断下降。因此检测覆盖度在未来的检测当中作用会越来越重要。近年来,该应用更是扩展到微缺失微重复的检测。来自广东省妇幼保健院的尹爱华团队在2015年9月公布了他们使用WGS方法对孕妇血浆进行NIPT检测,并检出胎儿染色体
微缺失/微重复且经过产前诊断确认了微缺失/微重复的研究结果。由于存在母体背景DNA干扰,通过各种办法提高胎儿染色体微缺失/微重复的检测准确性非常重要,常见的方法有:提高分析结果中的胎儿游离DNA浓度;优化分析算法;使用SNP方法等。显然SNP方法存在检测位点有限的缺点无法避免,因此实际使用中,前2种方法使用更广泛。
[0006]单基因遗传病危害严重,大多数致畸、致残甚至致死,缺乏有效治疗手段。有研究表明,约有一半的单基因病为显性单基因病,其中新发变异致病比例约占其中的74%。新发突变并非来自父母遗传,孕期不一定有表型或在妊娠晚期才会出现超声异常,目前在临床上缺乏有效的早期筛查方法,容易在产前漏检。随着优生优育的需求和检测技术的发展,孕前单基因遗传病的检测需求日渐增长。然而,目前临床上胎儿单基因遗传病检测主要依赖于有创侵入性检测,即需要收集羊水、绒毛膜等样本进行检测。这些侵入性检测依赖于医生熟练的技术,且成本高昂,更重要的是侵入性检测有流产风险(约0.5~1%)。
[0007]现有技术中,缺乏一种准确性高的微缺失微重复检测方法,同时对单基因显性遗传病检测的准确性也相对偏低。

技术实现思路

[0008]本专利技术的目的在于克服现有技术的至少一个不足,提供一种用于胎儿无创产前检测的系统。
[0009]本专利技术所采取的技术方案是:用于胎儿无创产前检测的系统,包括测序装置、数据分析装置和结果输出装置,其中:所述测序装置用于确定孕妇外周血中游离DNA测序文库的序列信息,获得测序结果;所述结果输出装置用于输出数据分析装置的分析结果;所述数据分析装置的分析方法包括如下步骤:将测序结果比对到人类参考基因组,构建唯一比对测序序列集,并记录每条测序序列比对的位置信息;按照单位窗口长度切割参考基因组,将其划分为多个一级窗口;根据每条唯一序列的比对位置信息,统计唯一比对序列在每个窗口出现的未修正频次数目;根据GC值对未修正频次数目进行修正,得到修正后的频次数目;胎儿核酸百分比的预测:从Y染色体估算胎儿核酸百分比PY:计算Y染色体平均深度depth Y,Depth Y=落在Y染色体上各个窗口修正后的频次数目之和/Y染色体整条染色体碱基长度,正常男性的Y染色体平均深度男性depth Y,计为Dmale值,正常女性的Y染色体平均深度女性depth Y,计为Dfemale值;待检测样本的Y染色体平均深度,计为Dtest,待检测样本的胎儿核酸百分比PY=[(Dtest

Dfemale)/Dmale]‑
Dfemale;通过非监督学习法对已知正常样本进行主成分分析,得到主成分集PCs;选取主成分集PCs,引入人工神经网络,利用标签上已知胎儿Y染色体胎儿核酸百
分比PY的样本集来对PCs重新进行权重,构建权重

主成分

PY神经网络模型;预测胎儿核酸百分比PF:把待检测样本的染色体窗口的修正频次数目通过主成分分析技术转换成主成分集PCs,然后根据权重

主成分

PY神经网络模型输出神经元值PF;微缺失微重复片段的异常百分比PA的确定:任意设定一个断点位置,对断点位置左右两边的窗口修正后频次数目通过数学检验的方法来计算显著性水平p

value值,如果计算的p

value值小于事先设定的显著性水平值p

set,则那个窗口被选定成待选微缺失微重复窗口;如果计算的p

value值大于设定的显著性水平值本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.用于胎儿无创产前检测的系统,包括测序装置、数据分析装置和结果输出装置,其中:所述测序装置用于确定孕妇外周血中游离DNA测序文库的序列信息,获得测序结果;所述结果输出装置用于输出数据分析装置的分析结果;其特征在于,所述数据分析装置的分析方法包括如下步骤:将测序结果比对到人类参考基因组,构建唯一比对测序序列集,并记录每条测序序列比对的位置信息;按照单位窗口长度切割参考基因组,将其划分为多个一级窗口;根据每条唯一序列的比对位置信息,统计唯一比对序列在每个窗口出现的未修正频次数目;根据GC值对未修正频次数目进行修正,得到修正后的频次数目;胎儿核酸百分比的预测:从Y染色体估算胎儿核酸百分比PY:计算Y染色体平均深度depth Y,Depth Y=落在Y染色体上各个窗口修正后的频次数目之和/Y染色体整条染色体碱基长度,正常男性的Y染色体平均深度男性depth Y,计为Dmale值,正常女性的Y染色体平均深度女性depth Y,计为Dfemale值;待检测样本的Y染色体平均深度,计为Dtest,待检测样本的胎儿核酸百分比PY=[(Dtest

Dfemale)/Dmale]

Dfemale;通过非监督学习法对已知正常样本进行主成分分析,得到主成分集PCs;选取主成分集PCs,引入人工神经网络,利用标签上已知胎儿Y染色体胎儿核酸百分比PY的样本集来对PCs重新进行权重,构建权重

主成分

PY神经网络模型;预测胎儿核酸百分比PF:把待检测样本的染色体窗口的修正频次数目通过主成分分析技术转换成主成分集PCs,然后根据权重

主成分

PY神经网络模型输出神经元值PF;微缺失微重复片段的异常百分比PA的确定:任意设定一个断点位置,对断点位置左右两边的窗口修正后频次数目通过数学检验的方法来计算显著性水平p

value值,如果计算的p

value值小于事先设定的显著性水平值p

set,则那个窗口被选定成待选微缺失微重复窗口;如果计算的p

value值大于设定的显著性水平值p

set,则继续合并窗口进行下一步的检验直至得到待选微缺失微重复窗口;合并确定的待选微缺失微重复窗口的相邻窗口,获得选定微缺失微重复区域;对每个微缺失微重复的区域进行深度depth(abnormal)计算,depth(abnormal)=落在该微缺失微重复区域的修正后频次数目/该微缺失微重复区域大小;对染色体其他不包含微缺失微重复的区域同样也进行平均深度depth(normal)计算,depth(normal)=落在每条染色体其余不包含微缺失微重复区域的修正后频次数目/其余不包含微缺失微重复区域大小;计算含有微缺失微重复片段或者一整条染色体拷贝数变异的异常百分比PA=2
ꢀ×
|depth(normal)

depth(abnormal)|/depth(normal),且当depth(normal)

depth(abnormal)为正数时,认定为初步微缺失变异;当depth(normal)

depth(abnormal)为负数时,认定为初步微重复变异;当depth(normal)

depth(abnormal)为0时,判定为正常;染色体拷贝数变异判定:获得染色体拷贝数变异百分比为PA_chri(i=1,2,
……
,22,X,Y),包括如下步骤:
对每条染色体的进行占比Coverage_chri(i=1,2,
……
22,X,Y)计算,Coverage_chri=落在该条染色体所有修正后窗口频次数目/落在该样本所有染色体所有窗口频次数目之和;基于已知正常样本,对每条染色体的进行占比Coverage

normal_chri(i=1,2,
……
22,X,Y)计算,Coverage

normal_chri=落在该条染色体所有修正后窗口频次数目/落在该样本所有染色体所有窗口频次数目之和,所有样本各条染色体的占比值取平均值,得到Average(Coverage

normal_chri)(i=1,2,
…………
22,X,Y);计算待检测样本每条染色体拷贝数变异百分比PC_chri,PC_chri=2
ꢀ×
(Coverage_chri

Average(Coverage

normal_chri))/Average(Coverage

normal_chri);计算待检测样本每条染色体拷贝数变异百分比PC与胎儿核酸百分比PF的比值 ratio R,R=|PC|/PF;根据PC_chri和R值,确定染色体拷贝数变异;单基因遗传病的预测:将来源同一个cfDNA的reads,在每一个碱基位点上依次进行对齐,从该组reads的第一个碱基位点开始统计,如果只有≤30%的reads在该位点为相同的碱基,该碱基被认为是背景噪音;如果有≥70%的reads在该位点为相同的碱基,则该位点的碱基种类被确认;如果只有30%

70%的reads含有相同的碱基,则该碱基被定为N碱基;在该组reads的第二个碱基位点进行相同的统计,一直到该组reads的最后位点结束,获取来源于同一个cfDNA分子的reads的碱基序列;使用bwa aln算法将测序得到的cfDNA分子的reads碱基序列比对到人类参考基因组;对各覆盖位点的碱基进行检测,统计各位点上A、T、G、C、N、insertion、deletion的各自深度、与深度比率;选取单基因疾病位置查看该位置的总覆盖深度,若总深度覆盖小于1000X则质控不通过,总深度大于1000
×
则质控通过;找到明确需要观测的致...

【专利技术属性】
技术研发人员:曾晓静蒋馥蔓李胜杜伯乐夏伟成郭宇来秦炳财王阳李小坤
申请(专利权)人:广州精科医学检验所有限公司深圳精科基因科技有限公司深圳精科医学检验实验室
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1