【技术实现步骤摘要】
用于胎儿无创产前检测的系统
[0001]本专利技术涉及产前诊断领域,具体涉及用于胎儿无创产前检测的系统。
技术介绍
[0002]遗传性疾病是指人类遗传物质发生改变或异常而导致胎儿出生时或出生后机体结构和功能发生异常或受损的疾病。遗传性疾病主要有染色体异常和单基因遗传病,其严重威胁着人类的健康,是社会重大的公共卫生问题。
[0003]染色体异常主要包括拷贝数异常和结构异常,最常见的染色体异常是染色体非整倍体,即染色体数目改变(多于或少于46条,或某染色体数目不是正常的两条而是三条或一条或四条或其它的数目)。临床上最常见的染色体非整倍体疾病是21
‑
三体(唐氏综合征)、18
‑
三体(爱德华综合征)、13
‑
三体(帕托综合征)。微缺失微重复综合症是除染色体非整倍体之外的另一大类出生新生儿出生缺陷。有数据显示,截止2012年11月,已发表的染色体微缺失疾病211种,染色体微重复疾病79种。染色体微缺失/微重复综合征的发病率1/4000~1/2000000不等,缺失和重复片段较小,通常小于5Mb,容易被产前诊断漏检。有数据显示大多数染色体微缺失/微重复疾病为新发突变,并且发病风险与年龄无显著相关性。致病或可能致病的染色体微缺失/微重复为1.7%,且再发风险较高。单基因遗传病是指由单个基因突变引起的遗传病,单一发病率低,但种类繁多、总发病率较高。根据世界卫生组织(WHO)统计,全球出生人口所有单基因遗传病累计发病率高达10/1000。
[0004]通过对遗传病 ...
【技术保护点】
【技术特征摘要】
1.用于胎儿无创产前检测的系统,包括测序装置、数据分析装置和结果输出装置,其中:所述测序装置用于确定孕妇外周血中游离DNA测序文库的序列信息,获得测序结果;所述结果输出装置用于输出数据分析装置的分析结果;其特征在于,所述数据分析装置的分析方法包括如下步骤:将测序结果比对到人类参考基因组,构建唯一比对测序序列集,并记录每条测序序列比对的位置信息;按照单位窗口长度切割参考基因组,将其划分为多个一级窗口;根据每条唯一序列的比对位置信息,统计唯一比对序列在每个窗口出现的未修正频次数目;根据GC值对未修正频次数目进行修正,得到修正后的频次数目;胎儿核酸百分比的预测:从Y染色体估算胎儿核酸百分比PY:计算Y染色体平均深度depth Y,Depth Y=落在Y染色体上各个窗口修正后的频次数目之和/Y染色体整条染色体碱基长度,正常男性的Y染色体平均深度男性depth Y,计为Dmale值,正常女性的Y染色体平均深度女性depth Y,计为Dfemale值;待检测样本的Y染色体平均深度,计为Dtest,待检测样本的胎儿核酸百分比PY=[(Dtest
‑
Dfemale)/Dmale]
‑
Dfemale;通过非监督学习法对已知正常样本进行主成分分析,得到主成分集PCs;选取主成分集PCs,引入人工神经网络,利用标签上已知胎儿Y染色体胎儿核酸百分比PY的样本集来对PCs重新进行权重,构建权重
‑
主成分
‑
PY神经网络模型;预测胎儿核酸百分比PF:把待检测样本的染色体窗口的修正频次数目通过主成分分析技术转换成主成分集PCs,然后根据权重
‑
主成分
‑
PY神经网络模型输出神经元值PF;微缺失微重复片段的异常百分比PA的确定:任意设定一个断点位置,对断点位置左右两边的窗口修正后频次数目通过数学检验的方法来计算显著性水平p
‑
value值,如果计算的p
‑
value值小于事先设定的显著性水平值p
‑
set,则那个窗口被选定成待选微缺失微重复窗口;如果计算的p
‑
value值大于设定的显著性水平值p
‑
set,则继续合并窗口进行下一步的检验直至得到待选微缺失微重复窗口;合并确定的待选微缺失微重复窗口的相邻窗口,获得选定微缺失微重复区域;对每个微缺失微重复的区域进行深度depth(abnormal)计算,depth(abnormal)=落在该微缺失微重复区域的修正后频次数目/该微缺失微重复区域大小;对染色体其他不包含微缺失微重复的区域同样也进行平均深度depth(normal)计算,depth(normal)=落在每条染色体其余不包含微缺失微重复区域的修正后频次数目/其余不包含微缺失微重复区域大小;计算含有微缺失微重复片段或者一整条染色体拷贝数变异的异常百分比PA=2
ꢀ×
|depth(normal)
‑
depth(abnormal)|/depth(normal),且当depth(normal)
‑
depth(abnormal)为正数时,认定为初步微缺失变异;当depth(normal)
‑
depth(abnormal)为负数时,认定为初步微重复变异;当depth(normal)
‑
depth(abnormal)为0时,判定为正常;染色体拷贝数变异判定:获得染色体拷贝数变异百分比为PA_chri(i=1,2,
……
,22,X,Y),包括如下步骤:
对每条染色体的进行占比Coverage_chri(i=1,2,
……
22,X,Y)计算,Coverage_chri=落在该条染色体所有修正后窗口频次数目/落在该样本所有染色体所有窗口频次数目之和;基于已知正常样本,对每条染色体的进行占比Coverage
‑
normal_chri(i=1,2,
……
22,X,Y)计算,Coverage
‑
normal_chri=落在该条染色体所有修正后窗口频次数目/落在该样本所有染色体所有窗口频次数目之和,所有样本各条染色体的占比值取平均值,得到Average(Coverage
‑
normal_chri)(i=1,2,
…………
22,X,Y);计算待检测样本每条染色体拷贝数变异百分比PC_chri,PC_chri=2
ꢀ×
(Coverage_chri
‑
Average(Coverage
‑
normal_chri))/Average(Coverage
‑
normal_chri);计算待检测样本每条染色体拷贝数变异百分比PC与胎儿核酸百分比PF的比值 ratio R,R=|PC|/PF;根据PC_chri和R值,确定染色体拷贝数变异;单基因遗传病的预测:将来源同一个cfDNA的reads,在每一个碱基位点上依次进行对齐,从该组reads的第一个碱基位点开始统计,如果只有≤30%的reads在该位点为相同的碱基,该碱基被认为是背景噪音;如果有≥70%的reads在该位点为相同的碱基,则该位点的碱基种类被确认;如果只有30%
‑
70%的reads含有相同的碱基,则该碱基被定为N碱基;在该组reads的第二个碱基位点进行相同的统计,一直到该组reads的最后位点结束,获取来源于同一个cfDNA分子的reads的碱基序列;使用bwa aln算法将测序得到的cfDNA分子的reads碱基序列比对到人类参考基因组;对各覆盖位点的碱基进行检测,统计各位点上A、T、G、C、N、insertion、deletion的各自深度、与深度比率;选取单基因疾病位置查看该位置的总覆盖深度,若总深度覆盖小于1000X则质控不通过,总深度大于1000
×
则质控通过;找到明确需要观测的致...
【专利技术属性】
技术研发人员:曾晓静,蒋馥蔓,李胜,杜伯乐,夏伟成,郭宇来,秦炳财,王阳,李小坤,
申请(专利权)人:广州精科医学检验所有限公司深圳精科基因科技有限公司深圳精科医学检验实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。