【技术实现步骤摘要】
基于低深度测序数据检测基因组纯合区域的方法及系统
[0001]本专利技术涉及分子遗传学检测
,特别是涉及一种基于低测序深度全基因组测序数据检测基因组纯合区域的方法及系统。
技术介绍
[0002]基因组纯合区域(Region ofhomozygousity,ROH)指的是基因组区域中出现等位基因杂合性缺失的现象,对于大多数二倍体细胞,例如人类体细胞等,有两份基因组,一份来自父方,一份来自母方,在基因组某个SNP位点,当来自双亲的碱基不同时,则称该SNP位点是杂合,如果因为某种机制(如缺失、减数分裂错误、近亲等)导致在该区域中的所有SNP位点只有来自父方或母方的一类基因组,则该区域为基因组纯合区域ROH,其中最典型的为单亲二倍体(uniparental disomy,UPD),是指同源染色体或染色体上的部分片段均来源于双亲中的一方,而没有另一方染色体的存在。
[0003]检测基因组纯合区域在近年来得到了越来越多的国内外专业团队的重视。在2020年,ACMG(American College ofMedical Genetics and Genomics,美国医学遗传学和基因组学学院)发布了有关ROH或UPD的声明,并对其检测的重要性表示了支持,同年国内也发表了不少有关ROH检测的文献报道。目前对ROH进行检测的检测技术主要分为两类,一类是针对目标特异性的纯合检测,主要技术包括短串联重复序列分型和甲基化特异性PCR等,然而该类技术只适用于对根据临床表现所怀疑的某个具体的基因组纯合区域进行检测;另一类是在全基因 ...
【技术保护点】
【技术特征摘要】
1.一种基于低深度测序数据检测基因组纯合区域的方法,其特征在于,所述方法包括:利用测序深度为0.1
×‑1×
的低深度全基因组测序技术对待测样本进行测序,得到低深度全基因组测序数据;所述待测样本为个体DNA;所述低深度全基因组测序数据包括多个碱基序列;分别将每一所述碱基序列与人类参考基因组进行比对,得到每一所述碱基序列在所述人类参考基因组中的位置和比对质量,并选取所述比对质量高于或者等于预设质量的碱基序列作为检测用碱基序列;以预设窗宽和预设步长对所述人类参考基因组进行区域划分,得到多个染色体区域;对于每一所述染色体区域,根据所有所述检测用碱基序列的位置,选取所述染色体区域中至少被一个所述检测用碱基序列覆盖的SNP位点作为目标SNP位点,并确定每一所述目标SNP位点上A等位基因被所述检测用碱基序列覆盖的第一次数和B等位基因被所述检测用碱基序列覆盖的第二次数;根据所述第一次数和所述第二次数计算每一所述目标SNP位点属于正常区域的第一边缘似然值和属于基因组纯合区域的第二边缘似然值;基于所述染色体区域内的所有所述目标SNP位点的第一边缘似然值计算第一联合分布似然值,基于所述染色体区域内的所有所述目标SNP位点的第二边缘似然值计算第二联合分布似然值;根据所述第一联合分布似然值和所述第二联合分布似然值确定所述染色体区域是否为基因组纯合区域。2.根据权利要求1所述的方法,其特征在于,所述预设质量为所述碱基序列和所述人类参考基因组仅有一个碱基错配。3.根据权利要求1所述的方法,其特征在于,每一所述染色体区域的宽度均为所述预设窗宽,所述预设窗宽大于所述预设步长,相邻所述染色体区域存在重叠。4.根据权利要求1所述的方法,其特征在于,所述根据所述第一次数和所述第二次数计算每一所述目标SNP位点属于正常区域的第一边缘似然值和属于基因组纯合区域的第二边缘似然值具体包括:对于每一所述目标SNP位点,以所述第一次数、所述第二次数以及正常区域对应的每一第一基因型的基因型分布概率和等位基因A的频率为输入,利用边缘似然值计算公式计算所述目标SNP位点属于正常区域的第一边缘似然值;以所述第一次数、所述第二次数以及基因组纯合区域对应的每一第二基因型的基因型分布概率和等位基因A的频率为输入,利用边缘似然值计算公式计算所述目标SNP位点属于基因组纯合区域的第二边缘似然值。5.根据权利要求4所述的方法,其特征在于,所述正常区域对应的第一基因型包括AA、AB和BB;第一基因型AA的基因型分布概率为p2+p(1
‑
p)F,等位基因A的频率为1
‑
e;第一基因型AB的基因型分布概率为2p(1
‑
p)(1
‑
F),等位基因A的频率为1/2;第一基因型BB的基因型分布概率为(1
‑
p)2+p(1
‑
p)F,等位基因A的频率为e;其中,p为A等位基因在个体所属种族人群中的群体频率;F为个体的近交系数;e为测序错误率;所述基因组纯合区域对应的第二基因型包括AA和BB;第二基因型AA的基因型分布概率为p,等位基因A的频率为1
‑
e;第二基因型BB的基因型分布概率为1
‑
p,等位基因A的频率为e。6.根据权利要求4所述的方法,其特征在于,所述边缘似然值计算公式为:M(F,e)=∑
g
P(g)B(F
A
(g),C
i
);
其中,...
【专利技术属性】
技术研发人员:徐寒黎,谢玉婷,成喜雨,吕兴,金怡宸,马腾跃,李欣怡,
申请(专利权)人:北京交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。