基于核心家系的遗传病高通量测序致病突变筛选方法技术

技术编号:27405012 阅读:28 留言:0更新日期:2021-02-21 14:18
本发明专利技术属于基因突变检测领域,涉及基于遗传病高通量测序数据,利用核心家系分析方法筛选致病突变的方法。本发明专利技术提供了一种基于核心家系的遗传病高通量测序致病突变筛选方法,包括:获得待检测的基因组样本,所述的基因组样本源自子代及其父母;使用高通量方法测定待检测的基因组样本的DNA序列,将测序结果与人类参考基因组进行比对和注释,形成注释文件;使用二分法对注释文件进行分析和筛选,去除高频突变,为检测到的基因突变分类;根据检测到的基因突变的分类和注释去除非致病突变。本发明专利技术的方法可成为遗传病高通量测序分析的有效工具,可以快速、准确地找出致病位点,实现分析的标准化、流程化和半自动化。流程化和半自动化。流程化和半自动化。

【技术实现步骤摘要】
基于核心家系的遗传病高通量测序致病突变筛选方法


[0001]本专利技术基于遗传病高通量测序数据,利用核心家系分析方法筛选致病突变,属于医学中遗传病基因突变检测领域。本专利技术还提供了上述筛选方法的应用和装置。
技术背景
[0002]当前以全外显子测序为代表的高通量测序是人类遗传病检测和诊断的主要手段。高通量测序可以发现海量的变异,判断这些变异的有害性,找出和确认导致病患的致病基因和致病位点,是遗传病基因检测的主要任务。
[0003]在测序得到的变异中,有些变异在人群中有较高的分布频率。较高的分布频率意味着,如果该变异是有害的和不利于生存的,在显性遗传的情况下携带该突变的个体将趋于淘汰;在隐性遗传的情况下很容易与同一变异携带者婚配,从而生下纯合型携带者而趋于淘汰,自然地携带该突变的个体数量将趋于减少,因此高频率一般代表无害。在对基因变异进行注释时,根据变异在千人基因组数据库和其它同类数据库中的频率,就可以将大部分变异从致病变异候选者中排除出去。
[0004]在较低频率的变异中,有些变异属于移码突变,可导致其后所编码的肽链完全改变且在多数情况下很快中断;或者突变产生一个终止密码子引起所编码的肽链截断,除个别蛋白质外,这通常会导致蛋白质的失活,故该类型突变在大部分的已知机理下是有害的。因此在多数情况下,包括移码突变在内的截断突变是可快速判断为有害性突变的突变类型。
[0005]有些突变发生在外显子前面或后面的内含子区域一两个碱基的位置。这些位置是与转录剪切有关的位置,该位置的突变将改变蛋白质序列,通常也是有害的,是较易判断的突变类型。
[0006]还有一大类分布于内含子或外显子上的碱基置换型的变异,或者插入或缺失少数碱基且不引起移码突变的变异,这些变异中的一部分已被深入地研究过,突变有害性被广泛认可。在引用这些已经研究过的突变的致病性结果时,既可以检索文献,也可以查阅或通过程序自动调取基因突变数据库,如HGMD,ClinVar,dbSNP,Ensembl数据库等。
[0007]然而还有大量非同义突变(即使同义突变,也不一定是无害的),在人群中分布频率较低,又无文献支持,其致病性是难以判断的。在未经实验研究的情况下为了初步判断突变的致病性,可以使用一些基因突变致病性预测软件进行初步的预测,这些软件从比较早期的SIFT,PolyPhen,MutationTaster,到最近几年发展起来的LRT,FATHMM,PROVEAN,VEST3, fathmm-MKL,MetaSVM,MetaLR等等,这个领域的软件越来越多了。
[0008]经过一系列筛选,仍然有大量突变的致病性无法判断。而核心家系分析方法可排除不符合家系遗传规律的突变,有效地缩小待分析突变的数目。所谓核心家系,指为了检测遗传病患者的致病突变,而对患者和其生物学父母同时进行高通量测序,并将三人的数据放在一起进行分析的方法。核心家系分析对于先证者双突变分别来自父母,从而构成复合杂合突变的判断是无法替代的。对于新发突变,X连锁等突变致病性的判断,也依赖于对父
母同一位置的检测。对先证者及其父母的所有突变进行家系分析通常由人工阅读的方式完成。然而,人工方法进行核心家系分析,是非常费时费力的,也容易出错和遗漏。鉴于此,本专利技术开发遗传病高通量测序的核心家系分析的整体性和自动化的方法,以提高遗传病的高通量测序的致病变异的检出效率。

技术实现思路

[0009]本专利技术要解决的技术问题是提供致病突变分析的有效工具,可以快速、准确地找出致病位点,实现分析的标准化、流程化和半自动化,为优生优育提供指导意见基础。
[0010]当前以全外显子测序为代表的高通量测序是人类遗传病检测和诊断的主要手段。若突变不属于高频突变、移码突变、终止突变、剪切突变、同义突变、数据库记录了致病性等比较容易判断其致病性的突变,而使用基因突变致病性预测软件如SIFT,PolyPhen, MutationTaster,LRT,FATHMM,PROVEAN,VEST3,fathmm-MKL,MetaSVM,MetaLR等的预测,又不能给出准确的结论,那么使用核心家系分析就成为判断致病突变的重要辅助手段了。
[0011]由于核心家系分析通常依赖人工的判断,而人工判断存在着费时费力、易错、易遗漏的问题,因此本专利技术开发了核心家系分析的方法(以下简称本专利技术)。本专利技术的
技术实现思路
包括: (1)本专利技术将病人区分为三种核心家系类型,分别为:孩子(子代)有疾病表型而父母无表型,孩子和父亲有相同或近似疾病表型而母亲无表型,孩子和母亲有相同或近似疾病表型而父亲无表型;(2)对每种核心家系类型,本专利技术给出孩子、父、母突变的各种基因型组合;(3) 本专利技术根据家系遗传共分离原则,根据基因型组合出现的可能性及致病可能性对组合或复合组合进行了致病性分类,分别为:弱组合、强可能、弱可能、微可能;(4)本专利技术为各种基因型组合或复合组合给出了各种遗传模式下的突变致病性分类;(5)本专利技术总结了三种家系类型下各种遗传模式下致病强可能的基因型组合及复合组合。某个基因或突变如具有致病强可能的突变基因型组合或复合组合,本专利技术称该基因或突变“遗传合式”,该基因为遗传合式基因,该突变或几个突变为遗传合式突变;(6)根据强致病可能的基因型组合及复合组合的规律,本专利技术对任一基因的所有突变中,是否包含了致病强组合或复合组合给出了判断。如果某基因的突变包含了致病强组合或复合组合,即该基因为遗传合式的基因,则该基因的所有突变都赋值1,否则该基因的所有突变赋值0。
[0012]本专利技术提供一种基于核心家系的遗传病高通量测序致病突变筛选方法,所述的基于核心家系的遗传病高通量测序致病突变筛选方法包括以下步骤:
[0013]获得待检测的基因组样本,所述的基因组样本源自子代及其父母;
[0014]使用高通量方法测定待检测的基因组样本的DNA序列,将测序结果与人类参考基因组进行比对和注释,形成基因型组合;
[0015]使用二分法对注释文件进行分析和筛选,去除高频突变,为检测到的基因突变分类,所述的分类包括核心家系分类或者致病可能性分类;
[0016]根据检测到的基因突变的分类和注释检测致病强组合或复合组合,并去除非致病突变,筛选获得遗传合式的基因。
[0017]所述的基因组样本源自子代及其父母的离体样本,包括但不限于血液、唾液、尿液、上皮细胞或者组织样本。
[0018]所述的高通量方法包括二代测序或者芯片筛查方法,等等。
[0019]所述的注释文件包括但不限于基因位点所属基因名称、在基因组中位置、基因型、相关功能或者文献、变异位点在数据库中的ID、参考基因组上的碱基、变异之后的碱基、变异位点的质量、过滤信息、等位基因测序深度,等等。
[0020]所述的基因型组合中,每个突变的基因型组合使用诸如0/1这样的“数字斜杠数字”的方式表示,两个数字代表每个基因的两个等位基因,0表示与参考序列相比未发生变异,1表示与参考序列相比发生了1种变异,在不考虑一个位置发生相对于参考序列两种突变以上本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于核心家系的遗传病高通量测序致病突变筛选方法,所述的基于核心家系的遗传病高通量测序致病突变筛选方法包括以下步骤:获得待检测的基因组样本,所述的基因组样本源自子代及其父母;使用高通量方法测定待检测的基因组样本的DNA序列,将测序结果与人类参考基因组进行比对和注释,形成基因型组合;使用二分法对注释文件进行分析和筛选,去除高频突变并为检测到的基因突变分类,所述的分类包括核心家系分类或者致病可能性分类;根据检测到的基因突变的分类和注释检测致病强组合或复合组合,并去除非致病突变,筛选获得遗传合式的基因。2.根据权利要求1所述的基于核心家系的遗传病高通量测序致病突变筛选方法,其特征在于,所述的高通量方法包括二代测序或者芯片筛查方法。3.根据权利要求1所述的基于核心家系的遗传病高通量测序致病突变筛选方法,其特征在于,所述的注释文件包括但不限于基因位点所属基因名称、在基因组中位置、片段长度、基因型、相关功能或者文献出处。4.根据权利要求1所述的基于核心家系的遗传病高通量测序致病突变筛选方法,其特征在于,所述的基因型组合中,每个突变的基因型组合使用“数字斜杠数字”的方式表示,两个数字代表每个基因的两个等位基因,0表示与参考序列相比未发生变异,1表示与参考序列相比发生了1种变异,在不考虑一个位置发生相对于参考序列两种突变以上的情况下,子代父母三人的突变的基因型组合的类型包括:0/00/00/0,0/00/00/1,0/00/01/1,0/00/10/0,0/00/10/1,0/00/11/1,0/01/10/0,0/01/10/1,0/01/11/1,0/10/00/0,0/10/00/1,0/10/01/1,0/10/10/0,0/10/10/1,0/10/11/1,0/11/10/0,0/11/10/1,0/11/11/1,1/10/00/0,1/10/00/1,1/10/01/1,1/10/10/0,1/10/10/1,1/10/11/1,1/11/10/0,1/11/10/1,1/11/11/1;对子代及其父母的基因型进行顺序改变,用其它符号代替/或将/删除,或用其它符号代替0和/或1,或添加空格或其它符号,或在子代及其父母的基础上增加其他亲属或其他人员的基因型,不构成对基因型组合的根本改变。5.根据权利要求1所述的基于核心家系的遗传病高通量测序致病突变筛选方法,其特征在于,所述的核心家系分类是根据子代和父母的表型将核心家系类型分为:子代有疾病表型而父母无表型、子代和父亲有相同或近似疾病表型而母亲无表型、子代和母亲有相同或近似疾病表型而父亲无表型;所述的致病可能性分类基于基因型组合出现的可能性及致病可能性对组合或复合组合进行了致病性分类,分别为:弱组合、强可能、弱可能、微可能。6.根据权利要求5所述的基于核心家系的遗传病高通量测序致病突变筛选方法,其特征在于,所述的复合组合指同一基因两个或两个以上不同突变的核心家系基因型组合;其中,弱组合是指根据遗传原理不太可能出现的遗传组合;致病强可能指突变如有害,则该组合支持该有害突变为致病突变;致病弱可能指致病可能性较小但不应轻易排除;致病微可能指致病可能性极小基本可以排除的情况。
7.根据权利要求1所述的基于核心家...

【专利技术属性】
技术研发人员:杨永臣张颖宋小珍张泓李嫔黄如方
申请(专利权)人:上海市儿童医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1