以SNP为遗传标记物的亲缘关系鉴定方法技术

技术编号:24013008 阅读:146 留言:0更新日期:2020-05-02 02:23
本发明专利技术涉及亲缘关系鉴定方法技术领域,且公开了以SNP为遗传标记物的亲缘关系鉴定方法,包括亲缘关系判定模型的建立、SNP位点的分型检测和根据分型结果和判定模型确认个体间亲缘关系三大步骤。该以SNP为遗传标记物的亲缘关系鉴定方法,检测方式上采用SNP代替STR作为遗传标记物,充分避免了使用STR为遗传标记检测时稳定性差、分型难度高、对样本质量要求高、成本高的缺点;通过新模型算法可直接判定出两样本间直系、一级亲缘关系、二级亲缘关系、三级亲缘关系和陌生人;引入概率密度模型,充分避免各种误差带来的影响;采用程序化判定,操作简单方便,采用SNP分型检测技术,使分型结果准确直观;算法使用的SNP位点多、重复次数多,结果更加准确。

Identification method of genetic relationship with SNP as genetic marker

【技术实现步骤摘要】
以SNP为遗传标记物的亲缘关系鉴定方法
本专利技术涉及亲缘关系鉴定方法
,具体为以SNP为遗传标记物的亲缘关系鉴定方法。
技术介绍
亲缘关系鉴定指依照遗传学基本原理,采用现代化DNA分型检测技术综合评定样本之间是否存在亲缘关系,现代生物遗传理论指出,子代的基因组染色体DNA各有一半来自亲生父母双方,以此为原则,目前已发展出多种亲缘鉴定方法,如血型亲缘鉴定和STR基因分型技术等。基因分型技术也叫做DNA指纹技术,是通过分析基因分型比较鉴定个体DNA的分析技术,基本原理过程包括:样本DNA的提取,特定限制性内切酶的长链切割,酶切片段凝胶电泳分离,双链DNA的分离和转移,放射性DNA探针与样本片断杂交,胶片显影,最终呈现出的DNA片段条状图谱,就是DNA指纹,该技术在20世纪80年代开始运用于法医,经过近三十年的发展,该技术不断改进,并广泛用于亲缘鉴定等场合,目前司法和商业用途中多使用STR为遗传标记物的基因分型亲缘鉴定。STR也被称为短串联序列重复,广泛存在于人类基因组中,每个STR基因座由2-6对碱基构成一个核心序列,核心序列串联重复形成100~300bp长度左右的片段,即为一个STR基因座。由于重复的数目不同,所以STR基因座在长度上具有多态性。在人群中,同一个STR基因座在不同的个体中可能重复次数不同,所以累加检测多个STR基因座的分型结果,可以鉴定出两各个体的亲缘关系远近。STR分型使用对应STR试剂盒,经过常规规范的DNA提取、PCR扩增、凝胶电泳等步骤,将得到检测样本的STR片段。通过比较两各个体的STR片段,最终确定片段是否相同和相同碱基的数量,在检测多个STR基因座后,统计相同碱基数目并按照相应规定打分,以此判断样本亲缘关系,具体实施方法参照《生物学全同胞关系鉴定实施规范》。SNP指在基因组水平上,由单个核苷酸变异导致的DNA序列多态性,是人类可遗传变异中最常见的一种,占人类基因组多态性90%以上。SNP的变异包括单个碱基的转换、颠换、插入和缺失,是一种丰富的遗传标记物。人类基因组中每1000个碱基中就有一个SNP,由于其数量多、分布广泛,因此SNP也成为了人类基因组计划应用的重要步骤,已有研究表明,很多肿瘤、免疫性疾病、遗传疾病等都与SNP相关,SNP的检测技术有NGS、基因芯片检测和PCR检测等。常用的STR亲缘鉴定鉴别标准,其STR序列的突变率为10-3-10-5,远高于人类基因组的平均突变,1.4×10-10,因此STR的稳定性不高,使用STR为遗传标记的亲缘检测分型结果易受到突变的影响;STR多态性复杂,如同一长度中存在多个核心序列重复、核心序列非整倍重复等,增加亲缘检测中遗传标记物STR的分型难度;STR扩增时对样本的要求高,小浓度条件下,STR片段不容易扩增出来,使得该亲缘鉴定方法使用环境受限;STR检测成本较高,通量较低,增加了亲缘检测成本;亲缘鉴定使用的STR序列所包含的遗传信息仅足够判定两个样本的父母-子女关系,但无法鉴别出更远的关系(祖孙、表亲等);STR亲缘鉴定鉴别标准中易出现“无法判定关系”的结论,判定不直观,STR基因座,即短串联序列重复基因座,其是目前较常用的亲缘鉴定遗传标记,但由于STR基因座突变率高、多态性复杂且蕴含信息有限,这种检测鉴定技术也面对检测成本高、准确率有限、且结果易受主观环境影响等问题,为此我们提出以SNP为遗传标记物的亲缘检测鉴定方法。
技术实现思路
本专利技术提供了以SNP为遗传标记物的亲缘关系鉴定方法,具备分型结果准确直观及采用程序化判定,操作简单方便的优点,解决了
技术介绍
中提到的问题。为实现以上目的,本专利技术提供如下技术方案予以实现:以SNP为遗传标记物的亲缘关系鉴定方法,包括亲缘关系判定模型的建立、SNP位点的分型检测和根据分型结果和判定模型确认个体间亲缘关系三大步骤。第一步:亲缘关系判定模型的建立;该模型对于SNP的选取有三个要求;要求一:位点上出现的两种碱基频率为0.5:0.5;要求二:选取的检测位点之间不存在连锁遗传现象;要求三:选取的位点位于人类基因组常染色体上,要求一保证了判定模型的准确性,最大限度减少了概率突变的误差,要求二是从遗传学的角度避免了位点之间的相互影响,要求三则保证每个位点都有等位基因,方便关系判定的计算,并减小可能出现的误差。人群中同一位点的两个碱基频率各为0.5,故人群中该位点的基因型分布符合AA,AB,BB~0.25,0.5,0.25,其中定义AA~BB为冲突事件,即亲代基因型为AA是,子代基因型不可能是BB,否则为冲突。因此对于同一位点直系亲属发生冲突事件的概率为0,陌生人之间发生冲突的概率为0.125,其余亲缘关系发生冲突的概率介于0~0.125之间。定义样本间亲兄弟关系为一级亲缘关系,样本间祖孙/外祖孙为耳机亲缘关系,叔侄、舅甥等为三级亲缘关系,计算三种亲缘关系在同一位点下发生冲突事件的概率分别为:一级亲缘关系为1/32,二级亲缘关系为2/32,三级亲缘关系为3/32。根据这三个亲缘关系的冲突概率,建立了样本容量为60的三个概率密度模型为标准参考模型,即选取60个SNP位点分别建立概率密度模型。第二步:SNP位点的分型检测;SNP位点分型检测选用某公司针对亚洲人定制的ASAMD芯片,芯片可检测出66万个有效位点分型结果。第三步:根据分型结果和判定模型确认个体间亲缘关系。工作人员应每次从两个样本的可用位点中随机选出60个SNP位点的分型结果,并计数每次出现冲突的频数,每60个位点计算一次冲突出现的频率;反复大量重复后,将得到的冲突出现的频率做均值处理最为最终频率,由于位点库中的位点多,且重复实验次数多,所以最大程度上避免了每次实验的偶然性,同时冲突频率也极度接近冲突出现的理论概率,最后将得到的结果与三个标准概率密度模型进行比较,即可得到两个样本间的亲缘关系。可选的,所述亲缘关系判定模型基本原理和计算可分为人群中任意两样本间的亲缘关系和直系亲属亲缘关系计算模型、一级亲缘关系计算模型、二级亲缘关系计算模型和三级亲缘关系计算模型。人群中任意两样本间的亲缘关系和直系亲属亲缘关系计算模型如下:假设:一个SNP位点上分型出现的两个碱基A、B的频率各为50%,则:人群中基因型为AA、AB、BB的概率分别为0.25、0.5、0.25,定义:两个体同一位点上分别出现AA、AA或GG、GG的基因型为纯合相同,出现AG、AG的基因型为杂合相同,出现AA、AG或GG、AG的基因型为不同,出现AA、GG的基因型为冲突。则:P(纯合相同)=0.125;P(杂合相同)=0.25;P(不同)=0.5;P(冲突)=0.125其中选取冲突事件作为判断两样本亲缘关系的标准,一级亲缘关系的两样本发生冲突事件的概率为0,任意两样本间发生冲突事件的概率为0.125,其余亲缘关系间发生冲突事件的的概率介于二者之间。若有n个SNP位点,定义事件a为两样本所有SNP位点分型结果都不冲突的概率本文档来自技高网
...

【技术保护点】
1.以SNP为遗传标记物的亲缘关系鉴定方法,其特征在于:包括亲缘关系判定模型的建立、SNP位点的分型检测和根据分型结果和判定模型确认个体间亲缘关系三大步骤。/n第一步:亲缘关系判定模型的建立;/n该模型对于SNP的选取有三个要求;要求一:位点上出现的两种碱基频率为0.5∶0.5;要求二:选取的检测位点之间不存在连锁遗传现象;要求三:选取的位点位于人类基因组常染色体上,要求一保证了判定模型的准确性,最大限度减少了概率突变的误差,要求二是从遗传学的角度避免了位点之间的相互影响,要求三则保证每个位点都有等位基因,方便关系判定的计算,并减小可能出现的误差。/n人群中同一位点的两个碱基频率各为0.5,故人群中该位点的基因型分布符合AA,AB,BB~0.25,0.5,0.25,其中定义AA~BB为冲突事件,即亲代基因型为AA是,子代基因型不可能是BB,否则为冲突。因此对于同一位点直系亲属发生冲突事件的概率为0,陌生人之间发生冲突的概率为0.125,其余亲缘关系发生冲突的概率介于0~0.125之间。/n定义样本间亲兄弟关系为一级亲缘关系,样本间祖孙/外祖孙为耳机亲缘关系,叔侄、舅甥等为三级亲缘关系,计算三种亲缘关系在同一位点下发生冲突事件的概率分别为:一级亲缘关系为1/32,二级亲缘关系为2/32,三级亲缘关系为3/32。根据这三个亲缘关系的冲突概率,建立了样本容量为60的三个概率密度模型为标准参考模型,即选取60个SNP位点分别建立概率密度模型。/n第二步:SNP位点的分型检测;/nSNP位点的分型检测选用某公司针对亚洲人定制的ASAMD芯片,芯片可检测出66万个有效位点分型结果。/n第三步:根据分型结果和判定模型确认个体间亲缘关系;/n每次从两个样本的可用位点中随机选出60个SNP位点的分型结果,并计数每次出现冲突的频数,每60个位点计算一次冲突出现的频率;反复大量重复后,将得到的冲突出现的频率做均值处理最为最终频率,由于位点库中的位点多,且重复实验次数多,所以最大程度上避免了每次实验的偶然性,同时冲突频率也极度接近冲突出现的理论概率,最后将得到的结果与三个标准概率密度模型进行比较,即可得到两个样本间的亲缘关系。/n...

【技术特征摘要】
1.以SNP为遗传标记物的亲缘关系鉴定方法,其特征在于:包括亲缘关系判定模型的建立、SNP位点的分型检测和根据分型结果和判定模型确认个体间亲缘关系三大步骤。
第一步:亲缘关系判定模型的建立;
该模型对于SNP的选取有三个要求;要求一:位点上出现的两种碱基频率为0.5∶0.5;要求二:选取的检测位点之间不存在连锁遗传现象;要求三:选取的位点位于人类基因组常染色体上,要求一保证了判定模型的准确性,最大限度减少了概率突变的误差,要求二是从遗传学的角度避免了位点之间的相互影响,要求三则保证每个位点都有等位基因,方便关系判定的计算,并减小可能出现的误差。
人群中同一位点的两个碱基频率各为0.5,故人群中该位点的基因型分布符合AA,AB,BB~0.25,0.5,0.25,其中定义AA~BB为冲突事件,即亲代基因型为AA是,子代基因型不可能是BB,否则为冲突。因此对于同一位点直系亲属发生冲突事件的概率为0,陌生人之间发生冲突的概率为0.125,其余亲缘关系发生冲突的概率介于0~0.125之间。
定义样本间亲兄弟关系为一级亲缘关系,样本间祖孙/外祖孙为耳机亲缘关系,叔侄、舅甥等为三级亲缘关系,计算三种亲缘关系在同一位点下发生冲突事件的概率分别为:一级亲缘关系为1/32,二级亲缘关系为2/32,三级亲缘关系为3/32。根据这三个亲缘关系的冲突概率,建立了样本容量为60的三个概率密度模型为标准参考模型,即选取60个SNP位点分别建立概率密度模型。
第二步:SNP位点的分型检测;
SNP位点的分型检测选用某公司针对亚洲人定制的ASAMD芯片,芯片可检测出66万个有效位点分型结果。
第三步:根据分型结果和判定模型确认个体间亲缘关系;
每次从两个样本的可用位点中随机选出60个SNP位点的分型结果,并计数每次出现冲突的频数,每60个位点计算一次冲突出现的频率;反复大量重复后,将得到的冲突出现的频率做均值处理最为最终频率,由于位点库中的位点多,且重复实验次数多,所以最大程度上避免了每次实验的偶然性,同时冲突频率也极度接近冲突出现的理论概率,最后将得到的结果与三个标准概率密度模型进行比较,即可得到两个样本间的亲缘关系。


2.根据权利要求1所述的以SNP为遗传标记物的亲缘关系鉴定方法,其特征在于:所述亲缘关系判定模型基本原理和计算可分为人群中任意两样本间的亲缘关系和直系亲属亲缘关系计算模型、一级亲缘关系计算模型、二级亲缘关系计算模型和三级亲缘关系计算模型。
人群中任意两样本间的亲缘关系和直系亲属亲缘关系计算模型如下:
假设:一个SNP位点上分型出现的两个碱基A、B的频率各为50%,
则:人群中基因型为AA、AB、BB的概率分别为0.25、0.5、0.25,
定义:两个体同一位点上分别出现AA、AA或GG、GG的基因型为纯合相同,出现AG、AG的基因型为杂合相同,出现AA、AG或GG、AG的基因型为不同,出现AA、GG的基因型为冲突。
则:
P(纯合相同)=0.125;
P(杂合相同)=0.25;
P(不同)=0.5;
P(冲突)=0.125
其中选取冲突事件作为判断两样本亲缘关系的标准,一级亲缘关系的两样本发生冲突事件的概率为0,任意两样本间发生冲突事件的概率为0.125,其余亲缘关系间发生冲突事件的的概率介于二者之间。若有n个SNP位点,定义事件a为两样本所有SNP位点分型结果都不冲突的概率,事件b为分型结果有冲突发生但不全冲突的概率,事件c为分型结果全都冲突的的概率,则:
A(n)=(7/8)n
B(n)=1-(7/8)n-(1/8)n
C(n)=(1/8)n
如果所有SNP分型结果出现冲突事件的频率为0,则可认为两样本间为直系亲属关系;如果所有SNP分型结果出现冲突事件的频率无限接近c(n),则可认为两个样本是人群中任意两个体即陌生人关系。


3.根据权利要求2所述的以SNP为遗传标记物的亲缘关系鉴定方法,其特征在于:一级亲缘关系计算模型如下:
假设:一个SNP位点上分型出现的两个碱基A、B的频率各为50%
则:人群中基因型为AA、AB、BB的概率为0.25、0.5、0.25
定义:两个体同一位点上分别出现AA、AA或BB、BB的基因型为纯合相同,出现AB、AB的基因型为杂合相同,出现AA、AB或BB、AB的基因型为不同,出现AA、...

【专利技术属性】
技术研发人员:罗奇斌申玉林廖胜光任毅
申请(专利权)人:北京奇云诺德信息科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1