一种基于概率统计模型的生物学全同胞鉴定方法技术

技术编号:20223188 阅读:41 留言:0更新日期:2019-01-28 21:18
本发明专利技术涉及生物遗传学技术领域,特别涉及一种基于概率统计模型的生物学全同胞鉴定方法。本发明专利技术所提供的基于概率统计模型的生物学全同胞鉴定方法,对两名被鉴定人进行n个相互独立的STR基因座分型,依据IBS在无亲缘关系个体对人群中的二项分布IBS~B(2n,π0)和在全同胞对人群中的二项分布IBS~B(2n,π1),即可计算得到两名被鉴定人为无亲缘关系个体的概率pH0和二者为全同胞的概率pH1。本发明专利技术所述基于概率统计模型的生物学全同胞鉴定方法适用于任意数量的STR基因座,且分析效率高,因此,本发明专利技术所提供的技术方案具有广阔的应用前景与不错的市场潜力。

【技术实现步骤摘要】
一种基于概率统计模型的生物学全同胞鉴定方法
本专利技术涉及生物遗传学
,特别涉及一种基于概率统计模型的生物学全同胞鉴定方法。
技术介绍
生物学全同胞是指同一对生父、生母所生的多个体。在各种亲缘关系鉴定中,生物学全同胞(以下简称为全同胞)鉴定是除亲子鉴定外最为常见的一种亲缘关系鉴定案件。进行全同胞鉴定的两名个体,在性别相同时可借助性染色体遗传标记(如同为男性时采用Y染色体STR、同为女性是采用X染色体STR)以及线粒体DNA母系遗传的特性来提供一些间接的支持证据,在性别不同时就只有线粒体DNA多态性可以提供间接的支持证据。由于线粒体DNA多态性有限,因此学界均认可在进行全同胞鉴定时还是应以高度多态性的常色体STR遗传标记为主。现有技术中,在采用常染色体STR进行全同胞鉴定时,通常对遗传学证据的评估有两种不同的方案。第一种方案是采用ITO算法计算两名被鉴定人间的全同胞指数(Fullsiblingindex,FSI)。FSI是指两名被鉴定人是全同胞的概率与两名被鉴定人是无亲缘关系个体的概率的比值,作为所获得的遗传学证据价值的一种度量。第二种方案是采用状态一致性评分(identitybystate,IBS),这也是近年来在全同胞鉴定领域研究较多的一种全同胞评价指标。IBS值是两名被鉴定人在同一个STR基因座出现相同等位基因的个数。在同一个STR基因座,若基因型相同,即2个等位基因均相同,则评分为2;若只有1个相同的等位基因,则评分为1;若无相同的等位基因则评分为0。对于一个多重STR分型系统而言,各个STR基因座的评分总和即为两名被鉴定人基于该STR多重分型系统的IBS评分。IBS用于全同胞鉴定的基本理论依据是,无亲缘关系个体间出现相同等位基因是一种随机匹配事件,但在全同胞间出现相同等位基因的概率则是由常染色体STR的孟德尔遗传规律决定的:即有25%的概率两名全同胞基因型相同,评分为2;有50%的概率两名全同胞有1个相同的等位基因,评分为1;只有25%的概率两名全同胞无相同的等位基因。由于STR遗传标记本身高度的多态性,这就决定了全同胞间出现相同等位基因的概率要远高于无亲缘关系个体间的随机匹配概率。相较于FSI而言,IBS具有明显的优势,即无需复杂运算;因此,在我国司法部于2014年颁布的《生物学全同胞关系鉴定实施规范,SF/ZJD0105002—2014》中,也采用了IBS评分作为一种评价指标。然而,无论是上述何种评价方案,它们在全同胞鉴定案件的实际应用中都还存在一定的问题。例如,如何评价系统效能的问题:在采用常染色体STR进行任何亲权关系鉴定时,均需要明确所采用的多重STR分型系统的效能。以二联体亲子鉴定为例,这种系统效能是指相应多重STR分型系统的非父排除率。然而,在全同胞鉴定中,无论是采用FSI还是采用IBS评分,均没有相应的系统效能评估方法。又如,如何确定相应评价指标的阈值的问题:在采用FSI进行全同胞鉴定遗传学证据价值评估时,依据FSI的定义,当FSI>1时即倾向于支持两名被鉴定人可能是生物学全同胞。在无法评估系统的情况下,依据FSI的这一阈值进行全同胞判断存在极大的风险。因此,在实际运用中,有学者在采用Sinofiler或Identifiler等STR分型系统进行全同胞鉴定时,会经验性地把FSI的阈值设定在大于20。如果继续增加STR基因座,这一阈值是否合适以及这一阈值所对应的鉴定结果的准确性就需要重新进行研究和评估。此外,在IBS的应用中同样的存在阈值设定的问题。《生物学全同胞关系鉴定实施规范,SF/ZJD0105002—2014》中关于IBS的阈值设定清晰地体现了其关于IBS阈值设定的窘境。在该规范中,为了设定IBS的阈值,人为地规定了检测STR基因座的数目,具体分为三档——19个,29个和39个(其中,常用的19个常染色体STR基因座(vWA、D21S11、D18S51、D5S818、D7S820、D13S317、D16S539、FGA、D8S1179、D3S1358、CSF1PO、TH01、TPOX、PentaE、PentaD、D2S1338、D19S433、D12S391、D6S1043)为必检基因座)。之所以规定这三档,是因为现有技术无法对任意数目的STR基因组合所对应IBS的概率分布进行研究与评价。因此,如何建立一种适用于生物学全同胞鉴定的统计模型,以确定全同胞鉴定的评价指标在无亲缘关系个体对人群和全同胞对人群中的概率分布特征,是本领域研究人员的研究重点与难点之一。
技术实现思路
由于目前普遍采用《生物学全同胞关系鉴定实施规范,SF/ZJD0105002-2014》中的IBS指标,本专利技术旨在通过建立合适的统计模型给出IBS评分在无亲缘关系个体对人群和全同胞对人群中的概率分布特征。设有两名被鉴定人,比较两人在某STR基因座的分型结果可以得到三种互相排斥的结果:有2个相同的等位基因、仅有1个相同的等位基因、无相同等位基因,分别以a2=1、a1=1、a0=1表示三种状态成立,为0时则表示三种状态不成立。该两名被鉴定人在该STR基因座相同的等位基因个数即为二者在该基因座上的状态一致性评分,记作ibs。对特定个体对而言,在某个常染色体STR基因座有:a2+a1+a0=1,且ibs=2a2+a1。若对该两名被鉴定人完成n个相互独立的常染色体STR基因座分型,该两名被鉴定人之间基因型相同的基因座总个数记为A2、仅有1个等位基因相同的基因座总个数记为A1、无相同等位基因的基因座总个数记为A0,则A2、A1、A0分别为各个STR座上a2、a1、a0值的总和,且有:A2+A1+A0=n(式1)进一步地,依据A2、A1、A0可以计算得到无亲缘关系个体对在所检测的n个常染色体STR基因座上相同等位基因总个数,即IBS值,其计算公式为:IBS=2×A2+1×A1+0×A0(式2)依据上述参数定义可知,显然a2、a1、a0均为符合二项分布的参数(取值只有0和1两种可能);依据二项分布的可加性,可知其各自的和A2、A1、A0亦为二项分布参数,并且IBS亦为二项分布参数。因此,只需要获得IBS二项分布的关键参数(总体率π)即可实现对IBS概率分布的描述。具体地,本专利技术提供了一种基于概率统计模型的生物学全同胞鉴定方法,其包括以下步骤:S1:使用DNA提取试剂盒,分别提取两名被鉴定人的生物检材基因组DNA;S2:进行PCR扩增,实施STR分型,以获得n个相互独立的STR基因座的分型结果;S3:建立检验假设:原假设H0:两名被鉴定人为无亲缘关系个体;备择假设H1:两名被鉴定人为生物学全同胞;S4:依据两名被鉴定人的STR基因座的基因型,比较并计算各STR基因座上存在的相同等位基因的个数,累计得到两名被鉴定人在全部STR基因座上存在的相同等位基因的总数,即IBS值;S5:依据各STR基因座在人群中的等位基因频率,得到IBS在无亲缘关系个体对人群中符合二项分布IBS~B(2n,π0),IBS在全同胞对人群中符合二项分布IBS~B(2n,π1);其中,以a2=1、a1=1、a0=1分别表示在任一STR基因座上存在2个相同的等位基因、仅存在1个相同的等位基因、无相同的等位基因的状态各自成立,a2、a1本文档来自技高网
...

【技术保护点】
1.一种基于概率统计模型的生物学全同胞鉴定方法,其特征在于,包括以下步骤:S1:使用DNA提取试剂盒,分别提取两名被鉴定人的生物检材基因组DNA;S2:进行PCR扩增,实施STR分型,以获得n个相互独立的STR基因座的分型结果;S3:建立检验假设:原假设H0:两名被鉴定人为无亲缘关系个体;备择假设H1:两名被鉴定人为生物学全同胞;S4:依据两名被鉴定人的STR基因座的基因型,比较并计算各STR基因座上存在的相同等位基因的个数,累计得到两名被鉴定人在全部STR基因座上存在的相同等位基因的总数,即IBS值;S5:依据各STR基因座在人群中的等位基因频率,得到IBS在无亲缘关系个体对人群中符合二项分布IBS~B(2n,π0),IBS在全同胞对人群中符合二项分布IBS~B(2n,π1);其中,以a2=1、a1=1、a0=1分别表示在任一STR基因座上存在2个相同的等位基因、仅存在1个相同的等位基因、无相同的等位基因的状态各自成立,a2、a1、a0分别为0时则表示上述各状态各自不成立;设任一STR基因座有m个等位基因,并以fi表示该STR基因座上第i个等位基因的频率,其中i=1,2,3……m,则有:...

【技术特征摘要】
1.一种基于概率统计模型的生物学全同胞鉴定方法,其特征在于,包括以下步骤:S1:使用DNA提取试剂盒,分别提取两名被鉴定人的生物检材基因组DNA;S2:进行PCR扩增,实施STR分型,以获得n个相互独立的STR基因座的分型结果;S3:建立检验假设:原假设H0:两名被鉴定人为无亲缘关系个体;备择假设H1:两名被鉴定人为生物学全同胞;S4:依据两名被鉴定人的STR基因座的基因型,比较并计算各STR基因座上存在的相同等位基因的个数,累计得到两名被鉴定人在全部STR基因座上存在的相同等位基因的总数,即IBS值;S5:依据各STR基因座在人群中的等位基因频率,得到IBS在无亲缘关系个体对人群中符合二项分布IBS~B(2n,π0),IBS在全同胞对人群中符合二项分布IBS~B(2n,π1);其中,以a2=1、a1=1、a0=1分别表示在任一STR基因座上存在2个相同的等位基因、仅存在1个相同的等位基因、无相同的等位基因的状态各自成立,a2、a1、a0分别为0时则表示上述各状态各自不成立;设任一STR基因座有m个等位基因,并以fi表示该STR基因座上第i个等位基因的频率,其中i=1,2,3……m,则有:以p2、p1、p0分别表示无亲缘关系个体对A与B之间a2、a1、a0取值为1的概率,则有:p2+p1+p0=1其中,因此,在无亲缘关系个体对人群中的IBS的期望值E(IBS)为:在无亲缘关系个体对人群中的IBS的总体率π0为:以p2FS、p1FS分别表示全同胞对C与D之间a2、a1取值为1的概率,则有:因此,在全同胞对人群中的IBS的期望值E(IBS)为:在全同胞对人群中的IBS的总体率π1为:S6:使用EXCEL软件中的BINOMDIST函数进行计算:输入参数BINOMDIST(IBS值,2n,π0,FALSE)以计算出两名被鉴定人为无亲缘关系...

【专利技术属性】
技术研发人员:赵书民靳超赵峰赵琪
申请(专利权)人:上海晶准生物医药有限公司江苏东南证据科学研究院有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1