【技术实现步骤摘要】
构建突变集合的方法及其应用
[0001]本专利技术涉及生物信息领域,具体地,涉及构建突变集合的方法及其应用,更具体地,涉及一种突变集合、构建突变集合的装置、基于所述突变集合对个体进行身份识别的应用、一种非临时性可存储介质、一种计算机设备和一种计算机程序产品。
技术介绍
[0002]目前在司法领域的个体身份识别中,主要采用的是基于STR(short tandem repeat,短片段重复序列)多态性的技术。其主要是用于解决两个个体(比如犯罪现场嫌疑犯与随机个人)之间的识别问题,在该场景中主要运用的是一个称为“个体识别能力DP(discrimination power)”的统计量作为评价指标,用于衡量遗传标记系统中识别不同个体效能的大小,其考虑的是随机两个个体之间在遗传标记上存在差别的概率,该过程在统计学中被称为“单次伯努利试验”。
[0003]这套方法的重点在于确保单次比较中的两个个体区分度的“平均效能”达到最大,即确保平均进行一次比较的DP值达到最大。
[0004]但这种将DP最大化的原理在用于构建总体人群的 ...
【技术保护点】
【技术特征摘要】
1.一种构建突变集合的方法,所述突变集合用于在群体中进行个体身份识别,其特征在于,包括:(1)基于所述群体的个体总数和预先确定的碰撞概率阈值,确定所述突变集合中突变位点数目的最小值;和(2)从预先确定的初始集合中,选择预定数目的突变,以便获得所述突变集合,所述预定数目不小于步骤(1)中的所述最小值,其中,所述初始集合包括多个突变位点,所述多个突变位点的至少一部分满足下列条件:(a)所述突变位点的最大基因型概率不超过0.5,优选地,所述突变位点的最大基因型概率为4/9;(b)所述突变位点的杂合比例不小于0.4;(c)所述突变位点不在重复序列区域中;(d)所述多个突变位点之间不存在连锁不平衡关系;和(e)所述突变位点满足哈温伯格平衡。2.根据权利要求1所述的方法,其特征在于,所述突变包括选自SNP、STR、Indel的至少之一。3.根据权利要求1所述的方法,其特征在于,在步骤(1)中基于下列公式确定所述最小值:其中,m表示所述突变集合中的突变位点的数目;n表示所述群体的个体总数;和α表示所述碰撞概率阈值。4.根据权利要求1所述的方法,其特征在于,所述初始集合包括下列的至少一部分:
5.一种突变集合,所述突变集合用于在群体中进行个体身份识别,其特征在于,所述突变集合由多个突变位点构成,其中,所述多个突变位点的数目满足下列条件:其中,m表示所述突变集合中突变位点的数目;n表示所述群体的个体总数;和α表示所述预先确定的碰撞概率阈值,所述多个突变位点的每一个均满足下列条件:(a)所述突变位点的最大基因型概率不超过0.5,优选地,所述突变位点的最大基因型概率为4/9;(b)所述突变位点的杂合比例不小于0.4;(c)所述突变位点不在重复序列区域中;(d)所述多个突变位点之间不存在连锁不平衡关系;和(e)所述突变位点满足哈温伯格平衡。6.根据权利要求5所述的突变集合,其特征在于,所述α是根据a/n确定,其中n为群体的个体总数,...
【专利技术属性】
技术研发人员:谢刚,黄树嘉,金鑫,尹烨,王洪琦,
申请(专利权)人:深圳华大法医科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。