一种基于CPE和CPD实现高效个体识别位点筛选的贪心算法制造技术

技术编号:31740881 阅读:19 留言:0更新日期:2022-01-05 16:19
本发明专利技术涉及生物信息学分析技术领域,具体涉及一种基于CPE和CPD实现高效个体识别位点筛选的贪心算法,包括:S1、变量声明与专有名词设置:S11、寻找一个有效的STR位点集合:L;S12、一个位点l的辨别能力(PD):dl;S13、L的联合辨别能力(CPD):DL。本发明专利技术,CODIS主要是针对美国人群,而本算法适用于不同的人群,由于这一算法是在假设数据中的个体在生物学上无关的情况下提出的,因此还可以用于其他人种甚至物种的个体识别,同时,本算法的效果好,所选位点在身份鉴定中具有较高的联合鉴别能力,在亲子鉴定中具有较高的联合排除概率。在我们的模拟中,所选的STRs在统计学上优于CODIS的STRs,错误包含和排除的概率较低。误包含和排除的概率较低。

【技术实现步骤摘要】
一种基于CPE和CPD实现高效个体识别位点筛选的贪心算法


[0001]本专利技术涉及生物信息学分析
,具体涉及一种基于CPE和 CPD实现高效个体识别位点筛选的贪心算法。

技术介绍

[0002]等位基因频率信息筛选算法既可丰富国内的群体遗传学资料,也为构建适合国内法医学应用的SNPs复合检测体系提供了优良的解决方案。
[0003]现有技术中,包括STRs:一类重复的DNA片段,其中长度为2 到6个碱基对的某些基序被重复多次。CODIS:美国联邦调查局联合DNA索引系统(CODIS)程序在1997年发布的13个核心短串联重复 (STR)位点被广泛应用于法医标记,如身份鉴定和亲子鉴定。目前,全球建立起了基于CODIS核心str的法医数据库。
[0004]但现有技术具有以下缺点:
[0005]1、由于数据库规模的急剧扩大,数据库中随机命中(冷命中) 的风险将会增加,这就可能会导致当新的犯罪发生时,法医数据库中的一个人被错误的指控为罪犯,误判的可能性提高;
[0006]2、13个STR位点偏向于不同的亚群,例如在中本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于CPE和CPD实现高效个体识别位点筛选的贪心算法,其特征在于,包括:S1、变量声明与专有名词设置:S11、寻找一个有效的STR位点集合:L;S12、一个位点l的辨别能力(PD):dl;S13、L的联合辨别能力(CPD):DL;S14、每个位点的四个法医学参数约束:杂合度设为HE;随机匹配概率设为:RMP;识别能力设为:PD;排除概率设为:PE;S15、个体DNA谱(FDP)的频率记为f;S16、具有集合L的FDP的上限是L中选定位点的最大基因型频率的乘积,最大值记为fl;S17、所选标记应用于最大可能的群体规模记为S;S2、约束条件:S20、每个位点的四个法医学参数大于等于阈值;S21、位点l的速率nl大于一个预先确定的阈值dn;S22、fl小于S的倒数;S23、所有位点处于哈代-温伯格平衡(HWE);S24、复合基因型连锁平衡(GLE);S3、算法步骤:S30、预先设置dn,设置好dh,dr,dd,de,dn五个阈值;S31、计算l的等位基因频率;S32、判断是否符合步骤S20和步骤S21中的约束条件;S33、对符合的位点,判断是否符合步骤S22中的约束条件,并将符合位点新建组合L;S34、判断集合L是否满足fL小于S的倒数;S35、判断是否符合步骤S23和步骤S24中的约束条件;S36、...

【专利技术属性】
技术研发人员:赵梓丞李梦瑶贺小兰原榛良陈银王轶男
申请(专利权)人:深圳百人科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1