【技术实现步骤摘要】
一种基于CPE和CPD实现高效个体识别位点筛选的贪心算法
[0001]本专利技术涉及生物信息学分析
,具体涉及一种基于CPE和 CPD实现高效个体识别位点筛选的贪心算法。
技术介绍
[0002]等位基因频率信息筛选算法既可丰富国内的群体遗传学资料,也为构建适合国内法医学应用的SNPs复合检测体系提供了优良的解决方案。
[0003]现有技术中,包括STRs:一类重复的DNA片段,其中长度为2 到6个碱基对的某些基序被重复多次。CODIS:美国联邦调查局联合DNA索引系统(CODIS)程序在1997年发布的13个核心短串联重复 (STR)位点被广泛应用于法医标记,如身份鉴定和亲子鉴定。目前,全球建立起了基于CODIS核心str的法医数据库。
[0004]但现有技术具有以下缺点:
[0005]1、由于数据库规模的急剧扩大,数据库中随机命中(冷命中) 的风险将会增加,这就可能会导致当新的犯罪发生时,法医数据库中的一个人被错误的指控为罪犯,误判的可能性提高;
[0006]2、13个STR位点偏向于 ...
【技术保护点】
【技术特征摘要】
1.一种基于CPE和CPD实现高效个体识别位点筛选的贪心算法,其特征在于,包括:S1、变量声明与专有名词设置:S11、寻找一个有效的STR位点集合:L;S12、一个位点l的辨别能力(PD):dl;S13、L的联合辨别能力(CPD):DL;S14、每个位点的四个法医学参数约束:杂合度设为HE;随机匹配概率设为:RMP;识别能力设为:PD;排除概率设为:PE;S15、个体DNA谱(FDP)的频率记为f;S16、具有集合L的FDP的上限是L中选定位点的最大基因型频率的乘积,最大值记为fl;S17、所选标记应用于最大可能的群体规模记为S;S2、约束条件:S20、每个位点的四个法医学参数大于等于阈值;S21、位点l的速率nl大于一个预先确定的阈值dn;S22、fl小于S的倒数;S23、所有位点处于哈代-温伯格平衡(HWE);S24、复合基因型连锁平衡(GLE);S3、算法步骤:S30、预先设置dn,设置好dh,dr,dd,de,dn五个阈值;S31、计算l的等位基因频率;S32、判断是否符合步骤S20和步骤S21中的约束条件;S33、对符合的位点,判断是否符合步骤S22中的约束条件,并将符合位点新建组合L;S34、判断集合L是否满足fL小于S的倒数;S35、判断是否符合步骤S23和步骤S24中的约束条件;S36、...
【专利技术属性】
技术研发人员:赵梓丞,李梦瑶,贺小兰,原榛良,陈银,王轶男,
申请(专利权)人:深圳百人科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。