一种DNA混合分型数据库比对算法制造技术

技术编号:23151388 阅读:106 留言:0更新日期:2020-01-18 14:20
本发明专利技术公开了一种DNA混合分型数据库比对算法,包括数据采集和数据比对两个步骤,其中,数据采集包括如下步骤:S101:接收多种样式的数据源,包括以接口方式抽取实验室管理系统的案件数据、手工录入数据、CODIS文件数据;S102:数据采集过程基于DNA混合分型数据库设计了标准的Oracle数据模型,将不同数据源的数据统一转换为标准的数据模型,为数据比对建立标准的数据基础;数据比对过程采用比对队列结合线程池方式启动。本发明专利技术通过DNA混合样本分型信息的标准化存储、自动拆分、智能分析、快速比对等功能,将现有的混合样本充分利用,比对成功后会及时提醒实验人员比对成功,为案件侦破提供更多的线索,协助案件快速侦破。

A comparison algorithm of DNA hybrid typing database

【技术实现步骤摘要】
一种DNA混合分型数据库比对算法
本专利技术涉及DNA数据库
,特别涉及一种DNA混合分型数据库比对算法。
技术介绍
随着刑事侦查技术快速发展,DNA检测技术的精度日益增高,DNA在法庭物证中起到的作用也越来越受到重视,但是在日常工作中,物证检测出混合结果的情况屡见不鲜,目前我国还没有对混合型DNA分型建立单独的数据库,这样的样本也无法作为证据使用。案发现场环境复杂,提取单一DNA样本本来就不容易,同时由于提取人员造成的污染和试剂灵敏度的提高,混合型样本越来越多的出现在法医的检验工作中,如何能够将现有的混合型样本利用起来,处理好混合型样本的拆分,已经成为目前法医工作的一大难题。所以需要一套针对DNA混合分型进行拆分解析的解决方案,来解决DNA混合型样本分析难、信息单一、线索利用率低等实际问题,实现对案件进行更快速、准确的分析。现有的结构原理存在的缺点:结构原理比较简单,单一。现有的工作模式是手动去核对拆分混合样本,这样的工作模式不但工作量巨大,而且对法医人员的业务水平有着极高的要求。现有技术存在的缺点:现有技术目前还存在比对不稳定,比对耗费时间长,需人工的耗费量大,效率低问题。
技术实现思路
本专利技术的目的在于提供一种DNA混合分型数据库比对算法,本专利技术对案件中被认为太复杂而无法找到其来源的DNA混合样本进行数据综合比对。结合以往积累的大量实战数据,对案件DNA样本混合分型信息进行研究和分析。通过DNA混合样本分型信息的标准化存储、自动拆分、智能分析、快速比对等功能,将现有的混合样本充分利用,比对成功后会及时提醒实验人员比对成功,为案件侦破提供更多的线索,协助案件快速侦破,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种DNA混合分型数据库比对算法,包括数据采集和数据比对两个步骤,其中:数据采集包括如下步骤:S101:接收多种样式的数据源,包括以接口方式抽取实验室管理系统的案件数据、手工录入数据、CODIS文件数据;S102:数据采集过程基于DNA混合分型数据库设计了标准的Oracle数据模型,将不同数据源的数据统一转换为标准的数据模型,为数据比对建立标准的数据基础;数据比对包括如下步骤:数据比对过程采用比对队列结合线程池方式启动,启动比对任务时,根据比对模式自动分配不同的比对任务进行比对,每个比对子线程相互隔离执行,确保比对任务并行高效运转。进一步地,所述标准数据模型共分为混合DNA分型样本模型、单一DNA分型样本模型、已拆分单一DNA分型样本模型。进一步地,所述混合DNA分型样本模型存储原始的混合DNA分型样本数据,该模型做为已拆分单一DNA分型样本的主体关系。进一步地,所述单一DNA分型样本模型存储原始的单一DNA分型样本数据,该模型为明确的单一个体DNA分型。进一步地,所述已拆分单一DNA分型样本模型的数据来源方式有:通过混合DNA分型样本和单一DNA分型样本通过比对分析后,排除已知单一样本DNA分型,拆分出剩余部分的DNA分型标记为此类数据模型;穷尽法对每个混合DNA分型中的基因座进行拆分和排列组合,每组排列组合标记为一个此类数据模型;结合第三方图谱拆分软件的分析报告,通过解析权重比,组合出每个数据模型。进一步地,所述数据比对的比对模式分为混合分型比单一分型、混合分型比拆分分型、拆分分型比单一分型。进一步地,所述混合分型比对单一分型以混合DNA分型样本做比对数据源,单一DNA分型样本作为比对目标数据源,每个混合DNA分型样本与所有单一DNA分型样本进行比对,混合样本在相同位点上的等位基因完全包含单一样本的等位基因,当前位点计为比中,满足指定比中位点个数,则标记混合DNA分型样本比中单一DNA分型样本。进一步地,所述混合分型比对拆分分型以混合DNA分型样本做比对数据源,已拆分单一DNA分型样本作为比对目标数据源,每个混合DNA分型样本与所有已拆分单一DNA分型样本进行比对,混合样本在相同位点上的等位基因完全包含已拆分单一样本的等位基因,当前位点计为比中,满足指定比中位点个数,则标记混合DNA分型样本比中已拆分单一DNA分型样本。进一步地,所述拆分分型比对单一分型以已拆分DNA分型样本做比对数据源,单一DNA分型样本作为比对目标数据源,每个已拆分DNA分型样本与所有单一DNA分型样本进行同型比对,所有基因座完全匹配则标记混合DNA分型样本比中已拆分单一DNA分型样本。与现有技术相比,本专利技术的有益效果是:本专利技术在案件侦办过程中,针对现场检材出现的DNA样本混合分型线索信息,进行深度分析、综合应用和数据统一存储利用。对案件中被认为太复杂而无法找到其来源的DNA混合样本进行数据综合比对。结合以往积累的大量实战数据,对案件DNA样本混合分型信息进行研究和分析。通过DNA混合样本分型信息的标准化存储、自动拆分、智能分析、快速比对等功能,将现有的混合样本充分利用,比对成功后会及时提醒实验人员比对成功,为案件侦破提供更多的线索,协助案件快速侦破。附图说明图1为本专利技术DNA混合分型数据库比对算法的流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。一种DNA混合分型数据库比对算法,流程如图1,包括数据采集和数据比对两个步骤,其中:数据采集包括如下步骤:S101:接收多种样式的数据源,包括以接口方式抽取实验室管理系统的案件数据、手工录入数据、CODIS文件数据;S102:数据采集过程基于DNA混合分型数据库设计了标准的Oracle数据模型,将不同数据源的数据统一转换为标准的数据模型,为数据比对建立标准的数据基础。标准数据模型共分为3类:混合DNA分型样本模型、单一DNA分型样本模型、已拆分单一DNA分型样本模型。混合DNA分型样本模型,存储原始的混合DNA分型样本数据,该模型做为已拆分单一DNA分型样本的主体关系;单一DNA分型样本模型,存储原始的单一DNA分型样本数据,该模型为明确的单一个体DNA分型;已拆分单一DNA分型样本模型,数据来源方式有:通过混合DNA分型样本和单一DNA分型样本通过比对分析后,排除已知单一样本DNA分型,拆分出剩余部分的DNA分型标记为此类数据模型;穷尽法对每个混合DNA分型中的基因座进行拆分和排列组合,每组排列组合标记为一个此类数据模型;结合第三方图谱拆分软件的分析报告,通过解析权重比,组合出每个数据模型。数据比对比对模式分为,混合分型比单一分型、混合分型比拆分分型、拆分分型比单一分型。混合分型比对单一分型以混合DNA分型样本做比对数据源,单一DNA分型样本作为比对目本文档来自技高网
...

【技术保护点】
1.一种DNA混合分型数据库比对算法,其特征在于,包括数据采集和数据比对两个步骤,其中:/n数据采集包括如下步骤:/nS101:接收多种样式的数据源,包括以接口方式抽取实验室管理系统的案件数据、手工录入数据、CODIS文件数据;/nS102:数据采集过程基于DNA混合分型数据库设计了标准的Oracle数据模型,将不同数据源的数据统一转换为标准的数据模型,为数据比对建立标准的数据基础;/n数据比对包括如下步骤:/n数据比对过程采用比对队列结合线程池方式启动,启动比对任务时,根据比对模式自动分配不同的比对任务进行比对,每个比对子线程相互隔离执行,确保比对任务并行高效运转。/n

【技术特征摘要】
1.一种DNA混合分型数据库比对算法,其特征在于,包括数据采集和数据比对两个步骤,其中:
数据采集包括如下步骤:
S101:接收多种样式的数据源,包括以接口方式抽取实验室管理系统的案件数据、手工录入数据、CODIS文件数据;
S102:数据采集过程基于DNA混合分型数据库设计了标准的Oracle数据模型,将不同数据源的数据统一转换为标准的数据模型,为数据比对建立标准的数据基础;
数据比对包括如下步骤:
数据比对过程采用比对队列结合线程池方式启动,启动比对任务时,根据比对模式自动分配不同的比对任务进行比对,每个比对子线程相互隔离执行,确保比对任务并行高效运转。


2.根据权利要求1所述的一种DNA混合分型数据库比对算法,其特征在于,所述标准数据模型共分为混合DNA分型样本模型、单一DNA分型样本模型、已拆分单一DNA分型样本模型。


3.根据权利要求2所述的一种DNA混合分型数据库比对算法,其特征在于,所述混合DNA分型样本模型存储原始的混合DNA分型样本数据,该模型做为已拆分单一DNA分型样本的主体关系。


4.根据权利要求2所述的一种DNA混合分型数据库比对算法,其特征在于,所述单一DNA分型样本模型存储原始的单一DNA分型样本数据,该模型为明确的单一个体DNA分型。


5.根据权利要求2所述的一种DNA混合分型数据库比对算法,其特征在于,所述已拆分单一DNA分型样本模型的数据来源方式有:通过混合DNA分型样本和单一DNA分型样本通过比对分析后,排除已知单一样本DNA分型,拆分出剩余部分的DNA分型标记为此类数据模型;穷尽法对每个...

【专利技术属性】
技术研发人员:秦叶
申请(专利权)人:北京博安智联科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1