【技术实现步骤摘要】
一种核酸序列检测方法、装置、计算机设备及存储介质
[0001]本公开涉及数据处理
,具体而言,涉及一种核酸序列检测方法、装置、计算机设备及存储介质。
技术介绍
[0002]二代核酸测序过程中,在完成一定数量的序列的实验后,需要将已测的序列与基因组序列进行比对,通过比对找到测得的序列在基因组序列中的位置,并计算测得的序列中所包含碱基的错误率以及比对率,实际应用中,由于同一物种的基因也有可能会存在部分变异的情况,因此在进行比对时需要考虑到容错率,这样就大大增加了比对过程中的难度,比对的速度决定了最终确定核酸测序结果的速度,因此如何实现核酸序列的快速比对显得尤为重要。
技术实现思路
[0003]本公开实施例至少提供一种核酸序列检测方法、装置、计算机设备及存储介质。
[0004]第一方面,本公开实施例提供了一种核酸序列检测方法,包括:
[0005]获取待比对序列;
[0006]将所述待比对序列与预先构建的第一数据库中的模板核酸序列进行比对确定第一比对结果,在所述第一比对结果不满足第一预设 ...
【技术保护点】
【技术特征摘要】
1.一种核酸序列检测方法,其特征在于,包括:获取待比对序列;将所述待比对序列与预先构建的第一数据库中的模板核酸序列进行比对确定第一比对结果,在所述第一比对结果不满足第一预设条件的情况下,将所述待比对序列与预先构建的第二数据库中的容错核酸序列进行比对确定第二比对结果;其中,所述模板核酸序列是基于基因组数据库中的基因组序列确定的,所述容错核酸序列为根据各模板核酸序列确定的包含预设数量个错误碱基的核酸序列;基于所述第二比对结果,确定所述待比对序列对应的目标检测结果,所述目标检测结果用于表征测序结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括根据以下方法构建所述第一数据库:获取所述基因组数据库中的基因组序列;按照预设步长,以及预设长度,从所述基因组序列中截取所述模板核酸序列,所述预设长度为所述模板核酸序列所包含的碱基个数。3.根据权利要求1所述的方法,其特征在于,所述方法还包括根据以下方法确定所述容错核酸序列:针对任一模板核酸序列,将该模板核酸序列中的预设数量个碱基位置的碱基分别替换为,除该碱基位置当前对应的第一碱基类型外的其他碱基类型,得到该模板核酸序列对应的容错核酸序列。4.根据权利要求1所述的方法,其特征在于,所述第一数据库中的模板核酸序列通过第一哈希表中的第一编码序列表示,所述第一哈希表中存储有所述第一编码序列与序列位置信息的对应关系,所述序列位置信息用于表示在所述基因组序列中的位置;所述第二数据库中的容错核酸序列通过第二哈希表中的第二编码序列表示,所述第二哈希表存储有所述第二序列编码与序列位置信息的对应关系,所述序列位置信息用于表示所述第二编码序列对应的模板核酸序列在所述基因组序列中的位置,对应同一模板核酸序列的多个容错核酸序列的第二编码序列,在所述第二哈希表中对应的序列位置信息相同。5.根据权利要求4所述的方法,其特征在于,在获取待比对序列之后,所述方法还包括:对所述待比对序列进行编码,确定所述待比对序列对应的第三编码序列;所述将所述待比对序列与预先构建的第一数据库中的模板核酸序列进行比对,包括:...
【专利技术属性】
技术研发人员:肖勇杰,蔡克亚,崔若鹏,
申请(专利权)人:郑州思昆生物工程有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。