可重构基于硬件的核苷酸比对工具制造技术

技术编号:31493394 阅读:23 留言:0更新日期:2021-12-18 12:30
本发明专利技术提供了一种可重构基于硬件的核苷酸比对工具,包括计算机、FPGA模块以及通用异步收发器桥;所述计算机,用于运行BLASTn算法以根据目标序列查询相似的核苷酸序列;所述FPGA模块,用于加速BLASTn算法的史密斯

【技术实现步骤摘要】
可重构基于硬件的核苷酸比对工具


[0001]本专利技术涉及生物信息领域,具体地,涉及一种可重构基于硬件的核苷酸比对工具。

技术介绍

[0002]自2001年人类基因组初稿完成以来,基因组数据一直远远超过摩尔定律,预计今年下半年会达到千兆字节的规模,在未来其也不可估计。基因组数据能够在医疗、检测疾病和在人的生命形成过程之中都有贡献。
[0003]数据的增长主要由于DNA测序技术的发展。生物信息学是一跨学科的领域,改进了使用各种算法存储、检索、组织和分析生物数据的方法。在分子生物学中,测序使研究人员能够获得关于基因突变、疾病和表型关联等信息。在进化生物学中,使用测序获得的信息可以提供关于不同生物如何相关以及如何演变。

技术实现思路

[0004]针对现有技术中的缺陷,本专利技术的目的是提供一种可重构基于硬件的核苷酸比对工具。
[0005]根据本专利技术提供的可重构基于硬件的核苷酸比对工具,包括计算机、FPGA模块以及通用异步收发器桥;
[0006]所述计算机,用于运行BLASTn算法以根据目标序列查询相似的核苷酸序列;
[0007]所述FPGA模块,用于加速BLASTn算法的史密斯

沃特曼部分;
[0008]所述通用异步收发器桥,用于计算机和FPGA模块之间的串行通信。
[0009]优选地,所述史密斯

沃特曼部分时包括如下步骤:
[0010]读取目标序列,根据所述目标序列查询到所有可能的待匹配序列;
[0011]对每段待匹配序列进行评分生成匹配分数,去除匹配分数低于预设置分数阈值的待匹配序列;
[0012]将匹配分数最高的若干个核苷酸序列确定为相似序列。
[0013]优选地,所述史密斯

沃特曼部分时还包括如下步骤:
[0014]根据所述目标序列对应的相似序列进行对所述目标序列进行扩展查询;
[0015]在扩展时根据目标序列的每段对应的主题序列进行评分生成匹配分数,根据最高匹配分数筛选出每段的相似序列段;
[0016]当匹配分数低于预设置的分数阈值时,扩展查询停止,并丢弃分数低于分数阈值的相关序列;
[0017]对于所有相似序列段进行合并,并按E值递增排序,并返回E值和S值,S值表示两序列的同源性,分值越高表明它们之间相似程度越大;E值就是S值的可靠性的评价,表明在随机的情况下,其他序列与目标序列相似度要大于该条相似序列的可能性,所以分值越低越好。
[0018]优选地,根据目标序列查询相似的核苷酸序列包括如下步骤:
[0019]将目标序列读入关联数组,其中每个序列被分成长度为n的字,且为了减少内存占用,避免为每个序列存储重复的字;
[0020]将每个序列都与其前一序列的索引相关联;
[0021]将匹配得到的序列用灰尘过滤算法再次进行处理,得到的结果如果在相似度指定范围内,那么认为是一对相邻序列;
[0022]对相邻序列的进行扩展查询,接而打分,并将低分的序列去除,最高分序列配对的写入指定的用户文件。
[0023]本专利技术提供的可重构基于硬件的核苷酸比对工具,包括计算机、FPGA模块以及通用异步收发器桥;
[0024]所述计算机,用于运行HARDWARE

BLASTn算法以根据目标序列查询相似的核苷酸序列;
[0025]所述FPGA模块,用于加速HARDWARE

BLASTn算法的部分模块进行加速;
[0026]所述通用异步收发器桥,用于计算机和FPGA模块之间的串行通信。
[0027]优选地,所述根据目标序列查询相似的核苷酸序列时包括如下步骤:
[0028]读取目标序列,根据所述目标序列查询到所有可能的待匹配序列;
[0029]对每段待匹配序列进行评分生成匹配分数,去除匹配分数低于预设置分数阈值的待匹配序列;
[0030]将匹配分数最高的若干个核苷酸序列确定为相似序列。
[0031]优选地,所述根据目标序列查询相似的核苷酸序列时还包括如下步骤:
[0032]根据所述目标序列对应的相似序列进行对所述目标序列进行扩展查询;
[0033]在扩展时根据目标序列的每段对应的主题序列进行评分生成匹配分数,根据最高匹配分数筛选出每段的相似序列段;
[0034]当匹配分数低于预设置的分数阈值时,扩展查询停止,并丢弃分数低于分数阈值的相关序列;
[0035]对于所有相似序列段进行合并,并按E值递增排序,并返回E值。
[0036]优选地,根据目标序列查询相似的核苷酸序列包括如下步骤:
[0037]将目标序列读入关联数组,其中每个序列被分成长度为n的字,且为了减少内存占用,避免为每个序列存储重复的字;
[0038]将每个序列都与其前一序列的索引相关联;
[0039]将匹配得到的序列用灰尘过滤算法再次进行处理,得到的结果如果在相似度指定范围内,那么认为是一对相邻序列;
[0040]对相邻序列的进行扩展查询,接而打分,并将低分的序列去除,最高分序列配对的写入指定的用户文件。
[0041]与现有技术相比,本专利技术具有如下的有益效果:
[0042]本专利技术设置有计算机和FPGA模块,通过计算机运行BLASTn算法以根据目标序列查询相似的核苷酸序列,通过所述FPGA模块加速BLASTn算法的部分模块,利用硬件并行处理的优势去执行测序,提高了测序效率。
附图说明
[0043]通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:
[0044]图1为本专利技术实施例中可重构基于硬件的核苷酸比对工具的使用流程框图;
[0045]图2为本专利技术实施例中算法结构在逻辑门阵列的框架图。
具体实施方式
[0046]下面结合具体实施例对本专利技术进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本专利技术,但不以任何形式限制本专利技术。应当指出的是,对本领域的普通技术人员来说,在不脱离本专利技术构思的前提下,还可以做出若干变形和改进。这些都属于本专利技术的保护范围。
[0047]图1为本专利技术实施例中可重构基于硬件的核苷酸比对工具的使用流程框图,图2为本专利技术实施例中算法结构在逻辑门阵列的框架图,如图1、图2所示,本专利技术提供的可重构基于硬件的核苷酸比对工具,包括计算机、FPGA模块以及通用异步收发器桥;
[0048]所述计算机,用于运行BLASTn算法以根据目标序列查询相似的核苷酸序列;
[0049]所述FPGA模块,用于加速BLASTn算法的史密斯

沃特曼部分;
[0050]所述通用异步收发器桥,用于计算机和FPGA模块之间的串行通信。
[0051]在本专利技术实施例中,所述史密斯

沃特曼部分时包括如下步骤:
[0052]读取目标序列,根据所述目标序本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种可重构基于硬件的核苷酸比对工具,其特征在于,包括计算机、FPGA模块以及通用异步收发器桥;所述计算机,用于运行BLASTn算法以根据目标序列查询相似的核苷酸序列;所述FPGA模块,用于加速BLASTn算法的史密斯

沃特曼部分;所述通用异步收发器桥,用于计算机和FPGA模块之间的串行通信。2.根据权利要求1所述的可重构基于硬件的核苷酸比对工具,其特征在于,所述史密斯

沃特曼部分时包括如下步骤:读取目标序列,根据所述目标序列查询到所有可能的待匹配序列;对每段待匹配序列进行评分生成匹配分数,去除匹配分数低于预设置分数阈值的待匹配序列;将匹配分数最高的若干个核苷酸序列确定为相似序列。3.根据权利要求2所述的可重构基于硬件的核苷酸比对工具,其特征在于,所述史密斯

沃特曼部分时还包括如下步骤:根据所述目标序列对应的相似序列进行对所述目标序列进行扩展查询;在扩展时根据目标序列的每段对应的主题序列进行评分生成匹配分数,根据最高匹配分数筛选出每段的相似序列段;当匹配分数低于预设置的分数阈值时,扩展查询停止,并丢弃分数低于分数阈值的相关序列;对于所有相似序列段进行合并,并按E值递增排序,并返回E值和S值,S值表示两序列的同源性,分值越高表明它们之间相似程度越大;E值就是S值的可靠性的评价,表明在随机的情况下,其他序列与目标序列相似度要大于该条相似序列的可能性,所以分值越低越好。4.根据权利要求1所述的可重构基于硬件的核苷酸比对工具,其特征在于,根据目标序列查询相似的核苷酸序列包括如下步骤:将目标序列读入关联数组,其中每个序列被分成长度为n的字,且为了减少内存占用,避免为每个序列存储重复的字;将每个序列都与其前一序列的索引相关联;将匹配得到的序列用灰尘过滤算法再次进行处理,得到的结果如果在相似度指定范围内,那么认为是一对相邻序列;对相邻序列的进行扩展查询,接...

【专利技术属性】
技术研发人员:安静张焓
申请(专利权)人:上海应用技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1