一种基于偏移量优化高性能计算集群上G-BLASTN数据传输的方案制造技术

技术编号:26689606 阅读:23 留言:0更新日期:2020-12-12 02:38
本发明专利技术公布了一种数据传输性能高效的、适合于高性能计算集群的G‑BLASTN优化方案。目前的G‑BLASTN执行过程是传输一条核酸数据库中的序列到GPU显存上,执行一次查询序列比对该条的过程。这种设计模式是基于降低性能换取兼容性的考虑。但对于高性能计算集群而言,它往往拥有超大的内存、显存足够容纳各种核酸数据库。我们通过将核酸数据库中的所有序列集中组织到一起,以偏移量形式存、取序列,实现了核酸序列整体传输到GPU端,让显存中包含整个核酸数据库后再依次执行序列的比对。这大幅地提升了数据传输的并发性,使得CPU内存到GPU设备内存的数据传输性能提高1.93倍,GPU总运算时间缩短了21.3%。

【技术实现步骤摘要】
一种基于偏移量优化高性能计算集群上G-BLASTN数据传输的方案
本专利技术是一种基于偏移量优化高性能计算集群上G-BLASTN数据传输的方案。方案采用了以偏移量的方式来组织所有subjectsequence序列到CPU端,从而实现一次传输整个数据库,并且整个核酸数据库中的subjectsequence全部传输完成后才一次执行比对。这种方式避免了浪费带宽、数据传输耗时长的弊端,提升了GPU计算部分的整体性能。
技术介绍
目前关于高性能计算集群上G-BLASTN软件的数据传输耗时长问题尚未引起足够重视,本篇文章是首次提出使用偏移量的方式对G-BLASTN的数据传输模式进行优化。G-BLASTN程序执行时,是每次传输一条数据库中的subjectsequence到GPU显存上,然后执行该条序列与查询序列的比对。这种数据传输模式具有以下几个缺点:(1)GPU-CPU间带宽利用率低:subjectsequence往往都不是长度都不是很大,一般而言10Mb左右,这样就导致GPU-CPU间带宽利用率低。(2)传输性能差:各种核酸数据库本文档来自技高网...

【技术保护点】
1.一种基于偏移量优化高性能计算集群上G-BLASTN数据传输的方案,其特征在于:/n1)将核酸数据库中所有subject sequence集中组织到内存上的一块空间,实现以偏移量的方式存、取subject sequence;/n2)完整传输核酸数据库后在进行subject sequence与查询序列的对比打分;/n3)无论核酸数据库中有多少条序列,均是一次传输到GPU设备端,省去大量CUDA内存管理API。/n

【技术特征摘要】
1.一种基于偏移量优化高性能计算集群上G-BLASTN数据传输的方案,其特征在于:
1)将核酸数据库中所有subjectsequence集中组织到内存上的一块空间,实现以偏移量的方式存、取subjectsequence;
2)完整传输核酸数据库后在进行subjectsequence与查询序列的对比打分;
3)无论核酸数据库中有多少条序列,均是一次传输到GPU设备端,省去大量CUDA内存管理API。


2.如权利要求1所述的一种基于偏移量优化高性能计算集群上G-BLASTN数据传输的方案,其特征在于针对G-BLASTN低带宽利用率、高耗时的数据传输过程进行优化,即对每次传输一条subjectsequence到GPU改进成一次传输核酸数据库中所有subjectsequence到GPU,使用偏移量存、取相关的subjectsequence,实现全核酸数据库的传输。

...

【专利技术属性】
技术研发人员:钱红燕张雁楠
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1