【技术实现步骤摘要】
基于ARM架构云平台的基因数据处理方法及系统
[0001]本专利技术涉及
ARM
架构云平台
,尤其涉及一种基于
ARM
架构云平台的基因数据处理方法及系统
。
技术介绍
[0002]在基因组学和生物信息学领域,基因数据处理是分析和解释基因组测序数据的关键步骤
。
目前,对于基因数据的处理,一般采用的是串行计算方法
。
传统的串行计算方法是一种逐步处理的方式,它按顺序执行数据处理的各个步骤
。
然而,随着高通量测序技术的迅速发展,测序数据量呈指数级增长,传统的串行计算方法已无法满足需求,面临诸多技术问题
。
其中包括大规模数据处理效率低下,导致数据处理时间延长,无法充分利用现代处理器和计算平台的潜力;数据存储和传输瓶颈,大规模基因数据需要大量存储空间并可能影响整体效率;数据精度和准确性要求高,大规模数据处理中的错误和噪声增多,可能影响研究结果;缺乏实时数据处理能力,某些应用需要快速处理数据以指导临床决策;传统串行计算方法可能导致计算资源浪费
。
技术实现思路
[0003]为解决现有技术中存在的技术问题,本专利技术提出基于
ARM
架构云平台的基因数据处理方法及系统,通过将
samblaster
从
x86
架构计算平台移植到
ARM
架构云平台并进行并行化等优化,进一步提高
samblaster
对基因数据 ...
【技术保护点】
【技术特征摘要】
1.
基于
ARM
架构云平台的基因数据处理方法,其特征在于,包括:
S1
:搭建基于
ARM
架构的华为云平台;
S2
:获取
samblaster
源码包,将其上传至华为云平台,调整时钟使其适配
ARM
架构,编译安装
samblaster
并在
ARM
架构下验证;
S3
:基于
ARM
架构对
samblaster
进行优化并重新编译;
S4
:编译安装
samblaster
管道运行所需软件
bwa、samtools
,搭建基于
ARM
架构的基因数据处理环境;
S5
:基于搭建的基因数据处理环境为用户提供基因数据处理服务,具体包括:接收用户的云服务请求,对基因数据进行处理,并向用户返回处理后的基因数据
。2.
如权利要求1所述的基于
ARM
架构云平台的基因数据处理方法,其特征在于,步骤
S2
包括:
S2.1
:下载
samblaster
源码包;
S2.2
:使用
WinSCP
工具将其上传至服务器的
/root/samblaster
目录;
S2.3
:统一时钟;
S2.4
:编译安装
samblaster
并在
ARM
架构下验证
samblaster
的版本是否正确
。3.
如权利要求2所述的基于
ARM
架构云平台的基因数据处理方法,其特征在于,
S2.4
包括:使用
PuTTY
工具以
root
用户身份登录服务器;进入
samblaster
安装目录;编译
samblaster
;将文件拷贝到
/usr/local/bin/.
路径下;验证
samblaster
的版本是否正确
。4.
如权利要求1所述的基于
ARM
架构云平台的基因数据处理方法,其特征在于,步骤
S3
中的优化方式包括:编译优化
、
实现高效的内存访问机制和使用
OpenMP
进行并行化优化
。5.
如权利要求4所述的基于
ARM
架构云平台的基因数据处理方法,其特征在于,编译优化包括:使用华为毕昇编译器编译
、
优化编译选项或者优化原子操作多核场景;实现高效的内存访问机制具体包括:选择文件缓冲机制
、
减少内存拷贝
、
使用
jemalloc
优化内存分配或者修改业务代码使读写频繁的数据以缓存行大小对齐
。6.
如权利要求1所述的基于
ARM
架构云平台的基因数据处理方法,其特征在于,
S4
...
【专利技术属性】
技术研发人员:边雨璇,李沛,段元元,吕照阳,姚世雄,
申请(专利权)人:华中师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。