【技术实现步骤摘要】
本专利技术涉及生物医学数据分析领域,具体而言,涉及一种癌症体细胞突变基因测序数据分析工作流整合算法。
技术介绍
基因是遗传的物质基础。生物体的生老病死等一切生命现象都与基因有关。基因测序是解读生命的一种途径,随着第二代及第三代高通量测序技术的发展,测序结果往往是TB级别甚至更大的的序列数据。合理分析解读这些大规模及高维度的数据成为获取数据后一个更大的难点,是当前生物研究的关键步骤,具有巨大的现实意义。 海量高通量测序数据的存储、处理和分析都极大地挑战着当前的计算机系统和计算模式。现有的系统面临运算量不够,人工干预可靠度较低,云架构对底层硬件控制力较低及用户隐私担忧等问题。 现有的大数据测序信息对数据分析工具的挑战需要存储、管理、传输、调度和计算分析优化的全面协调,需要生物领域、计算机领域、数据统计分析等多方密切配合,尤其在分析工具的整合方面,现有的数据分析软件存在整合度低,对不同来源的数据匹配较差,准确度和重复性不高,效率低下等多种问题。 在肿瘤检测和早期诊断中,癌症体细胞突变是测序检测所重点关注的问题,这要求能够尽量高效而准确的分析测序原始数据,但是现有的算法往往只关注与测序数据分析的单一的环节,而每个步骤中过于繁杂的分析软件的选择范围,也给由测序原始数据得出诊断结果增加了障碍, 例如,在测序数据比对环节,常用的算法包括bwa,bowtie,cushaw,barracuda,运算速度不同,适配的基础硬件也不同,其中cushaw为高性能运算卡专门设计,可以达到并行计算进行加速的目的,而bwa,bo ...
【技术保护点】
癌症体细胞突变基因测序分析数据工作流整合算法,其特征在于,包括如下步骤:(1)将测序数据比对到参考基因组序列,使用bwa算法,使用科学运算流处理器加速后,数据比对速度提高至其他软件的10‑100倍;(2)SNP鉴定,使用samtools算法,兼容多种数据格式,准确度高,定位快速;(3)癌症体细胞突变鉴定,使用VarScan算法,兼容数据种类多,准确度高,输入输出符合公开标准。
【技术特征摘要】
1.癌症体细胞突变基因测序分析数据工作流整合算法,其特征在于,包括如下步骤:
(1)将测序数据比对到参考基因组序列,使用bwa算法,使用科学运算流处理器加速后,数据比对速度
提高至其他软件的10-100倍;
(2)SNP鉴定,使用samtools算法,兼容多种数据格式,准确度高,定位快速;
(3)癌症体细胞突变鉴定,使用VarScan算法,兼容数据种类...
【专利技术属性】
技术研发人员:吴翀,王瑜,闫威,
申请(专利权)人:北京微旋基因技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。