当前位置: 首页 > 专利查询>山东大学专利>正文

一种生物测序序列快速修剪方法及系统技术方案

技术编号:33274734 阅读:32 留言:0更新日期:2022-04-30 23:33
本发明专利技术提供了一种生物测序序列快速修剪方法及系统,其属于生物信息技术领域,所述方案包括:获取待修剪的生物测序序列;对所述生物测序序列进行读操作、修剪操作以及写操作;其中,基于生产者—消费者模型对所述读操作、修剪操作以及写操作进行解耦,实现异步执行;且所述生物测序序列的格式化过程从读操作中转移到修剪操作中。转移到修剪操作中。转移到修剪操作中。

【技术实现步骤摘要】
一种生物测序序列快速修剪方法及系统


[0001]本专利技术属于生物信息
,尤其涉及一种生物测序序列快速修剪方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]在新一代测序中,要进行测序的核酸序列与接头序列(Adapter)连接,以便被测序仪识别,然而当核酸序列的长度短于测序平台运行的读取长度时,测序得到的基因序列片段(称之为Read)将同时包含需要进行测序的核酸序列以及全部或者部分接头序列。除此之外,在NGS(Next Generation Sequencing:下一代测序)测序中,测序结果的可信度在末尾循环(tail cycle)会变得较低,得到的是一些低质量的测序序列。被测序接头或者低质量的测序过程污染的测序序列经常导致不能满意的下游分析(如基因比对工作等)结果,因此修剪(Trim)测序中的接头以及低质量的数据成为下游分析任务之前不可缺少的环节。
[0004]随着现代测序仪的进步,不断增长的吞吐量和序列长度,为修剪工作提出了新的挑战,当前的一些处本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种生物测序序列快速修剪方法,其特征在于,包括:获取待修剪的生物测序序列;对所述生物测序序列进行读操作、修剪操作以及写操作;其中,基于生产者—消费者模型对所述读操作、修剪操作以及写操作进行解耦,实现异步执行;且所述生物测序序列的格式化过程从读操作中转移到修剪操作中。2.如权利要求1所述的一种生物测序序列快速修剪方法,其特征在于,所述读操作、修剪操作以及写操作分别采用独立的线程进行实现,其中,读线程和写线程均设置有一个,所述修剪线程设置有一个或多个。3.如权利要求1所述的一种生物测序序列快速修剪方法,其特征在于,所述读操作用于通过读线程对所述生物测序序列按照块方式进行读取,并将读取的块对象存储入第一数据队列中。4.如权利要求3所述的一种生物测序序列快速修剪方法,其特征在于,所述块对象的创建引入数据池思想,仅创建预设数量的块对象进行重复使用。5.如权利要求1所述的一种生物测序序列快速修剪方法,其特征在于,所述修剪操作用于通过修剪线程从所述第一数据队列中获取数据,对所述生物测序序列进行格式化,去除生物测序序列中低质量碱基序列和接头序列;同时将处理后的序列...

【专利技术属性】
技术研发人员:刘卫国王明凯殷泽坤张浩
申请(专利权)人:山东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1