变异位点的获取方法及装置制造方法及图纸

技术编号:14875591 阅读:105 留言:0更新日期:2017-03-23 23:12
本申请提供了一种变异位点的获取方法及装置,涉及生物信息技术领域。所述方法包括:将待测基因的多个短序列与参考基因组进行数据比对,获得待测基因的初步变异位点信息,所述初步变异位点信息中包括多个初步变异位点;根据所述初步变异位点信息,将所述多个初步变异位点中不满足预设保留条件的变异位点删除,获得所述待测基因中的变异位点。该方法及装置在初次获取的变异位点的基础上,进一步对不满足预设保留条件的变异位点进行删除,可以获得更加准确的变异位点。

【技术实现步骤摘要】

本申请涉及生物信息
,具体而言,涉及一种变异位点的获取方法及装置
技术介绍
现有的对变异位点的获取方法,常用被称为第二代测序技术的新一代测序技术(Next-generationsequencing)。虽然相比于第一代测序技术(Sangersequencing),第二代测序技术具有数据量巨大、测序时间快、单个基因位点成本低等优点,但也具有原始数据错误率高,变异位点的查找不够准确的问题。
技术实现思路
有鉴于此,本申请实施例提供了一种变异位点的获取方法及装置,对经过测序软件初步获得的变异位点进行进一步的过滤,将不满足预设保留条件的变异位点删除,以使获得的变异位点更加准确,以改善上述问题。为了实现上述目的,本申请采用的技术方案如下:一种变异位点的获取方法,所述方法包括:将待测基因的多个短序列与参考基因组进行数据比对,获得待测基因的初步变异位点信息,所述初步变异位点信息中包括多个初步变异位点;根据所述初步变异位点信息,将所述多个初步变异位点中不满足预设保留条件的变异位点删除,获得所述待测基因中的变异位点。一种变异位点的获取装置,所述装置包括:比对模块,用于将待测基因的多个短序列与参考基因组进行数据比对,获得待测基因的初步变异位点信息,所述初步变异位点信息中包括多个初步变异位点;过滤模块,用于根据所述初步变异位点信息,将所述多个初步变异位点中不满足预设保留条件的变异位点删除,获得所述待测基因中的变异位点。本申请实施例提供的变异位点的获取方法及装置,在待测基因的短序列与参考基因组进行比对获得包括多个变异位点的信息的初步变异位点信息后,根据该初步变异位点信息,对该初步变异位点信息中的多个变异位点进行再一次的过滤,即删除初步变异位点中不满足预设保留条件的变异位点,使最后保留的变异位点为准确率更高的位点。本方案获得的待测基因中的变异位点相比于现有技术,具有更高的准确率。为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。图1示出了本申请实施例提供的计算机的结构示意图;图2示出了本申请第一实施例提供的变异位点的获取方法的一种流程图;图3示出了本申请第一实施例提供的变异位点的获取方法的另一种流程图;图4示出了本申请第二实施例提供的变异位点的获取装置的功能模块图;图5示出了本申请第二实施例提供的变异位点的获取装置的过滤模块的功能模块图;图6示出了本申请第二实施例提供的变异位点的获取装置的比对模块的功能模块图。具体实施方式下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。如图1所示,是本申请计算机100的方框示意图。所述计算机100包括变异位点的获取装置200、存储器101、存储控制器102、处理器103、外设接口104、输入输出单元105及其他。所述存储器101、存储控制器102、处理器103、外设接口104以及输入输出单元105各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述变异位点的获取装置200包括至少一个可以软件或固件(firmware)的形式存储于所述存储器101中或固化在所述计算机100的操作系统(operatingsystem,OS)中的软件功能模块。所述处理器103用于执行存储器101中存储的可执行模块,例如所述变异位点的获取装置200包括的软件功能模块或计算机程序。其中,存储器101可以是,但不限于,随机存取存储器(RandomAccessMemory,RAM),只读存储器(ReadOnlyMemory,ROM),可编程只读存储器(ProgrammableRead-OnlyMemory,PROM),可擦除只读存储器(ErasableProgrammableRead-OnlyMemory,EPROM),电可擦除只读存储器(ElectricErasableProgrammableRead-OnlyMemory,EEPROM)等。其中,存储器101用于存储程序,所述处理器103在接收到执行指令后,执行所述程序,前述本申请实施例任一实施例揭示的流过程定义的计算机100所执行的方法可以应用于处理器103中,或者由处理器103实现。处理器103可能是一种集成电路芯片,具有信号的处理能力。上述的处理器103可以是通用处理器,包括中央处理器(CentralProcessingUnit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器103也可以是任何常规的处理器等。所述外设接口104将各种输入/输出装置耦合至处理器103以及存储器101。在一些实施例中,外设接口104,处理器103以及存储控制器102可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。输入输出单元105用于提供给用户输入数据实现用户与所述计算机的交互。所述输入输出单元可以是,但不限于,数据读取装置、鼠标和键盘等。可以理解的,图1所示的结构仅为示意,计算机100还可以包括比图1中所示更多或更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。第一实施例本申请实施例提供了一种变异位点的获取方法,请参见图2,该方法包括:步骤S110:将待测基因的多个短序列与参考基因组进行数据比对,获得待测基因的初步变异位点信息,所述初步变异位点信息中包括多个初步变异位点。首先,获取待测基因的多个短序列,该短序列可以是通过第二代测序平台输出。将待测基因的短序列与参考基因组进行比对。如,若待测基因为人类基因,该参考基因组则为人类参考基因组。当然,该比对过程可以包括多次比对以及去重等过程,得到比对后的包括多个变异位点的变异位点信息。具体的,如图3所示,在本实施例中,本步骤中的数据本文档来自技高网...
变异位点的获取方法及装置

【技术保护点】
一种变异位点的获取方法,其特征在于,所述方法包括:将待测基因的多个短序列与参考基因组进行数据比对,获得待测基因的初步变异位点信息,所述初步变异位点信息中包括多个初步变异位点;根据所述初步变异位点信息,将所述多个初步变异位点中不满足预设保留条件的变异位点删除,获得所述待测基因中的变异位点。

【技术特征摘要】
1.一种变异位点的获取方法,其特征在于,所述方法包括:将待测基因的多个短序列与参考基因组进行数据比对,获得待测基因的初步变异位点信息,所述初步变异位点信息中包括多个初步变异位点;根据所述初步变异位点信息,将所述多个初步变异位点中不满足预设保留条件的变异位点删除,获得所述待测基因中的变异位点。2.根据权利要求1所述的方法,其特征在于,所述将所述多个初步变异位点中不满足预设保留条件的变异位点删除包括:去除所述多个初步变异位点中,等位基因的个数大于预设阈值的变异位点。3.根据权利要求1所述的方法,其特征在于,所述初步变异位点信息中还包括所述多个初步变异位点所在的位置,所述将所述多个初步变异位点中不满足预设保留条件的变异位点删除包括:删除所述多个初步变异位点中,位于每个插入缺失的上游范围或者下游范围内的所有变异位点,所述上游范围和下游范围包括的碱基个数为预设个数。4.根据权利要求1所述的方法,其特征在于,所述初步变异位点信息中还包括所述多个初步变异位点所在的位置,所述将所述多个初步变异位点中不满足预设保留条件的变异位点删除包括:将所述多个初步变异位点中,彼此之间间隔预设碱基个数的变异位点删除。5.根据权利要求1所述的方法,其特征在于,所述将所述多个初步变异位点中不满足预设保留条件的变异位点删除包括:将所述多个初步变异位点中,对应的GQ值小于预设GQ阈值的变异位点删除。6.根据权利要求1所述的方法,其特征在于,所述将所述多个初步变异位点中不满足预设保留条件的变异位点删除包括:将所述多个初步变异位点中,对应的MQ值小于预设MQ阈值的变异位点删除。7.根据权利要求1所述的方法,...

【专利技术属性】
技术研发人员:范振鑫
申请(专利权)人:成都鑫云解码科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1