基于NGS的突变基因的分析装置、设备及存储介质制造方法及图纸

技术编号:20162467 阅读:30 留言:0更新日期:2019-01-19 00:15
本发明专利技术公开了一种基于NGS的突变基因的分析装置,首先由获取模块获取与突变基因对应的突变样本数据,然后由检索模块根据突变样本数据,利用预先建立的网络爬虫在目标网站数据库中检索与突变样本数据对应的突变数据,最后再利用分析模块对突变数据进行分析并生成分析报告,本申请能利用获取模块,检索模块以及分析模块对突变基因进行自动化的分析,相比于现有技术,本分析装置在对突变基因进行分析时,相对于人工对突变基因从多个数据库资料逐一比对的操作及文献查找的方式。显著缩短了对突变基因的分析时长,因而提高了对突变基因的分析效率。此外,本发明专利技术还公开了一种基于NGS的突变基因的分析设备及存储介质,效果如上。

【技术实现步骤摘要】
基于NGS的突变基因的分析装置、设备及存储介质
本专利技术涉及医学领域,特别涉及一种基于NGS的突变基因的分析装置、设备及存储介质。
技术介绍
近年来,二代测序技术使基因测序技术进入了高通量、低成本的时代,随着测序技术的发展,越来越多的和临床疾病相关的突变被鉴定出来,为临床复杂疾病的基因诊断和治疗带来了曙光。对NGS测序结果的分析以找出突变基因的致病位点显得至关重要。目前,对NGS测序结果的分析主要是通过人工筛选进行突变基因的检测与分析,对于突变基因的分析流程只能依靠人工单个操作,在找到一个突变基因后,需要技术人员搜索多个网站以和数据库对突变基因进行逐一比对分析及查阅文献。如此,采用人工的方式根据突变基因进行分析以确定基因突变的意义以对相关疾病进行诊断时,会耗费大量的时间导致对突变基因的分析效率较低,报告发单时间长,不能适应临床诊断的要求。因此,如何提高对突变基因的分析效率以适应辅助临床诊断的要求是二代测序是否能成为精准医疗有效工具亟待解决的问题。
技术实现思路
本专利技术的目的在于提供一种基于NGS的突变基因的分析装置、设备及存储介质,提高了对突变基因的分析效率。为实现上述目的,本专利技术实施例提供了如下技术方案:第一,本专利技术实施例提供了一种基于NGS的突变基因的分析装置,包括:获取模块,用于获取与突变基因对应的突变样本数据;检索模块,用于根据所述突变样本数据,利用预先建立的网络爬虫在目标网站数据库中检索与所述突变样本数据对应的突变信息;分析模块,用于对所述突变信息进行分析并生成分析报告。优选的,所述获取模块具体包括:第一获取单元,用于从生物信息分析系统中获取初始样本数据;第一筛选单元,用于对所述初始样本数据进行靶向筛选以去除所述初始样本数据中的多态性基因突变位点;第二筛选单元,用于对去除所述多态性基因突变位点中的初始样本数据进行突变检出以确定所述突变样本数据。优选的,所述检索模块具体包括:第一确定单元,用于确定所述突变样本数据中字段标识;检索单元,用于根据所述字段标识,利用所述网络爬虫在目标网站数据库中检索与所述字段标识对应的突变信息。优选的,还包括:判断模块,用于判断所述突变样本数据中的字段标识的类型;若确定所述突变样本数据中的字段标识的类型为与生物信息分析系统对应的第一类型,则进入确定模块;所述确定模块,用于从预先确定的与所述第一类型对应的数据库中确定突变信息;若所述突变样本数据中的字段标识的类型为与所述生物信息分析系统对应的第二类型,则进入所述检索模块。优选的,所述检索单元中的目标网站数据库具体包括:NCBI网站数据库和COSMIC网站数据库。优选的,若所述检索模块未从所述目标网站数据库中检索到与所述突变样本数据对应的突变信息,还包括:查找模块,用于利用所述网络爬虫在联合知识库中查找与所述突变样本数据对应的突变信息。第二,本专利技术实施例提供了一种基于NGS的突变基因的分析设备,包括:存储器,用于存储分析程序;处理器,用于执行所述存储器中存储的分析程序时执行以下步骤:获取与突变基因对应的突变样本数据;根据所述突变样本数据,利用预先建立的网络爬虫在目标网站数据库中检索与所述突变样本数据对应的突变信息;对所述突变信息进行分析并生成分析报告。第三,本专利技术实施例公开了一种计算机可读存储介质,计算机可读存储介质上存储分析程序,分析程序被处理器执行时实现对突变基因分析。所述计算机可读存储介质上存储有分析程序,所述分析程序被处理器执行以下步骤:获取与突变基因对应的突变样本数据;根据所述突变样本数据,利用预先建立的网络爬虫在目标网站数据库中检索与所述突变样本数据对应的突变信息;对所述突变信息进行分析并生成分析报告。可见,本专利技术实施例公开的一种基于NGS的突变基因的分析装置,首先由获取模块获取与突变基因对应的突变样本数据,然后由检索模块根据突变样本数据,利用预先建立的网络爬虫在目标网站数据库中检索与突变样本数据对应的突变数据,最后再利用分析模块对突变数据进行分析并生成分析报告,如此,采用本专利技术实施例提供的分析装置,能利用获取模块,检索模块以及分析模块对突变基因进行自动化的分析。相比于现有技术,本分析装置在对突变基因进行分析时,相对于人工对突变基因从多个数据库资料逐一比对的操作及文献查找的方式。显著缩短了对突变基因的分析时长,因而提高了对突变基因的分析效率。此外,本专利技术实施例还公开了一种基于NGS的突变基因的分析设备及存储介质,效果如上。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例公开的一种基于NGS的突变基因的分析装置结构示意图;图2为本专利技术实施例公开的一种基于NGS的突变基因的分析设备结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的目的在于提供一种用于突变基因的分析装置、设备及存储介质,提高了对突变基因的分析效率。请参见图1,图1为本专利技术实施例公开的一种基于NGS的突变基因的分析装置结构示意图,该装置包括:获取模块101,用于获取与突变基因对应的突变样本数据。检索模块102,用于根据突变样本数据,利用预先建立的网络爬虫在目标网站数据库中检索与突变样本数据对应的突变数据。分析模块103,用于对突变数据进行分析并生成分析报告。具体的,本实施例中,获取模块101获取与突变基因对应的突变样本数据可以分为以下几个步骤:首先是先获取与突变基因对应的初始样本数据(初始样本数据中包括正常的基因数据和突变基因数据),初始样本数据是从生物信息分析系统中获取的,生物信息分析系统的概念可以参见现有技术。得到初始样本数据之后,需要从初始样本数据中选取突变基因,从而确定突变样本数据,确定突变样本数据的方式为先筛除多态性基因突变位点,然后对去除了多态性基因突变位点的初始样本数据进行突变检出从而确定突变样本数据。进一步,检索模块102中,根据获取模块101中获取到的突变样本数据,在目标网站数据库中查找与突变样本数据对应的突变信息,即核实该突变的核酸和蛋白位点,转录本,突变基因命名等信息,该突变基因对应的疾病类型,该突变基因对应的疾病预后和临床用药的影响等。由检索模块102检索出对应的突变信息后,由分析模块103对突变信息进行分析并生成分析报告。此外,网络爬虫又可以称为网络机器人和网络蜘蛛,网络爬虫的概念可以参见现有技术,网络爬虫可以是预先编写的自动从网站上提取与突变样本数据对应的网络信息。本实施例中,网络爬虫抓取目标为与突变样本数据对应的信息。本专利技术实施例中的网站为NCBI网站和COSMIC网站,当确定与突变基因对应的突变样本数据之后,由网络爬虫根据该突变样本数据在NCBI网站和COSMIC网站中爬取与突变样本数据对应的突变信息(突变样本数据与突变基因对应的疾病,突变基因本文档来自技高网...

【技术保护点】
1.一种基于NGS的突变基因的分析装置,其特征在于,包括:获取模块,用于获取与突变基因对应的突变样本数据;检索模块,用于根据所述突变样本数据,利用预先建立的网络爬虫在目标网站数据库中检索与所述突变样本数据对应的突变信息;分析模块,用于对所述突变信息进行分析并生成分析报告。

【技术特征摘要】
1.一种基于NGS的突变基因的分析装置,其特征在于,包括:获取模块,用于获取与突变基因对应的突变样本数据;检索模块,用于根据所述突变样本数据,利用预先建立的网络爬虫在目标网站数据库中检索与所述突变样本数据对应的突变信息;分析模块,用于对所述突变信息进行分析并生成分析报告。2.根据权利要求1所述的基于NGS的突变基因的分析装置,其特征在于,所述获取模块具体包括:第一获取单元,用于从生物信息分析系统中获取初始样本数据;第一筛选单元,用于对所述初始样本数据进行靶向筛选以去除所述初始样本数据中的多态性基因突变位点;第二筛选单元,用于对去除所述多态性基因突变位点中的初始样本数据进行突变检出以确定所述突变样本数据。3.根据权利要求1所述的基于NGS的突变基因的分析装置,其特征在于,所述检索模块具体包括:第一确定单元,用于确定所述突变样本数据中字段标识;检索单元,用于根据所述字段标识,利用所述网络爬虫在目标网站数据库中检索与所述字段标识对应的突变信息。4.根据权利要求3所述的基于NGS的突变基因的分析装置,其特征在于,还包括:判断模块,用于判断所述突变样本数据中的字段标识的类型;若确定所述突变样本数据中的字段标识的类型为与生物信息分析系统对应的第一类型,则进入确定模块;所述确定模块,用于从预先确定的与所述第一类型对应的...

【专利技术属性】
技术研发人员:张暋谷晓辉秦建平佘维韩雪莹朱丽蒙蔡田刘玉霞丁利霞
申请(专利权)人:郑州金域临床检验中心有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1