基因样本分析方法及电子设备技术

技术编号:16819406 阅读:30 留言:0更新日期:2017-12-16 12:56
本发明专利技术公开了一种基因样本分析方法,包括:接收基因样本选取指令;显示变异过滤选取界面;同时,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据并将其缓存在内存中;接收过滤条件选取指令;从内存中调用所述待分析样本数据,并根据过滤条件完成基因样本变异分析。本发明专利技术公开了一种采用了所述基因样本分析方法的电子设备。本发明专利技术提供的基因样本分析方法及电子设备,能够提高基因样本分析的反应速度。

Method of gene sample analysis and electronic equipment

The invention discloses a gene sample analysis method, including: receiving the gene sample selection instruction; display variation filter selection interface; at the same time, according to the samples selected, common variation information extraction samples were each selected, to form the analysis of sample data and the cache in memory; the receiving filter selection instruction call; from memory the analysis of sample data, and according to the conditions of complete gene mutation analysis sample filter. The present invention discloses an electronic device which adopts the method of analyzing the sample of the gene. The gene sample analysis method and electronic equipment provided by the present invention can improve the response speed of gene sample analysis.

【技术实现步骤摘要】
基因样本分析方法及电子设备
本专利技术涉及数据处理
,特别是指一种基因样本分析方法及电子设备。
技术介绍
基因样本变异分析需要对比多个基因样本,而每个基因样本可含几十万个变异,数据量可达十个GB。例如,一个人外显子(WES)数据,每个基因样本大约有20万个变异,每个变异信息数据大约在1-2KB左右,所以一个基因样本大约有200-400MB的数据。在小规模的群体数据分析中,当有40个基因样本的时候,数据量便达到了10GB之多。基因样本变异分析是要从这几十万个变异当中,找出几个最可能致病的变异,而过程中需要多次反复使用多种不同的过滤和对比条件,所以用户界面的反应速度是影响用户体验和工作效率的重要因素。一般来说,对应于不同的病人症状,一个病理学医生会有一系列不同的过滤条件。另一方面,虽然变异总数有很多,但与病人的疾病相关的变异却不多,与之关联的每一条医疗记录都必须被详细检查是否支持病人的症状。所以,医生使用变异过滤系统来筛选出相关的变异需要经过很多轮。在多基因样本变异分析系统中,需要对变异进行频繁的过滤和比较,每次操作可能需要几十秒以上才能反应过来,如GarvenInstitute的Seave系统,输入3个基因样本的数据,每次操作反应时间在15秒以上,用户界面反馈较慢,操作体验不佳。此外,由于基因样本的数据量较大,无法把基因样本数据缓存在有限的内存之中,而单是从一般的储存设备(如硬盘)中把基因样本数据读一次,就可能需要长达十秒的时间。同时,由于可供过滤和对比条件太多,也无法通过预先建立索引的方式来降低需要读取的数据量。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种基因样本分析方法及电子设备,能够提高基因样本分析的反应速度。基于上述目的本专利技术提供的基因样本分析方法,包括:接收基因样本选取指令;显示变异过滤选取界面;同时,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据并将其缓存在内存中;接收过滤条件选取指令;从内存中调用所述待分析样本数据,并根据过滤条件完成基因样本变异分析。可选的,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据,包括:在同一个变异信息出现在多个基因样本之中时,仅设置一个记录,每条记录里设置标记字段来记录该变异信息在每个样品中是否出现。可选的,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据,还包括:保留各被选取的基因样本的独有变异信息,以支持关于所述独有变异信息的查询。可选的,所述方法还包括:采用Manifest.json文件来管理每个基因样本的共同变异信息。可选的,根据过滤条件完成基因样本变异分析的步骤之后,还包括:输出基因样本变异分析结果。可选的,所述基因样本变异分析结果为output.json格式。可选的,输出基因样本变异分析结果的步骤之后,还包括:接收二次过滤条件选取指令;调用所述基因样本变异分析结果,并根据二次过滤条件再次完成基因样本变异分析。可选的,根据二次过滤条件再次完成基因样本变异分析的步骤之后,还包括:再次输出基因样本变异分析结果。可选的,所述方法还包括:接收停止分析指令;将所述基因样本变异分析结果存储于磁盘并退出分析。本专利技术实施例的第二个方面,提供了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-9任意一项所述的方法。从上面所述可以看出,本专利技术提供的基因样本分析方法及电子设备,通过构建待分析样本数据,从而将样本数据进行了压缩,使其占用空间大大减小(整体的数据量能够把数据量压缩到1GB以内,从而能够减少90%以上),同时把经压缩的数据缓存在内存中,能够满足用户快速分析的需要;并且,通过令用户在过滤条件选择界面下进行过滤条件选择的同时进行待分析样本数据的创建(即表面上用户在进行过滤条件选取,在后台也在同时进行待分析样本数据的创建),从而利用用户界面设计,隐藏了系统从存储设备中读出基因样本数据和压缩数据所需的时间。附图说明图1为本专利技术提供的基因样本分析方法的一个实施例的流程示意图;图1a为本专利技术提供的基因样本分析方法实施例中待分析样本数据的数据结构示意图;图2为本专利技术提供的基因样本分析方法的另一个实施例的流程示意图;图2a为本专利技术提供的基因样本分析方法的另一个实施例中的用户操作流程示意图;图3为本专利技术提供的基因样本分析装置的一个实施例的结构示意图;图4为本专利技术提供的电子设备的一个实施例的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术进一步详细说明。需要说明的是,本专利技术实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本专利技术实施例的限定,后续实施例对此不再一一说明。基于上述目的,本专利技术实施例的第一个方面,提出了一种能够提高基因样本分析的反应速度的基因样本分析方法。如图1所示,为本专利技术提供的基因样本分析方法的一个实施例的流程示意图。所述基因样本分析方法,包括:步骤101:接收基因样本选取指令;这里,所述基因样本选取指令中包含了用户在样本列表中选定的基因样本(参见图2a,样本关系框中打勾的即为被选取的基因样本);步骤102:显示变异过滤选取界面(参见图2a,变异过滤选取界面可以是变异过滤器框中显示的内容),供用户对需要进行过滤的选项进行选择;同时,根据被选取的基因样本,从存储基因样本数据的数据库中获取被选取的基因样本并提取各被选取的基因样本的共同变异信息,形成待分析样本数据(参考图2a中的memorytable)并将其缓存在内存中;步骤103:接收过滤条件选取指令;这里,所述基因样本选取指令中包含了用户所选取的过滤条件;如下是一个过滤条件的例子,可以用来比较和分析样品:“常染色体显性遗传(autosomaldominant),常染色体隐性遗传(autosomalrecessive),新发突变(denovo),X染色体显性遗传(X-linkdominant)”;步骤104:从内存中调用所述待分析样本数据,并根据过滤条件,通过应用过滤器(参考附图2a)完成基因样本变异分析,得到基因样本变异分析结果(参考附图2a中右下角的表格)。从上述实施例可以看出,本专利技术实施例提供的基因样本分析方法,通过构建待分析样本数据,从而将样本数据进行了压缩,使其占用空间大大减小(整体的数据量能够把数据量压缩到1GB以内,从而能够减少90%以上),同时把经压缩的数据缓存在内存中,能够满足用户快速分析的需要;并且,通过令用户在过滤条件选择界面下进行过滤条件选择的同时进行待分析样本数据的创建(即表面上用户在进行过滤条件选取,在后台也在同时进行待分析样本数据的创建),从而利用用户界面设计,隐藏了系统从存储设备中读出基因样本数据和压缩数据所需的时间。本专利技术实施例提供的基因样本分析方法,在进行变异分析的各种操作上,均可以在5秒之内反应,而且一般的硬件配置就可以满足要求。可选的,所述待分析样本数据中的共同本文档来自技高网...
基因样本分析方法及电子设备

【技术保护点】
一种基因样本分析方法,其特征在于,包括:接收基因样本选取指令;显示变异过滤选取界面;同时,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据并将其缓存在内存中;接收过滤条件选取指令;从内存中调用所述待分析样本数据,并根据过滤条件完成基因样本变异分析。

【技术特征摘要】
1.一种基因样本分析方法,其特征在于,包括:接收基因样本选取指令;显示变异过滤选取界面;同时,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据并将其缓存在内存中;接收过滤条件选取指令;从内存中调用所述待分析样本数据,并根据过滤条件完成基因样本变异分析。2.根据权利要求1所述的方法,其特征在于,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据,包括:在同一个变异信息出现在多个基因样本之中时,仅设置一个记录,每条记录里设置标记字段来记录该变异信息在每个样品中是否出现。3.根据权利要求1所述的方法,其特征在于,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据,还包括:保留各被选取的基因样本的独有变异信息,以支持关于所述独有变异信息的查询。4.根据权利要求1-3任一项所述的方法,其特征在于,还包括:采用Manifest.json文件来管理每个基因样本的共同变异信息。5.根据权利要求1...

【专利技术属性】
技术研发人员:蔡文君何光铸王东辉侯晓帆
申请(专利权)人:北京荣之联科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1