一种基因组数据的处理方法、系统及装置制造方法及图纸

技术编号:23769132 阅读:85 留言:0更新日期:2020-04-11 21:45
本发明专利技术公开了一种基因组数据的处理方法、系统及装置。其中,该方法包括:读取基因文件,其中,基因文件的类型包括如下至少之一:VCF文件、注释后的TSV文件或注释后的VCF文件;按照基因文件的类型,将基因文件存储到基因组数据库中;在服务器中成功部署配置文件的情况下,将应用程序解压到服务器的网页根目录下,其中,服务器的配置文件包括:访问端口和网页根目录,然后配置应用程序连接数据库。本发明专利技术解决了目前无法对自己构建的基因数据库进行方便地操作的技术问题。

A processing method, system and device of genomic data

【技术实现步骤摘要】
一种基因组数据的处理方法、系统及装置
本专利技术涉及数据处理领域,具体而言,涉及一种基因组数据的处理方法、系统及装置。
技术介绍
随着第二代基因测序的不断发展,该领域陆续涌现出了越来越多的测序数据,目前已有部分数据通过专业的技术人员,利用数据库和网站构建技术,构建特定的表型的数据库并进行数据展示,例如千人基因组数据库,gnomAD数据库等,可以便于科研工作者的查询。但是由于这些数据库的构建,均需要专业团队和专业人士进行处理,并且目前只覆盖了已产生的测序数据的冰山一角,普通科研工作者难以利用专业技术,对自己已经产生的数据,进行数据的展示与再利用或者共享等。因此,目前领域相关人员无法方便地对自己产生的基因组数据进行构建数据库,阻碍了数据的挖掘、利用、分享和展示。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种基因组数据的处理方法、系统及装置,以至少解决目前无法对自己构建的基因数据库进行方便地操作的技术问题。根据本专利技术实施例的一个方面,提供了一种基因组数据的处理方法,包括:获取基因文件,其中,基因文件的类型包括如下至少之一:VCF文件、注释后的TSV文件或注释后的VCF文件;按照基因文件的类型,将基因文件存储到基因组数据库中;在服务器中成功部署配置文件的情况下,将基因组数据库中的基因文件解压到服务器的网页根目录下,其中,配置文件包括:访问端口和网页根目录。可选的,在将基因组数据库中的基因文件解压到服务器的网页根目录下之后,所述方法还包括:接收到访问请求;基于访问请求调取网页根目录下的基因文件;将网页根目录下的基因文件,返回至前端应用界面中的网页中进行展示。可选的,在将网页根目录下的所述基因文件,返回至前端应用界面中的网页中进行展示之后,所述方法还包括:前端应用界面接收到操作指令,其中,操作指令包括如下至少之一:浏览、查询、打开、关闭、更新、筛选和共享;前端应用界面显示基于操作指令返回的操作结果。可选的,按照基因文件的类型,将基因文件存储到基因组数据库中,包括:读取所述基因文件的类型;在所述基因文件中存在所述VCF文件的情况下,统计所述VCF文件的数量;如果所述数量为多个,则将所述多个VCF文件进行合并,并将合并结果存储到所述基因组数据库;如果所述数量为一个,则将所述VCF文件直接存数至所述基因组数据库。可选的,基因文件中的VCF文件,存储VCF文件中的突变位点的频率信息至基因组数据库;基因文件中注释后的TSV文件或注释后的VCF文件,提取突变位点的注释信息,并将所有提取的突变位点的注释信息存储到基因组数据库中。可选的,在将基因组数据库中的基因文件解压到服务器的网页根目录下之前,所述方法还包括:更新服务器中部署的配置文件,并在设置访问端口和网页根目录的情况下,开启服务器。根据本专利技术实施例的另一方面,还提供了一种基因组数据的处理方法,包括:前端设备在应用界面上展示访问界面,其中,访问界面用于展示访问请求的访问结果;前端设备基于访问请求,从服务器中的网页根目录下读取与访问请求对应的基因文件,其中,服务器中存储在基因组数据库的基因文件解压在网页根目录下,基因文件的类型包括如下至少之一:VCF文件、注释后的TSV文件和注释后的VCF文件;前端设备将基因文件展示在应用界面中。可选的,在前端设备基于访问请求,从服务器中的网页根目录下读取与访问请求对应的基因文件之前,所述方法还包括:服务器接收到前端设备发送的访问请求;服务器基于访问请求调取网页根目录下的基因文件;其中,服务器在成功部署配置文件的情况下,将基因组数据库中的基因文件解压到所述服务器,其中,配置文件包括:访问端口和所述网页根目录。根据本专利技术实施例的另一方面,还提供了一种基因组数据的处理系统,包括:前端设备,用于在应用界面上展示访问界面,其中,访问界面用于展示访问请求的访问结果;服务器,与前端设备通信,用于接收访问请求,基于访问请求调取网页根目录下的基因文件,并将基因文件返回给所述前端设备。根据本专利技术实施例的另一方面,还提供了一种基因组数据的处理装置,包括:获取模块,用于获取基因文件,其中,基因文件的类型包括如下至少之一:VCF文件、注释后的TSV文件或注释后的VCF文件;存储模块,用于按照基因文件的类型,将基因文件存储到基因组数据库中;解压模块,用于在服务器中成功部署配置文件的情况下,将基因组数据库中的基因文件解压到服务器的网页根目录下,其中,配置文件包括:访问端口和网页根目录。根据本专利技术实施例的另一方面,还提供了一种非易失性存储介质,包括存储的程序,其中,所述程序运行时控制非易失性存储介质所在的设备执行一种基因组数据的处理方法。根据本专利技术实施例的另一方面,还提供了一种处理器用于运行程序,其中,所述程序运行时执行一种基因组数据的处理方法。在本专利技术实施例中,采用将基因文件存储到网页根目录的方式,达到了通过网页对基因文件进行操作的目的,从而实现了本领域人员通过网页方便地访问基因组数据库的技术效果,进而解决了目前无法对自己构建的基因数据库进行方便地操作的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种基因组数据的处理方法的流程图;图2是根据本专利技术实施例另一种基因组数据的处理方法的流程图;图3是根据本专利技术实施例的一种基因组数据的处理系统的结构框图;图4是根据本专利技术实施例的一种基因组数据的处理装置的结构框图;图5是本专利技术实施例的一种可选的基因组数据的处理方法的流程图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。根据本专利技术实施例,提供了一种基因组数据的处理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步本文档来自技高网
...

【技术保护点】
1.一种基因组数据的处理方法,其特征在于,包括:/n获取基因文件,其中,所述基因文件的类型包括如下至少之一:VCF文件、注释后的TSV文件和注释后的VCF文件;/n按照所述基因文件的类型,将所述基因文件存储到基因组数据库中;/n在服务器中成功部署配置文件的情况下,将所述基因组数据库中的基因文件解压到所述服务器的网页根目录下,其中,所述配置文件包括:访问端口和所述网页根目录。/n

【技术特征摘要】
1.一种基因组数据的处理方法,其特征在于,包括:
获取基因文件,其中,所述基因文件的类型包括如下至少之一:VCF文件、注释后的TSV文件和注释后的VCF文件;
按照所述基因文件的类型,将所述基因文件存储到基因组数据库中;
在服务器中成功部署配置文件的情况下,将所述基因组数据库中的基因文件解压到所述服务器的网页根目录下,其中,所述配置文件包括:访问端口和所述网页根目录。


2.根据权利要求1所述的方法,其特征在于,在将所述基因组数据库中的基因文件解压到所述服务器的网页根目录下之后,所述方法还包括:
接收到访问请求;
基于所述访问请求调取所述网页根目录下的所述基因文件;
将所述网页根目录下的所述基因文件,返回至前端应用界面中的网页中进行展示。


3.根据权利要求2所述的方法,其特征在于,在将所述网页根目录下的所述基因文件,返回至前端应用界面中的网页中进行展示之后,所述方法还包括:
所述前端应用界面接收到操作指令,其中,所述操作指令包括如下至少之一:浏览、查询、打开、关闭、更新、筛选和共享;
所述前端应用界面显示基于所述操作指令返回的操作结果。


4.根据权利要求1所述的方法,其特征在于,按照所述基因文件的类型,将所述基因文件存储到基因组数据库中,包括:
读取所述基因文件的类型;
在所述基因文件中存在所述VCF文件的情况下,统计所述VCF文件的数量;
如果所述数量为多个,则将所述多个VCF文件进行合并,并将合并结果存储到所述基因组数据库;
如果所述数量为一个,则将所述VCF文件直接存数至所述基因组数据库。


5.根据权利要求1至4中任意一项所述的方法,其特征在于,
所述基因文件中的VCF文件,存储所述VCF文件中的突变位点的频率信息至所述基因组数据库;
所述基因文件中注释后的TSV文件或注释后的VCF文件,提取突变位点的注释信息,并将所有提取的突变位点的注释信息存储到所述基因组数据库中。


6.根据权利要求1所述的方法,其特征在于,在将所述基因组数据库中的基因文件解压到所述服务器的网页根目录下之前,所述方法还包括:
更新所述服务器中部署的所述配置文件,并在设置所述访问端口和所述网页根目录的情况下,开启所述服务器。


7.一种基因组数据的处理方法,其特征在于,包括:
前端设备在应用界面上展...

【专利技术属性】
技术研发人员:余欢苏庆东李瑞强陈明李莉郑琪
申请(专利权)人:北京诺禾致源科技股份有限公司天津诺禾致源生物信息科技有限公司天津诺禾医学检验所有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1