一种基于大数据的生物信息分析平台系统技术方案

技术编号:21632378 阅读:39 留言:0更新日期:2019-07-17 12:14
本发明专利技术公开了一种基于大数据的生物信息分析平台系统,包括:国际公共基因数据库服务平台(100),用于预先存储预设的国际公共基因数据库;生物信息分析平台(200),与国际公共基因数据库服务平台(100)通过互联网相连接,用于预先存储本地的基因数据库,并根据用户所输入的待检索的基因数据,在所述本地的基因数据库和预设的国际公共基因数据库中进行检索,筛选出与该基因数据所对应的检索结果,并实时进行显示。本发明专利技术可以方便、可靠地对用户指定的生物的基因数据进行检索分析,及时获得该基因数据所对应的核酸序列和蛋白序列数据,方便用户开展进一步的研究,满足用户对基因数据进行快速检索的迫切要求。

A Bioinformatics Analysis Platform System Based on Large Data

【技术实现步骤摘要】
一种基于大数据的生物信息分析平台系统
本专利技术涉及基因数据分析
,特别是涉及一种基于大数据的生物信息分析平台系统。
技术介绍
目前,生物信息分析平台是将各种生物信息学分析软件集成起来,通过网页或者命令行的方式,对用户指定的生物的基因数据进行检索,从而获得基因序列所对应的核酸序列和蛋白序列数据的平台。但是,对于传统的生物信息分析平台,其在开展基因数据检索时,高度依赖于本地基因数据库,由于本地基因数据库所预先采集和存储的核酸序列和蛋白序列数据的数量非常有限,因此,在对生物的基因数据进行检索时,有时候无法检索获得对应的核酸序列和蛋白序列数据,因此,无法满足用户对基因数据的检索需求,无法及时获得该基因数据所对应的核酸序列和蛋白序列数据,从而给用户的研究带来困难。因此,目前迫切需要开发出一种技术,其可以方便、可靠地对用户指定的生物的基因数据进行检索分析,及时获得该基因数据所对应的核酸序列和蛋白序列数据,方便用户开展进一步的研究。
技术实现思路
有鉴于此,本专利技术的目的是提供一种基于大数据的生物信息分析平台系统,其可以方便、可靠地对用户指定的生物的基因数据进行检索分析,及时获得该基因数据所对应的核酸序列和蛋白序列数据,方便用户开展进一步的研究,满足用户对基因数据进行快速检索的迫切要求,具有重大的生产实践意义。为此,本专利技术提供了一种基于大数据的生物信息分析平台系统,包括:国际公共基因数据库服务平台,用于预先存储预设的国际公共基因数据库;生物信息分析平台,与国际公共基因数据库服务平台通过互联网相连接,用于预先存储本地的基因数据库,并根据用户所输入的待检索的基因数据,在所述本地的基因数据库和预设的国际公共基因数据库中进行检索,筛选出与该基因数据所对应的检索结果,并实时进行显示。其中,所述国际公共基因数据库服务平台为超级计算机中心所搭建的云端服务器;所述生物信息分析平台包括至少一台计算机。其中,所述预设的国际公共基因数据库包括基因名称数据子库、基因代码数据子库、核酸序列数据子库和蛋白序列数据子库以及它们之间的对应关系;其中:所述基因名称数据子库包括在全球范围内预先采集的预设多个基因的名称数据;所述基因代码数据子库包括在全球范围内预先采集的预设多个基因代码数据;所述核酸序列数据子库包括在在全球范围内预先采集的预设多个核酸序列数据;所述蛋白序列数据子库包括在在全球范围内预先采集的预设多个蛋白序列数据。其中,所述预设的国际公共基因数据库还包括医疗诊断案例数据子库,该医疗案例诊断数据子库包括预设的多个基因名称数据、预设多个医疗案例数据和预设的多个诊断方案以及它们之间的对应关系。其中,所述用户所输入的待检索的基因数据包括基因名称和/或基因代码;所述本地的基因数据库包括在所述生物信息分析平台上存储的、用户在本地所预先采集的预设多个基因名称数据、多个基因代码数据、多个核酸序列数据和多个蛋白序列数据以及它们之间的对应关系。其中,所述生物信息分析平台包括本地基因数据库存储模块、在线分析检索模块、离线分析检索模块、分析检索结果显示模块和临时数据存储输出模块,其中:所述本地基因数据库存储模块,用于预先存储所述本地的基因数据库;所述在线分析检索模块,与所述国际公共基因数据库服务平台相连接,用于根据用户所输入的待检索的基因数据,在所述预设的国际公共基因数据库中进行检索,筛选出与该基因数据所对应的在线检索结果,然后发送给分析检索结果显示模块和临时数据存储输出模块;所述离线分析检索模块,与所述本地基因数据库存储模块相连接,用于并根据用户所输入的待检索的基因数据,在所述本地的基因数据库中进行检索,筛选出与该基因数据所对应的本地离线检索结果,然后发送给分析检索结果显示模块和临时数据存储输出模块;所述分析检索结果显示模块,分别与所述在线分析检索模块和离线分析检索模块相连接,用于实时显示所述在线分析检索模块和离线分析检索模块发来的对预设的国际公共基因数据库的在线检索结果和离线的本地检索结果;所述临时数据存储输出模块,分别与所述在线分析检索模块和离线分析检索模块相连接,用于实时存储所述在线分析检索模块和离线分析检索模块发来的对预设的国际公共基因数据库的在线检索结果和离线的本地检索结果。其中,所述生物信息分析平台还包括交叉检索模块,所述交叉检索模块由所述在线分析检索模块和离线分析检索模块一起组成。其中,所述在线分析检索模块和离线分析检索模块还同时与一个访问接口模块相连接,该访问接口模块用于控制所述在线分析检索模块和离线分析检索模块,分别对所述预设的国际公共基因数据库和所述本地的基因数据库中的数据进行交叉查询和迭代查询。其中,所述生物信息分析平台还包括基因数据压缩模块,所述基因数据压缩模块设置所述在线分析检索模块之间和离线分析检索模块这两个模块与所述临时数据存储输出模块之间;所述基因数据压缩模块,用于将对所述在线分析检索模块和离线分析检索模块发来的对预设的国际公共基因数据库的在线检索结果和离线的本地检索结果,执行预设的数据压缩操作,然后再发给所述临时数据存储输出模块进行数据存储。其中,所述生物信息分析平台还包括数据库交互控制模块,所述数据库交互控制模块分别与所述在线分析检索模块和离线分析检索模块相连接;所述数据库交互控制模块,用于实时检测所述在线分析检索模块和离线分析检索模块是否都停止检索操作,如果是,那么将所述在线分析检索模块和离线分析检索模块发来的对预设的国际公共基因数据库的在线检索结果和离线的本地检索结果,发送到所述国际公共基因数据库服务平台或者其他预设的任意一台云端服务器进行存储。由以上本专利技术提供的技术方案可见,与现有技术相比较,本专利技术提供了一种基于大数据的生物信息分析平台系统,其可以方便、可靠地对用户指定的生物的基因数据进行检索分析,及时获得该基因数据所对应的核酸序列和蛋白序列数据,方便用户开展进一步的研究,满足用户对基因数据进行快速检索的迫切要求,具有重大的生产实践意义。附图说明图1为本专利技术提供的一种基于大数据的生物信息分析平台系统的结构方框图;图2为本专利技术提供的一种基于大数据的生物信息分析平台系统一种实施例的结构方框图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面结合附图和实施方式对本专利技术作进一步的详细说明。图1为本专利技术提供的一种基于大数据的生物信息分析平台系统的结构方框图。参见图1,本专利技术提供的一种基于大数据的生物信息分析平台系统,包括国际公共基因数据库服务平台100和生物信息分析平台200,其中:国际公共基因数据库服务平台100,用于预先存储预设的国际公共基因数据库;生物信息分析平台200,与国际公共基因数据库服务平台100通过互联网相连接,用于预先存储本地的基因数据库,并根据用户所输入的待检索的基因数据,在所述本地的基因数据库和预设的国际公共基因数据库中进行检索,筛选出与该基因数据所对应的检索结果(例如包括对应的基因代码数据、核酸序列数据和/或蛋白序列数据),并实时进行显示。在本专利技术中,具体实现上,所述生物信息分析平台200与国际公共基因数据库服务平台100分别通过无线网络或有线网络连接上互联网,然后借助互联网实现相互数据连接。在本专利技术中,具体实现上,所述国际公共基因数据库服务平台100优选为超级计算机中心所搭建的云本文档来自技高网
...

【技术保护点】
1.一种基于大数据的生物信息分析平台系统,其特征在于,包括:国际公共基因数据库服务平台(100),用于预先存储预设的国际公共基因数据库;生物信息分析平台(200),与国际公共基因数据库服务平台(100)通过互联网相连接,用于预先存储本地的基因数据库,并根据用户所输入的待检索的基因数据,在所述本地的基因数据库和预设的国际公共基因数据库中进行检索,筛选出与该基因数据所对应的检索结果,并实时进行显示。

【技术特征摘要】
1.一种基于大数据的生物信息分析平台系统,其特征在于,包括:国际公共基因数据库服务平台(100),用于预先存储预设的国际公共基因数据库;生物信息分析平台(200),与国际公共基因数据库服务平台(100)通过互联网相连接,用于预先存储本地的基因数据库,并根据用户所输入的待检索的基因数据,在所述本地的基因数据库和预设的国际公共基因数据库中进行检索,筛选出与该基因数据所对应的检索结果,并实时进行显示。2.如权利要求1所述的基于大数据的生物信息分析平台系统,其特征在于,所述国际公共基因数据库服务平台(100)为超级计算机中心所搭建的云端服务器;所述生物信息分析平台(200)包括至少一台计算机。3.如权利要求1所述的基于大数据的生物信息分析平台系统,其特征在于,所述预设的国际公共基因数据库包括基因名称数据子库、基因代码数据子库、核酸序列数据子库和蛋白序列数据子库以及它们之间的对应关系;其中:所述基因名称数据子库包括在全球范围内预先采集的预设多个基因的名称数据;所述基因代码数据子库包括在全球范围内预先采集的预设多个基因代码数据;所述核酸序列数据子库包括在在全球范围内预先采集的预设多个核酸序列数据;所述蛋白序列数据子库包括在在全球范围内预先采集的预设多个蛋白序列数据。4.如权利要求3所述的基于大数据的生物信息分析平台系统,其特征在于,所述预设的国际公共基因数据库还包括医疗诊断案例数据子库,该医疗案例诊断数据子库包括预设的多个基因名称数据、预设多个医疗案例数据和预设的多个诊断方案以及它们之间的对应关系。5.如权利要求1所述的基于大数据的生物信息分析平台系统,其特征在于,所述用户所输入的待检索的基因数据包括基因名称和/或基因代码;所述本地的基因数据库包括在所述生物信息分析平台(200)上存储的、用户在本地所预先采集的预设多个基因名称数据、多个基因代码数据、多个核酸序列数据和多个蛋白序列数据以及它们之间的对应关系。6.如权利要求1至5中任一项所述的基于大数据的生物信息分析平台系统,其特征在于,所述生物信息分析平台(200)包括本地基因数据库存储模块(201)、在线分析检索模块(202)、离线分析检索模块(203)、分析检索结果显示模块(204)和临时数据存储输出模块(205),其中:所述本地基因数据库存储模块(201),用于预先存储所述本地的基因数据库;所述在线分析检索模块(202),与所述国际公共基因数据库服务平台(100)相连接,用于根据用户所输入的待检索的基因数据,在所述预设的国际公共基因数据库中进行检索,筛选出与该基因数据所对应的在线检索结果,然后发送给分析检索结果显示模块(204)和临时数据存储输出模块(205);所述离线分析检索模块(203),与所述本地基因数据库存...

【专利技术属性】
技术研发人员:张志鑫姜书浩潘旭华费腾闫智
申请(专利权)人:天津商业大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1