当前位置: 首页 > 专利查询>胡嘉欣专利>正文

一种基于NCBI数据库的信息提取方法及其相关设备技术

技术编号:25839897 阅读:34 留言:0更新日期:2020-10-02 14:19
本申请实施例公开了一种基于NCBI数据库的信息提取方法及其相关设备,包括:获取种属信息文件,形成信息数据库;获取用户输入的关键词;从信息数据库中获取与关键词对应的物种信息;从物种信息中提取NCBI序列号,得到NCBI序列号文件;根据NCBI序列号文件从NCBI数据库中获取与NCBI序列号对应的物种完备信息;从物种完备信息中提取与目标数据类别对应的信息。本方案装置能够自动批量提取和筛选出NCBI序列号,并根据该序列号从NCBI数据库中获取所需的物种完备信息,根据目标数据类别从物种完备信息中获取与目标数据类别对应的信息,该方案自动从NCBI数据库中提取所需的数据,可以提高信息提取的效率。

【技术实现步骤摘要】
一种基于NCBI数据库的信息提取方法及其相关设备
本申请涉及生物信息
,具体涉及一种基于NCBI数据库的信息提取方法及其相关设备。
技术介绍
生物信息数据库是分子生物信息数据库的重要组成部分。生物信息数据库内容丰富、名目繁多、格式不一,分布在世界各地的信息中心、测序中心,以及和医学、生物学、农业等有关的研究机构和大学。从1992年开始,美国国家生物技术信息中心(NationalCenterforBiotechnologyInformation,NCBI)数据库承担起对于基因库(GeneBank)数据库的责任,并且与国际核酸序列数据库交换数据建立起更为完善的数据库。到目前为止,囊括全世界生物数据的NCBI数据库已经成为分子生物学家使用最为频繁的生物信息数据库。随着人们对基因遗传信息的了解和掌握,DNA测序已从人工操作发展到用自动测序仪进行全自动测序,测序的准确度、样品序列判读长度和速度有了极大的提高,测序的成本也大大降低。基因测序成本的降低的同时,生物数据库的数据量成指数增长。对于生物数据库的这些数据,研究者需要进行筛选和鉴别,以提本文档来自技高网...

【技术保护点】
1.一种基于NCBI数据库的信息提取方法,其特征在于,包括:/n获取种属信息文件;/n对所述种属信息文件中相同物种的信息进行整合,形成信息数据库;/n获取用户输入的关键词;/n从所述信息数据库中获取与所述关键词对应的物种信息;/n从所述物种信息中提取NCBI序列号,得到NCBI序列号文件;/n根据所述NCBI序列号文件从NCBI数据库中获取与所述NCBI序列号对应的物种完备信息;/n获取目标数据类别;/n从所述物种完备信息中提取与所述目标数据类别对应的信息。/n

【技术特征摘要】
1.一种基于NCBI数据库的信息提取方法,其特征在于,包括:
获取种属信息文件;
对所述种属信息文件中相同物种的信息进行整合,形成信息数据库;
获取用户输入的关键词;
从所述信息数据库中获取与所述关键词对应的物种信息;
从所述物种信息中提取NCBI序列号,得到NCBI序列号文件;
根据所述NCBI序列号文件从NCBI数据库中获取与所述NCBI序列号对应的物种完备信息;
获取目标数据类别;
从所述物种完备信息中提取与所述目标数据类别对应的信息。


2.根据权利要求1所述的方法,其特征在于,所述获取种属信息文件,包括:
获取用户输入的物种名称;
根据所述物种名称从所述NCBI数据库中获取所述种属信息文件。


3.根据权利要求1所述的方法,其特征在于,所述获取种属信息文件之后,所述方法还包括:
确定所述种属信息文件的信息格式是否正确;
所述对所述种属信息文件中相同物种的信息进行整合,形成信息数据库,包括:
若所述种属信息文件的信息格式正确,则对所述种属信息文件中相同物种的信息进行整合,形成所述信息数据库。


4.根据权利要求1所述的方法,其特征在于,所述从所述信息数据库中获取与所述关键词对应的物种信息,包括:
根据所述关键词从所述信息数据库中进行比对,从所述信息数据库中获取包含所述关键词的物种信息。


5.根据权利要求1所述的方法,其特征在于,所述从所述物种信息中提取NCBI序列号,得到NCBI序列号文件,包括:
从所述物种信息中提取所述NCBI序列号;
根据所述NCBI序列号的提取顺序将所述NCBI序列号输入所述NC...

【专利技术属性】
技术研发人员:胡嘉欣董学超
申请(专利权)人:胡嘉欣
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1