【技术实现步骤摘要】
一种基于NCBI数据库的信息提取方法及其相关设备
本申请涉及生物信息
,具体涉及一种基于NCBI数据库的信息提取方法及其相关设备。
技术介绍
生物信息数据库是分子生物信息数据库的重要组成部分。生物信息数据库内容丰富、名目繁多、格式不一,分布在世界各地的信息中心、测序中心,以及和医学、生物学、农业等有关的研究机构和大学。从1992年开始,美国国家生物技术信息中心(NationalCenterforBiotechnologyInformation,NCBI)数据库承担起对于基因库(GeneBank)数据库的责任,并且与国际核酸序列数据库交换数据建立起更为完善的数据库。到目前为止,囊括全世界生物数据的NCBI数据库已经成为分子生物学家使用最为频繁的生物信息数据库。随着人们对基因遗传信息的了解和掌握,DNA测序已从人工操作发展到用自动测序仪进行全自动测序,测序的准确度、样品序列判读长度和速度有了极大的提高,测序的成本也大大降低。基因测序成本的降低的同时,生物数据库的数据量成指数增长。对于生物数据库的这些数据,研究者需要 ...
【技术保护点】
1.一种基于NCBI数据库的信息提取方法,其特征在于,包括:/n获取种属信息文件;/n对所述种属信息文件中相同物种的信息进行整合,形成信息数据库;/n获取用户输入的关键词;/n从所述信息数据库中获取与所述关键词对应的物种信息;/n从所述物种信息中提取NCBI序列号,得到NCBI序列号文件;/n根据所述NCBI序列号文件从NCBI数据库中获取与所述NCBI序列号对应的物种完备信息;/n获取目标数据类别;/n从所述物种完备信息中提取与所述目标数据类别对应的信息。/n
【技术特征摘要】
1.一种基于NCBI数据库的信息提取方法,其特征在于,包括:
获取种属信息文件;
对所述种属信息文件中相同物种的信息进行整合,形成信息数据库;
获取用户输入的关键词;
从所述信息数据库中获取与所述关键词对应的物种信息;
从所述物种信息中提取NCBI序列号,得到NCBI序列号文件;
根据所述NCBI序列号文件从NCBI数据库中获取与所述NCBI序列号对应的物种完备信息;
获取目标数据类别;
从所述物种完备信息中提取与所述目标数据类别对应的信息。
2.根据权利要求1所述的方法,其特征在于,所述获取种属信息文件,包括:
获取用户输入的物种名称;
根据所述物种名称从所述NCBI数据库中获取所述种属信息文件。
3.根据权利要求1所述的方法,其特征在于,所述获取种属信息文件之后,所述方法还包括:
确定所述种属信息文件的信息格式是否正确;
所述对所述种属信息文件中相同物种的信息进行整合,形成信息数据库,包括:
若所述种属信息文件的信息格式正确,则对所述种属信息文件中相同物种的信息进行整合,形成所述信息数据库。
4.根据权利要求1所述的方法,其特征在于,所述从所述信息数据库中获取与所述关键词对应的物种信息,包括:
根据所述关键词从所述信息数据库中进行比对,从所述信息数据库中获取包含所述关键词的物种信息。
5.根据权利要求1所述的方法,其特征在于,所述从所述物种信息中提取NCBI序列号,得到NCBI序列号文件,包括:
从所述物种信息中提取所述NCBI序列号;
根据所述NCBI序列号的提取顺序将所述NCBI序列号输入所述NC...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。