水稻全基因组假基因数据库构建方法技术

技术编号：1719069 阅读：374 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种基因序列数据处理方法，特别涉及水稻全基因组假基因数据库构建方法。包括将计算机系统中构建已知水稻全基因组序列的本地数据库；利用ＢＬＡＳＴ程序对前述数据库进行搜索比对，获取标准ＢＬＡＳＴ格式的比对结果；使用Ｂｉｏｐｅｒｌ中的ＳｅｑＩＯ模块分析比对结果，获取记录假基因和基因特征值数据的信息文件；去除冗余的假基因和基因数据；对假基因的筛选和分类；和以假基因对应的特征值作为数据项标识建立假基因的数据库。利用本发明专利技术提供的方法，可以对水稻乃至其他植物的假基因进行全基因组范围的搜索和分析，为研究和探索作物遗传、变异、进化提供分子证据。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种基因序列数据处理方法，更具体地说，本专利技术涉及一种。
技术介绍
假基因是基因组中丧失功能的DNA序列，换言之，是功能基因不具备编码能力的多拷贝，或是与功能基因相似的序列。假基因很好保留了数百万年前基因组中祖先基因的分子记录，被视为”基因化石”，因而，假基因在进化和比较基因组学中是重要的资源。应用假基因和基因比较体系，可以为研究物种亲缘关系和进化距离，分析假基因自身的进化趋势，探讨DNA突变的成因等提供新的洞察。国外美国耶鲁大学的Gerstein实验室在其网站上(http//www.pseudogene.org)对人、大鼠、酵母、美丽线虫和果蝇等5种模式生物提供了假基因的相关论文，但没有公布其相关研究的分析方法。水稻是重要的粮食作物，2002年已完成全基因组序列框架图测序，这在作物中尚属首次。目前国内外尚未完成水稻基因组的假基因分析和公布水稻全基因组的假基因数据。我们利用生物信息学方法，首创自编计算机程序，首次获得水稻全基因组假基因数据，率先完成水稻全基因组假基因数据库的构建。
技术实现思路
针对迄今国内外尚未获得水稻全基因组的假基因数据现状，本...

【技术保护点】
一种水稻全基因组假基因数据库构建方法，其特征在于，包括以下步骤：　　　　（１）在计算机系统中构建已知水稻全基因组序列的本地数据库；　　　　（２）利用ＢＬＡＳＴ程序对前述数据库进行搜索比对，获取标准ＢＬＡＳＴ格式的比对结果；　　　　（３）使用Ｂｉｏｐｅｒｌ中的ＳｅｑＩＯ模块分析比对结果，获取记录假基因和基因特征值数据的信息文件；　　　　（４）去除冗余的假基因和基因数据；　　　　（５）将相邻匹配的核苷酸序列连接，再用ＦＡＳＴＡ程序的Ｓｍｉｔｈ－Ｗａｔｅｒｍａｎ算法进行最优化匹配，完成对假基因的筛选和分类，其鉴别标准如下：　　　　①与编码已知蛋白质的序列相似度：ＢＬＡＳＴ　　Ｅ值＜１ｅ－１０，氨基酸...

【技术特征摘要】

【专利技术属性】
技术研发人员：薛庆中，黄志华，张忠华，
申请(专利权)人：浙江大学，
类型：发明
国别省市：86[中国|杭州]

全部详细技术资料下载我是这个专利的主人