当前位置: 首页 > 专利查询>浙江大学专利>正文

水稻全基因组假基因数据库构建方法技术

技术编号:1719069 阅读:374 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基因序列数据处理方法,特别涉及水稻全基因组假基因数据库构建方法。包括将计算机系统中构建已知水稻全基因组序列的本地数据库;利用BLAST程序对前述数据库进行搜索比对,获取标准BLAST格式的比对结果;使用Bioperl中的SeqIO模块分析比对结果,获取记录假基因和基因特征值数据的信息文件;去除冗余的假基因和基因数据;对假基因的筛选和分类;和以假基因对应的特征值作为数据项标识建立假基因的数据库。利用本发明专利技术提供的方法,可以对水稻乃至其他植物的假基因进行全基因组范围的搜索和分析,为研究和探索作物遗传、变异、进化提供分子证据。

【技术实现步骤摘要】

本专利技术涉及一种基因序列数据处理方法,更具体地说,本专利技术涉及一种。
技术介绍
假基因是基因组中丧失功能的DNA序列,换言之,是功能基因不具备编码能力的多拷贝,或是与功能基因相似的序列。假基因很好保留了数百万年前基因组中祖先基因的分子记录,被视为”基因化石”,因而,假基因在进化和比较基因组学中是重要的资源。应用假基因和基因比较体系,可以为研究物种亲缘关系和进化距离,分析假基因自身的进化趋势,探讨DNA突变的成因等提供新的洞察。国外美国耶鲁大学的Gerstein实验室在其网站上(http//www.pseudogene.org)对人、大鼠、酵母、美丽线虫和果蝇等5种模式生物提供了假基因的相关论文,但没有公布其相关研究的分析方法。水稻是重要的粮食作物,2002年已完成全基因组序列框架图测序,这在作物中尚属首次。目前国内外尚未完成水稻基因组的假基因分析和公布水稻全基因组的假基因数据。我们利用生物信息学方法,首创自编计算机程序,首次获得水稻全基因组假基因数据,率先完成水稻全基因组假基因数据库的构建。
技术实现思路
针对迄今国内外尚未获得水稻全基因组的假基因数据现状,本专利技术首次提出从水本文档来自技高网...

【技术保护点】
一种水稻全基因组假基因数据库构建方法,其特征在于,包括以下步骤:    (1)在计算机系统中构建已知水稻全基因组序列的本地数据库;    (2)利用BLAST程序对前述数据库进行搜索比对,获取标准BLAST格式的比对结果;    (3)使用Bioperl中的SeqIO模块分析比对结果,获取记录假基因和基因特征值数据的信息文件;    (4)去除冗余的假基因和基因数据;    (5)将相邻匹配的核苷酸序列连接,再用FASTA程序的Smith-Waterman算法进行最优化匹配,完成对假基因的筛选和分类,其鉴别标准如下:    ①与编码已知蛋白质的序列相似度:BLAST  E值<1e-10,氨基酸...

【技术特征摘要】

【专利技术属性】
技术研发人员:薛庆中黄志华张忠华
申请(专利权)人:浙江大学
类型:发明
国别省市:86[中国|杭州]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利