【技术实现步骤摘要】
本专利技术涉及一种基因序列数据处理方法,更具体地说,本专利技术涉及一种。
技术介绍
假基因是基因组中丧失功能的DNA序列,换言之,是功能基因不具备编码能力的多拷贝,或是与功能基因相似的序列。假基因很好保留了数百万年前基因组中祖先基因的分子记录,被视为”基因化石”,因而,假基因在进化和比较基因组学中是重要的资源。应用假基因和基因比较体系,可以为研究物种亲缘关系和进化距离,分析假基因自身的进化趋势,探讨DNA突变的成因等提供新的洞察。国外美国耶鲁大学的Gerstein实验室在其网站上(http//www.pseudogene.org)对人、大鼠、酵母、美丽线虫和果蝇等5种模式生物提供了假基因的相关论文,但没有公布其相关研究的分析方法。水稻是重要的粮食作物,2002年已完成全基因组序列框架图测序,这在作物中尚属首次。目前国内外尚未完成水稻基因组的假基因分析和公布水稻全基因组的假基因数据。我们利用生物信息学方法,首创自编计算机程序,首次获得水稻全基因组假基因数据,率先完成水稻全基因组假基因数据库的构建。
技术实现思路
针对迄今国内外尚未获得水稻全基因组的假基因数据现状,本 ...
【技术保护点】
一种水稻全基因组假基因数据库构建方法,其特征在于,包括以下步骤: (1)在计算机系统中构建已知水稻全基因组序列的本地数据库; (2)利用BLAST程序对前述数据库进行搜索比对,获取标准BLAST格式的比对结果; (3)使用Bioperl中的SeqIO模块分析比对结果,获取记录假基因和基因特征值数据的信息文件; (4)去除冗余的假基因和基因数据; (5)将相邻匹配的核苷酸序列连接,再用FASTA程序的Smith-Waterman算法进行最优化匹配,完成对假基因的筛选和分类,其鉴别标准如下: ①与编码已知蛋白质的序列相似度:BLAST E值 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:薛庆中,黄志华,张忠华,
申请(专利权)人:浙江大学,
类型:发明
国别省市:86[中国|杭州]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。