The invention discloses a method for determining pseudogenes in tree genome, which comprises the following steps: obtaining the basic biological information of the tree to be tested, the basic biological information including the protein sequence, the genomic sequence and the chromosome position of the functional gene; and identifying the pseudogenes of the tree to be tested by the Pseudopipe method In order to obtain the original pseudogene data, the original pseudogene data is deleted repeatedly to obtain the candidate pseudogene data, and the candidate pseudogene data is deleted pseudopositive according to the physical location information of the functional gene and pseudogene on the chromosome to determine the candidate pseudogene data. Pseudogenes in tree genome. This method can effectively identify pseudogenes in tree genome, and it is simple to operate, easy to grasp, requires short time, does not need additional supporting conditions, low cost, and the results obtained are accurate, reliable and suitable for popularization.
【技术实现步骤摘要】
确定林木基因组中假基因的方法
本专利技术涉及生物信息学和基因组学
,具体而言,涉及确定林木基因组中假基因的方法。
技术介绍
假基因(Pseudogene)具有与功能基因相似的序列,但由于在长期的进化过程中累积了大量突变(诸如移码突变、终止子提前或其它功能缺失)以致失去了正常的功能。假基因的鉴定和注释意义重大:(1)假基因很好地保留了祖先基因的分子记录,可为研究基因组动态变化,揭示基因复制与突变等事件的年代以及频率等提供重要线索;(2)假基因提供了一系列近期进化事件的证据,例如灵长类嗅觉逐步演化的过程等;(3)针对假基因群体的相关分析有利于解析其产生的生物学机制及其在生物进化过程中的改变趋势,例如人类基因组假基因的注释结果显示在灵长类物种形成过程中曾暴发过一次基因的逆转录活动;(4)一些假基因可能产生具有功能的RNAs,并可通过多种机制调控其它基因的表达;(5)嵌合在基因组中的假基因,与亲本基因具有高度同源性,容易彼此混淆,假基因的确定有利于功能基因的正确鉴定。因此假基因的鉴定对于研究物种的起源、遗传和进化乃至基因的生物学功能均具有重要意义。然而,目前确定假基因尤其是林木的假基因的方法仍有待改进
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题之一。为此,本专利技术的一个目的在于提出一种能够准确有效地确定林木基因组中的假基因的方法。需要说明的是,本专利技术是基于专利技术人的下列发现和工作而完成的:目前鉴定假基因的主要生物信息方法有3种:PseudoPipe、RetroFinder和Pseudo-Finder。其中,PseudoPipe是目前最常 ...
【技术保护点】
1.一种确定林木基因组中假基因的方法,其特征在于,包括以下步骤:获得待测林木的基础生物信息,所述基础生物信息包括蛋白质序列、基因组序列和功能基因的染色体位置;基于所述待测林木的基础生物信息,利用Pseudopipe法对所述待测林木进行假基因鉴定处理,以便获得原始假基因数据;对所述原始假基因数据进行重复项删除处理,以便获得候选假基因数据;以及根据功能基因和假基因在染色体上的物理位置信息,对所述候选假基因数据进行去除假阳性处理,以便确定所述待测林木基因组中的假基因,其中,利用Pseudopipe法对所述林木进行假基因鉴定处理,是通过遵循如下的参数设置和鉴定指标实现的:(1)假基因和其亲本基因两者的氨基酸序列一致性>35%;(2)BLAST E值低于1E‑100;以及(3)假基因应覆盖其亲本基因编码序列的70%以上。
【技术特征摘要】
1.一种确定林木基因组中假基因的方法,其特征在于,包括以下步骤:获得待测林木的基础生物信息,所述基础生物信息包括蛋白质序列、基因组序列和功能基因的染色体位置;基于所述待测林木的基础生物信息,利用Pseudopipe法对所述待测林木进行假基因鉴定处理,以便获得原始假基因数据;对所述原始假基因数据进行重复项删除处理,以便获得候选假基因数据;以及根据功能基因和假基因在染色体上的物理位置信息,对所述候选假基因数据进行去除假阳性处理,以便确定所述待测林木基因组中的假基因,其中,利用Pseudopipe法对所述林木进行假基因鉴定处理,是通过遵循如下的参数设置和鉴定指标实现的:(...
【专利技术属性】
技术研发人员:张德强,李英,谢剑波,
申请(专利权)人:北京林业大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。