一种用于检测动物类群线粒体基因组重排的方法技术

技术编号:22320310 阅读:60 留言:0更新日期:2019-10-19 10:00
本发明专利技术公开了关于用于检测动物类群线粒体基因组重排的方法。属于分子生物学和生物信息学领域。依据本发明专利技术中关于动物类群线粒体基因组重排情况所提出的想法和实施方案,通过计算基因的重排累加值CSR和相对重排频率值rCSR,我们可以量化动物类群中线粒体基因组每个基因的重排情况,并进一步获得某一研究类群的重排保守区段和重排高频区段的位置,还可以对不同类群中的相同的基因的重排频率进行横向比较。

A method for detecting mitochondrial genome rearrangement in animal groups

【技术实现步骤摘要】
一种用于检测动物类群线粒体基因组重排的方法一.专利
本专利技术属于分子生物学和生物信息学领域,更具体地说,涉及一种用于检测动物类群线粒体基因组重排的方法。二.
技术介绍
在生物体内,线粒体作为一种半自主性细胞器,参与能量转换等生物体中众多必须的生物过程,而且其基因组组成保守。因线粒体基因组的基因序列进化速率适中,一直是分子系统学研究的重要分子标记。虽然动物线粒体基因组组成十分保守,但随着线粒体基因组被完全测序的物种数目越来越多,陆续在不少动物类群中发现了存在线粒体基因组的基因重排现象(蛙类动物尤为突出)。基因重组包括基因缺失、基因重复和基因组重排现象(loss,duplicationandrearrangement),因为重排在重组现象中比重较大,本文统称它们为基因重排。文献显示一些学者已经利用比较基因组学的方法研究了线粒体基因组重排,寻找重排规律,并提出了脊椎动物基因组重排发生几种可能机制如:串联重复-丢失模型(duplication-randomloss)和线粒体基因组内重组(intramitochondrialrecombination)等。然而,先前的相关研究存在一定的不足:(1)这些研究不能明确的表示出动物类群线粒体基因组每个基因的重排情况;(2)不能具体确定该动物类群在整个线粒体基因组中的重排高频区段和重排保守区段;(3)在此基础上更无法对不同动物类群的线粒体基因重排进行横向比较,进而探究重排的系统演化与机制。为了弥补上述缺陷,本申请致力于对动物类群线粒体基因组开展基因重排的深入研究,量化了线粒体基因组中单个基因的重排角色,找出了基因重排的高频和保守区段,并可以对不同动物类群进行横向比较,为线粒体基因组重排发生的理解和机制探究提供参考。三.
技术实现思路
1.专利技术要解决的问题针对先前研究的不足之处,有以下3个问题亟待解决:第一,这些研究不能明确的表示出动物类群线粒体基因组每个基因的重排情况;第二,之前的研究都不能具体准确定位整个线粒体全序列中基因重排高频区段或重排保守区段;第三,无法对不同动物类群的线粒体基因重排进行横向比较,只能局限于单个动物类群。而利用本专利技术申请提供的检测动物类群线粒体基因组基因重排的方法,能够科学准确地获得动物类群线粒体基因重排的情况,对今后线粒体基因重排的研究和机制探索提供基础参考。2.技术方案本专利技术申请提出了计算出针对特定动物类群的线粒体基因组中每个单一基因重排情况的方法,具体实施方案如下:(1)首先获取数据:从线粒体基因组公共数据库中获取不同类型物种的所有线粒体基因组信息,如在Genebank数据库(https://www.ncbi.nlm.nih.gov/nuccore)中下载某一特定动物线粒体基因组的全序列数据,然后对数据进行处理:利用编程语言Perl语言、R语言分析提取相关数据,得到线粒体基因组中每一个基因的位置信息,进而获取每条基因组上的所有基因的位置排序,为后期基于该方法的计算做准备。(2)利用本专利技术提出的新算法,具体公式如下:其中CSR值表示线粒体基因组中A基因的重排频率累加值(简称重排频率累加值),Xn表示该基因在其中一个物种中的重排值,n是研究的特定类群所有物种数,rCSRA表示A基因的相对重排频率值(如图1所示)。(3)针对特定类群,选定一个特定的物种的线粒体基因重排为基准(参照的基因排列顺序),如以典型的脊椎动物的基因排序为基准,如一个科、目、亦或是更高的分类阶元,应用我们提出的公式获得该类群的所有基因的rCSR值(可以参看图1)。针对不同重排情况,计算“重排频率值”Xn的方案具体如下:①如果以典型的脊椎动物的基因排序为基准,首先假定给每个基因0分分值。相对于基准排序,如果该基因左右两侧相邻基因不变,则不给该基因加分;②如果左侧或是右侧相邻基因发生了改变,则给该基因加1分;③如果被考察基因出现缺失,重复,或是其两侧相邻的基因均发生了改变,则给该基因加2分;对类群中每条线粒体基因组中的每个基因进行上述情况扫描,从而就可以获得该类群线粒体基因组中各个基因的重排频率值,并计算出CSR值和rCSR值。(4)通过rCSR值计算公式可以看出rCSR值的取值范围在0到1之间,越接近0,则该基因重排情况越保守,越接近于1,则该基因的重排频率越高。基于上述特征,结合研究类群的保守性情况,研究者可以自定义出基因rCSR值小于某一个阈值为重排保守基因,大于某一阈值为高频重排区段。这样一来,研究者就可以找出如果基因组某一区段中的连续基因具有上述基因特征就可以扫描该动物类群的线粒体基因重排的高频及保守区段的位置。另外,通过上述方法还可以对不同动物类群中相同基因的重排情况进行横向比较。3.附图说明图1为假设存在单个基因A,其出现于不同基因组中的重排值计算(rCSR值计算)示意图。4.具体实施案例与有益结论依据本专利技术中所提出的方法,本专利技术进行了两栖动物线粒体基因重排的研究,实验步骤如下:(1)从NCBIOrganelleGenomeResource网站下载两栖动物线粒体基因组全序列数据,共计230个物种信息(2016年12月下载)。(2)利用Perl语言和R语言对两栖动物线粒体基因组中每一个基因的位置信息进行分析提取,获取每条基因组上的所有的基因的位置信息,以典型的脊椎动物线粒体基因组排布为基准基因排序(如图1最左边的所示)。(3)利用本专利技术申请书中提出的新算法,计算出单个基因(如图1中的A基因)的CSR值和rCSR值。再对各个基因的rCSR值进行分析研究。如图1所示,假设有6条线粒体基因组的基因排序信息,A基因位置如图1的中间位置所示,A基因如果与脊椎动物A基因的左右邻居基因的排布顺序不变,A的CSR值就加0分(图1中部第1行所示);如果左边或是右边发生了单侧的改变,如图中的中间第2,3行所示,就给A基因加1分;如两侧都改变,或是A基因发生了串联重复或是缺失(图1中间的第4-6行所示),CSR值就分别加2分。这样一来总的分值就可以累加出来,再用此值除于可能的最大分值2n,就获得了A基因的rCSR值,如图1右侧所示。(4)有益结论,在对两栖动物线粒体基因组组成中的37个基因和CR区(Control-Region区)的基因重排情况进行CSR值和rCSR值计算,获得的新发现如下:①在两栖动物类群线粒体基因组内,ND5基因是蛋白质编码基因中rCSR值最高的基因,即重排频率最高的基因;COX1、COX2和COX3等基因rCSR值为0,说明它们与典型的脊椎动物线粒体基因组排布相同,属于基因组中重排最为保守的基因群。②如果定义rCSR值小于0.05为保守基因,rCSR值大于0.2则为高频基因;本专利发现:两栖动物线粒体基因组中重排最为保守的2个基因区段分别为ATP6-COX3-G-ND3-R-ND4L段和位于COX1和COX2基因间的S-D段;而高频重排区段为ND5-ND6-CR区段。③本例可以进一步横向分析发现:其一,与其他脊椎动物线粒体基因组重排相比,两栖动物线粒体基因组重排目前没有出现基因倒置现象;其二,tRNA基因在两栖动物类群中仍然是线粒体基因组重排的主要因素,出现连续3个或以上的tRNA基因区域易于发生基因重排;其三,通过与已有文献报道相比发现,CR区和OL区(轻连复制本文档来自技高网
...

【技术保护点】
1.一种用于检测动物类群线粒体基因组重排的方法,其特征在于:提出了一种能够量化动物类群中线粒体基因组每个基因的重排情况的新算法,其具体公式如下:

【技术特征摘要】
1.一种用于检测动物类群线粒体基因组重排的方法,其特征在于:提出了一种能够量化动物类群中线粒体基因组每个基因的重排情况的新算法,其具体公式如下:其中CSR值是重排累加值,表示A基因的重排累加值,Xn表示该基因在其中一个物种中的重排频率值,n是研究类群的所有物种数,rCSR是相对重排频率值,rCSRA表示A基因的相对重排频率值;其中,在选定参考基因排序后,重排频率值Xn的计算方法如下:①相对于基准排序,如果该基因左右两侧相邻基因不变,则不给该基因加分;②如果左侧或是右侧相邻基因发生了改变,则给该基因加1分;③如果被考察基因出现缺失,串联重复或是其两侧相邻的基因均发生了改变,则给该基因加2分。2.基于权利要求1所述的一种用于检测动物类群线粒体基因组重排的方法,其特征在于:rCSR值可以量化动物类群中线粒体基因组每个基因的重排情况,rCSR的取值范围在0到...

【专利技术属性】
技术研发人员:张际峰孙玥芮存芳冯飞李慧杰熊伟
申请(专利权)人:淮南师范学院
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1