【技术实现步骤摘要】
本专利技术涉及可以应用于DNA分析的基因序列3D表示方法。
技术介绍
近年来,基因序列的图形表示广泛应用于基因序列的可视化,分类和比对等方面.该方法的主要思想是将基因序列转换为不同维数的几何图形.最常见的图形是2D(平面)图形和3D(空间)图形。1983年,Hamori和Ruskin首先提出基因序列的3D表示,后来,人们提出越来越多的曲线来表示基因序列.为了得到不同基因序列的相似性特征,人们利用曲线得到一些高维矩阵或者向量来简化生物序列比对.一般来说,基因序列的图形表示理论可以分成两个部分:基因的图形表示和基于图形特征的相似性度量。在基因序列的不同曲线表示中,张春霆院士于1991年提出的Z-曲线是用来分析基因序列的典型曲线,Z-曲线是一条3D曲线,每一个DNA序列都可以用Z-曲线来唯一表示.在2014年,张春霆和张任撰文给出Z-曲线的一个概述,并给出它们的一些应用:Z-曲线是获取DNA信息的一类典型图形表示并可以应用在DNA序列分析的诸多领域.Z-曲线上包含了DNA序列所携带的所有信息。然而,目前缺乏一种能够用于DNA序列3D表示的曲率序列和饶率序列,缺乏相关序列应用于DNA分析的处理方法。
技术实现思路
本专利技术所要解决的技术问题是实现一种将DNA序列转化为3D表示的曲率序列和饶率序列,这两个数值序列包含了DNA序列上3D表示的所有本质特征,可以应用于DNA分析方面。为了实现上述目的,本专利技术采用的技术方案为:基因序列的可视化处理方法:步骤1、获得待比对的DNA曲线的曲率序列和饶率序列;步骤2、利用Z-曲线表示待比对的DNA曲线的曲率序列和饶率序列;步 ...
【技术保护点】
基因序列的可视化处理方法,其特征在于:步骤1、获得待比对的DNA曲线的曲率序列和饶率序列;步骤2、利用Z‑曲线表示待比对的DNA曲线的曲率序列和饶率序列;步骤3、获得待比对的DNA之间两个曲率序列中相同项的个数,以及两个饶率序列中相同项的个数。
【技术特征摘要】
1.基因序列的可视化处理方法,其特征在于:步骤1、获得待比对的DNA曲线的曲率序列和饶率序列;步骤2、利用Z-曲线表示待比对的DNA曲线的曲率序列和饶率序列;步骤3、获得待比对的DNA之间两个曲率序列中相同项的个数,以及两个饶率序列中相同项的个数。2.根据权利要求1所述的基因序列的可视化处理方法,其特征在于,所述步骤1中曲率序列和饶率序列的获得方法:曲率序列获得方法:设G=g1g2…gN是长度为N的DNA序列,Pi是G的曲线表示L中gi对应的点,则曲线L在点Pi处的曲率定义为κi,DNA序列G表示曲线L的曲率序列定义为则:在三角形PiPjPk中,i,j,k是相邻的三个正整数,其中j=i+1,k=j+1,令rijk=rij+rik+rjk为三角形PiPjPk的三边长之和,Sijk为三角形PiPjPk的面积,为三角形PiPjPk的内切圆半径,则点Pi处的曲率为κi=2Sijk/rijk;饶率序列获得方法:设G=g1g2…gN是长度为N的DNA序列,Pi是G的曲线表示L中gi对应的点,则曲线L在点Pi处的饶率定义为τi,DNA序列G的表示曲线L的饶率序列定义为则:在四面体PhPiPjPk中,h,i,j,k是四个连续正整数,其中i=h+1,j=i+1,k=j+1.令Vh为四面体PhPiPjPk的体积,Shij,Shjk,Shik,Sijk分别表示三角形PhPiPj,PiPjPk,PhPiPk,PiPjPk的面积,为四面体PhPiPjPk内接球半径且其中则点Pi处的饶率为当òh>0时,τh的值为正;当òh<0时,τh的值为负;当DNA序列的表示曲线,则四个碱基A,C,T,G的关系矩阵:M=rAArACrATrAGrCArCCrCTrCGrTArTCrTTrTGrGArGCrGTrGG,]]>通过所述曲率序列获得方法和饶率序列获得方法可获得DNA表示曲线的曲率序列和饶率序列。3.根据权利要求2所述的基因序列的可视化处理方法,其特征在于,所述步骤2中利用Z-曲线表示待比对的DNA曲线的曲率序列和饶率序列的方法:Z-曲线的三个坐标公式为xn=2(An+Gn)-nyn=2(An+Cn)-nzn=2(An+T...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。