鉴别DNA基因序列中编码区域与非编码区域的系统技术方案

技术编号:11132989 阅读:99 留言:0更新日期:2015-03-12 03:16
本发明专利技术提供一种鉴别DNA基因序列中编码区域与非编码区域的系统,计算一个DNA序列的DRT谱,通过其在k=3处与其他地方的谱值的比较来判别这个序列究竟是外显子还是内含子:DRT谱在k=3处的值高于其它地方的值,则为外显子;否则,为内含子。通过数值化的DNA序列的离散Ramanujan谱及其信噪比,用来区分蛋白质的编码区域与非编码区域,测试结果显示了本发明专利技术方法的可靠性。对比于傅里叶变换,离散Ramanujan谱的计算量更小,精度更高。

【技术实现步骤摘要】
鉴别DNA基因序列中编码区域与非编码区域的系统
本专利技术涉及一种鉴别DNA基因序列中编码区域与非编码区域的系统。
技术介绍
随着科学技术的进步,现代的生物学技术得到蓬勃发展。越来越多的数学方法和 信号处理技术被应用于研究生命科学领域,形成了生物信息学这一前沿学科。 现在大多使用离散傅里叶变换(DFT)来作为鉴别DNA基因序列中编码区域与非编 码区域的方法,该方法由于采用浮点运算,而计算机的计算精度是有限的,所以存在着计算 误差,并且浮点运算耗费很多的计算时间。 首先,现代计算机是用有限位存储实数的,这会导致舍入误差。对于离散傅里叶变

【技术保护点】
一种鉴别DNA基因序列中编码区域与非编码区域的系统,其特征在于,包括数据处理模块、显示模块、输入输出模块和存储模块;存储模块:存放DNA序列的片段的数据文件,并存放数据处理模块得到的结果文件;显示模块:对数据处理模块的过程及结果进行显示;输入输出模块:用于对数据处理模块进行数据输入或输出;数据处理模块:读取存储模块内的DNA序列的片段的数据文件,得到一个完整DNA序列,计算DNA序列经过离散Ramanujan变换后所得的DRT谱在3处的信噪比,进行编码区域与非编码区域的鉴别,具体为:计算一个DNA序列的DRT谱,DRT的谱为P(k)=|X(k)2,k=1,2,......,N,X(k)为DRT的Ramanujan系数;通过其在k=3处与其他地方的谱值的比较来判别这个序列究竟是外显子还是内含子:DRT谱在k=3处的值高于其它地方的值,则为外显子;否则,为内含子。

【技术特征摘要】
1. 一种鉴别DNA基因序列中编码区域与非编码区域的系统,其特征在于,包括数据处 理模块、显不模块、输入输出模块和存储模块; 存储模块:存放DNA序列的片段的数据文件,并存放数据处理模块得到的结果文件; 显示模块:对数据处理模块的过程及结果进行显示; 输入输出模块:用于对数据处理模块进行数据输入或输出; 数据处理模块:读取存储模块内的DNA序列的片段的数据文件,得到一个完整DNA序 列,计算DNA序列经过离散Ramanujan变换后所得的DRT谱在3处的信噪比,进行编码区域 与非编码区域的鉴别,具体为: 计算一个DNA序列的DRT谱,DRT的谱为 P(k) = |X(k)2,k= 1, 2,......,N,X(k)为DRT的Ramanujan系数; 通过其在k= 3处与其他地方的谱值的比较来判别这个序列究竟是外显子还是内含 子:DRT谱在k= 3处的值高于其它地方的值,则为外显子;否则,为内含子。2. 如权利要求1所述的鉴别DNA基因序列中编码区域与非编码区域的系统,其特 征在于,数据处理模块通过在k= 3处的信噪比来判断鉴别外显子与内含子,长度为N的DNA序列在k= 3处的信噪比为 其中,ABN为平均背景噪声,其定义为 ?3. 如权利要求2所述的鉴别DNA基因序列中编码区域与非编码区域的系统,其特征在 于,数据处理模块从存储模块中读取一个完整DNA序列的具体步骤为: 数据处理模块读取存储模块中DNA序列的片段的数据文件,获取文件长度并存储,设 当前位置为〇 ; 初始化RFT算法的各项参数;所待测序列的长度LengthOfTestSeq初始化为0,将一 维数组TheFinalResult清零,大小为DRTWIDTH,将三维数组AllTheXqArray清零,大小为 4*DRTWIDTH*DRTWIDTH; 从当前位置读取数据文件; 如读取的数据为'A',则设Layerlndex为0 ; 如读取的数据为'T',则设Layerlndex为1 ; 如读...

【专利技术属性】
技术研发人员:滑伟
申请(专利权)人:南京工程学院
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1