一种基于模拟退火算法的假结RNA结构预测方法技术

技术编号：35735536 阅读：13 留言：0更新日期：2022-11-26 18:37

本发明专利技术涉及一种基于模拟退火算法的假结RNA结构预测方法，所述假结RNA结构预测方法涉及RNA二级结构及其自由能，所述RNA二级结构包含一种梯子结构，所述RNA二级结构的自由能能根据近邻热力学参数计算出来，随着RNA序列长度的增加，二级结构候选解的数量也呈指数量级增加。本发明专利技术能有效得到问题最优解，预测效率较高，收敛性较好，弥补了现有现有方法的缺陷。弥补了现有现有方法的缺陷。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于模拟退火算法的假结RNA结构预测方法

[0001]本专利技术涉及生物工程
，特别涉及一种一种基于模拟退火算法的假结RNA结构预测方法。

技术介绍

[0002]RNA(脱氧核糖核酸)是生物系统内最为重要的分子之一，它在生物体内具备多种功能。在最初的生物中心法则中，RNA被认为在表达遗传信息时作为蛋白质翻译，发挥了一部分短暂的作用。后来的研究发现，RNA除了翻译蛋白质，还具有多种其它功能，如调控基因表达、转运RNA、催化肽链形成和指导蛋白质合成等。随着科研工作者对RNA研究的逐步深入，RNA带给人们的形象也随之发生了变化。RNA被认为不仅仅是DNA到蛋白质之间的一种信息传递中介，它逐渐由功能单一的简单线性碱基序列，演变成种类多样、结构复杂、功能特异的生命核心物，同时RNA在中心法则中，取得了与DNA和蛋白质同样重要的地位。在RNA结构预测算法的研究上，近些年来虽然衍生了许多新的算法，但是从根本上而言，还是在原先经典算法的基础上加以改进的结果。因此从预测效率的角度来看其时间复杂度和空间复杂度并未取得大的改进。目前RNA二级结构预测的算法主要有比较序列分析和热力学最小自由能两种，由于比较序列分析法需要知道多个与之同源的序列及相应的二级结构信息因此相对于后者而言发展缓慢。当仅有一个RNA序列或者序列为差异很小的RNA小家族时，比较序列分析方法根本不适用。而后一种方法依据碱基配对和自由能分配规则，搜索有最小自由能量的二级结构。其基本假设是具有最小自由能量的RNA二级结构是最稳定的，并且最接近真实的RNA生物分子结构

【技术保护点】

【技术特征摘要】
1.一种基于模拟退火算法的假结RNA结构预测方法，所述假结RNA结构预测方法涉及RNA二级结构及其自由能，所述RNA二级结构包含一种梯子结构，所述RNA二级结构的自由能能根据近邻热力学参数计算出来，随着RNA序列长度的增加，二级结构候选解的数量也呈指数量级增加，所述梯子结构指的是一组依次连续匹配的核苷酸，形成一种梯子状的结构，对于带假结RNA二级结构的预测用到生物信息学中的评价参数：敏感性SE和特异性SP，预测结果中，敏感性指的是正确碱基数占实际碱基数的百分比，而特异性是指在预测结果的所有碱基中正确预测的碱基所占百分比，马休兹相互作用系数MCC是通过比对天然结构与预测结构而计算出来的值，它兼顾了敏感性与特异性，最小值为
‑
1，表示预测结构与天然结构碱基配对相似度为0；最大值为1，表示预测结构与天然结构相似度为1；其特征是：对假结RNA二级结构进行预测，建立一个多目标最优化模型P：(P)其中：Ω是以茎区Pair为变量的决策空间，X是一个或则多个茎区组成的茎区集合Pairs，i表示RNA序列第i个碱基的序列，x
i
表示该碱基的配对号，在算法中被看作一个个体，f1(X)用于评价RNA二级结构中茎区结构的数量，StemGroup为茎区数量，用来评价RNA二级结构配对碱基对的数量，即总的碱基配对数，Q
ij
(X)＝M(class(x
i
),class(x
j
))+P(distance(x
i
,x
j
))+K是每个碱基对的匹配得分，其中Class()是类型运算符，输出该碱基类型；Distance()是距离运算符，输出这两个碱基的相对距离，K是常系数，M(class(x
i
),class(x
j
))是匹配类型得分，P(distance(x
i
,x
j
))是匹配距离得分；用于刻画马休兹相互作用系数，具体衡量公式如下：其中，TN表示正确预测的不配对的碱基的个数；TP表示预测结果...

【专利技术属性】
技术研发人员：宋加磊，广心升，刘凤永，
申请(专利权)人：青岛超蓝生物信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人