基于CPLD碱基片段编码和蚁群算法的RNA序列二级结构预测方法技术

技术编号：8215822 阅读：282 留言：0更新日期：2013-01-17 14:45

基于CPLD碱基片段编码和蚁群算法的RNA序列二级结构预测方法属生物信息学研究领域，本发明专利技术使用CPLD按照关联表将RNA序列重新编码。根据编码表和编码关联表中的对应值得到相应的编码序列，由完全匹配表和不完全匹配表，并通过“向右延伸”的策略剔除冗余茎区，得到所有可能的茎区集合，然后给出蚁群算法中二维的启发式信息、初始茎区和下一茎区的选取规则，以及信息素更新策略，构造所有可能的茎区集合的相容子集，最终得到自由能最小的二级结构；本发明专利技术能快速、准确、有效地预测不包含假结的RNA序列的二级结构，并将所得结果以括号法模式输出，在评判RNA序列二级结构预测优劣的两个参数方面，即敏感性和特异性，均优于目前主流预测技术。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属生物信息学研究领域。
技术介绍
研究表明，RNA在基因调控中起到了非常重要的作用，而RNA的功能与结构是密切相关的，因此想要了解RNA序列的功能特性应先从其结构入手。目前已经获得大量的RNA序列一级结构信息，但一级结构包含的有用信息比较少，因此越来越多的研究人员开始关注RNA序列的二级结构和三级结构，但用生物实验的方法来确定RNA的三级结构花费高，难度大，而且此方法并不是对所有分子都有效。由于RNA序列的三级结构很难通过一级结构直接得到，而直接面向三级结构的理论预测，进展也不是很顺利，因此预测二级结构是获取三级结构的必经之路。因此将软件模拟和预测得到的RNA 二级结构，与基于ARM体系的嵌入式系统结合，形成基于嵌入式的RNA序列二级结构预测方法，从而可以得到一种低成本、高效率且结果具有一定可信度的方式，成为生物信息学的重要手段。
技术实现思路
本专利技术的目的在于提供一种能快速、准确、有效地预测RNA序列二级结构(不含假结)并将所得结果以括号法模式输出的方法。该方法所需要的硬件设备包括处理器、内存、主板、本专利技术包括下列步骤I. RNA序列的预处理，具体包括下列步骤I)将 RNA 序列输入 CPLD。2) CPLD通过编码关联表将RNA序列以编码的形式存储于SRAM中，编码关联表存在于系统中，并可实时调用，它将所获取的RNA序列，转换为易于系统分析的数字模式。2.进行RNA序列二级结构预测，具体包括下列步骤I)根据匹配表得到长度为η的茎区集合，匹配表存在于系统中，并可实时调用，它将已转换的RNA序列信息，组合为长度为η的茎区集合。2)对所有长...

【技术保护点】
一种基于CPLD碱基片段编码和蚁群算法的RNA序列二级结构预测方法，其特征在于包括下列步骤：1)进行RNA序列预处理；2)进行RNA序列二级结构预测。

【技术特征摘要】

【专利技术属性】
技术研发人员：刘元宁，余军，张浩，段云娜，张晓旭，胡名刚，
申请(专利权)人：吉林大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人