基于碱基嵌入和直接相关分析的核糖核酸接触图预测方法技术

技术编号:24253175 阅读:246 留言:0更新日期:2020-05-23 00:26
本发明专利技术公开了一种基于碱基嵌入和直接相关分析的核糖核酸接触图预测方法,包括:步骤1、碱基的嵌入法表示;步骤2、在嵌入空间构建直接相关模型;步骤3、基于自适应随机梯度下降的模型优化;步骤4、接触图提取及后处理。该方法是现有基于直接相关分析方法的核糖核酸接触图预测方法的拓展,具有灵活性和高效性。

Prediction of RNA contact map based on base insertion and direct correlation analysis

【技术实现步骤摘要】
基于碱基嵌入和直接相关分析的核糖核酸接触图预测方法
本专利技术涉及生物信息学中预测核糖核酸碱基之间接触预测领域,具体地说,是一种基于嵌入技术和直接相关分析的具有高精度的高效蛋核糖核酸接触预测方法。
技术介绍
核糖核酸(RNA)是生物生命系统中重要的组成部分之一。在中心法则中承担着重要作用。RNA在生物体内行使多种功能,例如,HIV病毒的遗传信息就是由RNA而非DNA携带。目前,国内外学者在生物信息学领域内对RNA的功能和结构的研究正在逐渐升温。一般来说,同蛋白质类似,RNA的序列决定了RNA的结构,而RNA的结构跟其功能也具有密切的关系。因此,越来越多的的研究人员开始关注RNA的二级结构和三级结构的预测。目前,具有一级序列的信息的RNA已经大量获得,但是,通过实验方法测定其三维空间结构往往花费高,难度大。这就导致了已知序列信息和结构信息之间形成了巨大的鸿沟。通过生物信息学的手段对已知序列信息的RNA进行三维结构预测成为非常紧迫的任务。现在一般方法都是通过统计物理学方法基于序列对RNA的二级结构进行预测,再通过二级结构对其三维结构本文档来自技高网...

【技术保护点】
1.一种基于碱基嵌入和直接相关分析的核糖核酸接触图预测方法,其特征在于,包括以下步骤:/n步骤1、碱基的嵌入法表示:对于给定核糖核酸多序列联配中的每条序列的每一个碱基,先通过多项式分布进行表示,再与一个可训练的嵌入参数矩阵进行相乘,得到对应的向量表示;/n步骤2、基于伪极大似然的直接相关模型构建:构建耦合参数矩阵,对于核糖核酸多序列联配中的每个位置,基于所有不包括该位置的其他位置的嵌入法的向量表示和耦合参数相乘,从而得到该位置概率分布的预测;该核糖核酸序列的概率近似表示为所有位置预测的概率分布的乘积;/n步骤3、使用自适应随机梯度下降方法优化模型:损失函数为预测的核糖核酸序列的概率分布和给定核...

【技术特征摘要】
1.一种基于碱基嵌入和直接相关分析的核糖核酸接触图预测方法,其特征在于,包括以下步骤:
步骤1、碱基的嵌入法表示:对于给定核糖核酸多序列联配中的每条序列的每一个碱基,先通过多项式分布进行表示,再与一个可训练的嵌入参数矩阵进行相乘,得到对应的向量表示;
步骤2、基于伪极大似然的直接相关模型构建:构建耦合参数矩阵,对于核糖核酸多序列联配中的每个位置,基于所有不包括该位置的其他位置的嵌入法的向量表示和耦合参数相乘,从而得到该位置概率分布的预测;该核糖核酸序列的概率近似表示为所有位置预测的概率分布的乘积;
步骤3、使用自适应随机梯度下降方法优化模型:损失函数为预测的核糖核酸序列的概率分布和给定核糖核酸多项式概率分布的距离;优化对象为该模型中的嵌入参数和耦合参数;
步骤4、接触图提取及后处理:从训练得到的耦合参数中提取接触图,通过后处理步骤消除接触图中的噪声。


2.根据权利要求1所述的预测方法,其特征在于:所述步骤1中,...

【专利技术属性】
技术研发人员:於东军李阳朱一亨
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1