当前位置: 首页 > 专利查询>同济大学专利>正文

基于胶囊网络的RNA与蛋白质绑定偏好预测方法和系统技术方案

技术编号:29407640 阅读:66 留言:0更新日期:2021-07-23 22:47
本发明专利技术公开了基于胶囊网络的RNA与蛋白质绑定偏好预测方法和系统,对原始胶囊网络进行修改使其能够同步从RNA序列数据和结构数据中学习特征信息,由于RNA序列数据和结构数据存在差异,因此模型分别使用独立的卷积层和主要胶囊层从二者中提取特征信息,将融合后的信息作为数字胶囊层的输入,本发明专利技术提供的技术方案中,步骤简单,实用性强,预测准确率高,为RNA与蛋白质绑定偏好预测提供了技术参考。

【技术实现步骤摘要】
基于胶囊网络的RNA与蛋白质绑定偏好预测方法和系统
本专利技术属于RNA与蛋白质绑定预测
,涉及基于胶囊网络的RNA与蛋白质绑定偏好预测方法和系统。
技术介绍
根据遗传中心法则,DNA中包含的遗传信息的表达过程主要由转录和翻译两个阶段构成。转录阶段是合成RNA的过程,也是遗传信息从DNA传递给RNA的过程。翻译阶段是以mRNA中的蛋白质编码信息为基础,在tRNA、多种氨基酸、核糖体、酶等的共同作用下合成具有生物活性的蛋白质的过程。研究表明翻译阶段RNA与蛋白质的相互作用在体外翻译抑制、精子合成、蛋白质合成等复杂生命活动过程中发挥着重要作用。RBP能够识别RNA序列中以特殊方式排列且能够与自身绑定的位点,这些位点被称为RNA绑定位点或RNA基元。从基因表达的层次来看,在面对温度、酸碱度等变化时,翻译过程的蛋白质合成、翻译调控等都会受到影响,进而影响基因表达和生命活动的正常进行。因此,RNA序列中能够与RBP绑定的位点的准确预测有助于研究人员深入理解基因表达过程中翻译阶段的复杂调控机制。高通量测序技术的不断发展提供了大量可靠的RNA-蛋白质绑本文档来自技高网...

【技术保护点】
1.基于胶囊网络的RNA与蛋白质绑定偏好预测方法,其特征在于,包括以下步骤:/nS1.基于RNA序列数据和RNA结构数据,分别依据独热编码方法,获得RNA第一转换矩阵和RNA第二转换矩阵;/nS2.通过设置初始卷积层,对所述RNA第一转换矩阵和RNA第二转换矩阵分别进行卷积运算,获得第一卷积特征集合和第二卷积特征集合;/nS3.构建主要胶囊层,通过设置所述主要胶囊层的胶囊数量,依据所述主要胶囊层的卷积核尺寸和滤波器数目,分别对所述第一卷积特征集合和第二卷积特征集合进行卷积运算,获得第一输出数据和第二输出数据,基于所述胶囊数量,分别依据所述第一输出数据的第一维度和第二输出数据的第二维度,构建第一...

【技术特征摘要】
1.基于胶囊网络的RNA与蛋白质绑定偏好预测方法,其特征在于,包括以下步骤:
S1.基于RNA序列数据和RNA结构数据,分别依据独热编码方法,获得RNA第一转换矩阵和RNA第二转换矩阵;
S2.通过设置初始卷积层,对所述RNA第一转换矩阵和RNA第二转换矩阵分别进行卷积运算,获得第一卷积特征集合和第二卷积特征集合;
S3.构建主要胶囊层,通过设置所述主要胶囊层的胶囊数量,依据所述主要胶囊层的卷积核尺寸和滤波器数目,分别对所述第一卷积特征集合和第二卷积特征集合进行卷积运算,获得第一输出数据和第二输出数据,基于所述胶囊数量,分别依据所述第一输出数据的第一维度和第二输出数据的第二维度,构建第一整合矩阵和第二整合矩阵,合并所述第一整合矩阵和第二整合矩阵,获得第一输出数据;
S4.基于所述第一输出数据,通过设置数字胶囊层,依据动态路由算法,获得第二输出数据,基于L2范数,将所述第二输出数据转化为概率分布,构建绑定偏好预测模型,用于对每个RNA序列中是否存在蛋白质结合位点进行判别。


2.如权利要求1所述基于胶囊网络的RNA与蛋白质绑定偏好预测方法,其特征在于,
所述RNA第一转换矩阵的元素向量长度为4;
所述RNA第二转换矩阵的元素向量长度为6。


3.如权利要求1所述基于胶囊网络的RNA与蛋白质绑定偏好预测方法,其特征在于,
所述初始卷积层包括第一卷积层和第二卷积层;
所述第一卷积层与所述第二卷积层连接;
所述第一卷积层包括第一卷积核;
所述第二卷积层包括第二卷积核;
所述第二卷积核大于第一卷积核。


4.如权利要求1所述基于胶囊网络的RNA与蛋白质绑定偏好预测方法,其特征在于,
所述第一卷积特征集合和第二卷积特征集合的卷积特征的计算方式如下:



其中,X代表所述RNA第一转换矩阵或RNA第二转换矩阵,K代表卷积核用于从输入数据中获取局部特征,X[j,j+l]代表的是窗口长度为l的字符数据,b表示的是计算时使用的偏置选项,f代表非线性函数用于解决梯度消失问题,表示矩阵X和卷积核K对应元素相乘。


5.如权利要求1所述基于胶囊网络的RNA与蛋白质绑定偏好预测方法,其特征在于,
所述S3还包括非线性挤压函数,用于对所述主要胶囊层的输出数据进行压缩;
所述输出数据的向量的长度在0和1之间,所述向量的方向保持不变;
所述S4包括,通过concatenate连接方式获得所述第一输出数据。


6.如权利要求1所述基于胶囊网络的RNA与蛋白质绑定偏好预测方法,其特征在于,
所述S5包括,所述第二输出数据的转换公式为:



其中,pi代表属于两种类别...

【专利技术属性】
技术研发人员:黄德双申圳
申请(专利权)人:同济大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1