【技术实现步骤摘要】
一种基于图表示学习的lncRNA
‑
miRNA相互作用预测方法
[0001]本专利技术涉及生物信息学
,具体涉及一种基于图表示学习的lncRNA
‑
miRNA相互作用预测方法。
技术介绍
[0002]近年来,随着生物组学信息技术的不断发展,许多实验表明非编码RNA(non
‑
coding RNA)对于一些重要的细胞活动起到关键的作用,探索长链非编码RNA(lncRNA)与微小(miRNA)相互作用对于研究lncRNA和miRNA在生命活动中的功能十分重要,并且发现许多疾病和疾病抑制性表达可能受到lncRNA与miRNA的构建的生物分子网络的影响。在分子水平上,可以预测lncRNA和miRNA在重要细胞活性中的潜在关联,有效促进新的生物标志物的发现,提高人们对于分子基础层面的认识。
[0003]在lncRNA
‑
miRNA相互作用的研究中,大概可分为以下几类:基于传统湿式实验的方法、基于数据挖掘和数据分析技术的方法、基于深度学习的方法。Amanda等通过交互关联以及RT
‑
qPCR方法得到了lncRNA TUSC7因子可抑制miR
‑
23b的表达,从而抑制癌细胞的增殖。Li等人的结合米兰达(MIRANDA)和目标扫描(TARGETSCAN)算法,找出lncRNA种子结合位点和miRNA靶点,以此预测lncRNA
‑
miRNA的关联性。但是传统的湿式方法存在耗时、代价高、很难对大批次
【技术保护点】
【技术特征摘要】
1.一种基于图表示学习的lncRNA
‑
miRNA相互作用预测方法,其包括以下步骤:S1:数据集的收集与整理;获得不同的lncRNA和miRNA,以及已知的lncRNA
‑
miRNA关联对信息;S2:根据已知的lncRNA与miRNA的关联矩阵计算lncRNA序列相似性、lncRNA高斯相似性、miRNA序列相似性、miRNA高斯相似性来分别表示lncRNA的特征矩阵与miRNA特征矩阵,并对已知的lncRNA与miRNA关联矩阵进行补全,通过整合lncRNA与miRNA的不同相似性信息构建的lncRNA相似度矩阵以及miRNA相似度矩阵网络;S3:使用图嵌入方式学习lncRNA和miRNA的节点信息的低维向量表示;S4:通过二阶图卷积神经网络使用多跳聚合的方式为不同的邻居节点分配不同的权重值;S41:设定一个lncRNA
‑
miRNA关联图G,G=(V,E),V是节点集,E是边集,A为邻接矩阵;将图中节点信号表示为x∈R
N
,将lncRNA
‑
miRNA节点集映射到的向量化表示,计算图卷积公式为:式中,H为每一层的特征矩阵,l表示图卷积的层数,σ表示激活函数,D表示度矩阵,W表示一个可训练的参数矩阵;S42:在图卷积的基础上,利用卷积高阶信息与原始低阶信息的聚合,将图卷积二阶多项式公式定义如下:f2(H
(l)
,A)=(ω2(H
(l)
,A)2+ω1(H
(l)
,A)+ω0I)x式中,ω表示内核权值,I表示一个单位矩阵;S5:将采用不同的图嵌入方法将得到的多种特征表示与二阶图表示进行特征融合,通过多层感知机获取内部表示,将lncRNA与miRNA的特征向量信息通过内积融合得到评分预测矩阵;S6:使用矩阵补全的方式增强模型适用性,通过矩阵分解的方式将一个含未知关联信息的lnRNA
‑
miRNA关联矩阵分解为不同的矩阵,将分解后的矩阵进行相乘进而得到近似矩阵作为原始矩阵的补全信息来预测lncRNA
‑
miRNA的潜在关联;S61:lncRNA与miRNA的线性表达计算公式如下:S61:lncRNA与miRNA的线性表达计算公式如下:式中,W
h
(h∈{1,2,...})表示第h层的权重矩阵,b为对应的偏置值,σ为激活函数;S62:lncRNA
‑
miRNA补全矩阵计算公式如下:式中,β表示从已知的关联矩阵A中验证的lncRNA
‑
miRNA数据,表示从已知的关联矩阵A中未验证的或未知的lncRNA
‑
miRNA数据,A∈{0,1}
m
×
n
,m为lncRNA的数量,n为miRNA的数
量,l表示lncRNA,m表示miRNA,T为对应矩阵的转置;...
【专利技术属性】
技术研发人员:王元旭,宋金淼,段晓东,魏明杰,
申请(专利权)人:大连民族大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。