【技术实现步骤摘要】
一种基于多层异构图的miRNA靶标预测方法及系统和应用
[0001]本专利技术属于计算机应用技术,涉及一种利用计算机进行生物信息识别,具体涉及一种基于多层异构图的miRNA靶标预测方法及系统和应用。
技术介绍
[0002]非编码RNA(non
‑
coding RNA,ncRNA)是指在细胞中没有翻译成蛋白质的RNA分子,它们在细胞中扮演着多种生物学功能,例如基因表达调控、转录后修饰、组蛋白修饰、RNA剪接、RNA降解等等。ncRNA的两大类包括小RNA(siRNA、miRNA等)和非小RNA(lncRNA、circRNA等),这两类RNA的失调与包含癌症在内的疾病息息相关,在细胞的调控中扮演重要角色,具有很高的临床和科学相关性,将会对未来的医学和疾病治疗有重要的影响。
[0003]其中,miRNA(microRNA)是最为广泛研究的非编码RNA之一。miRNA是一种长度约为20~25个核苷酸的小分子RNA,其广泛存在于真核生物的细胞中,主要通过与靶基因的互补结合,参与到转录后水平的基因表达调控中。miRNA是由细胞内的一系列酶以及蛋白质复合物协同作用合成的,其生物合成过程包括miRNA基因转录、pri
‑
miRNA的剪切、pre
‑
miRNA的释放和成熟的miRNA的结合等步骤。miRNA在细胞中的作用机制十分复杂,它们可以通过两种方式来调控靶基因的表达:一种是通过与mRNA的3'非翻译区(3'untranslated region,UTR)结合并抑制靶基 ...
【技术保护点】
【技术特征摘要】
1.一种基于多层异构图的miRNA靶标预测方法,其特征在于步骤如下:步骤1:构建由七种RNA网络组成的异质图,其中节点代表三种RNA中的一种:miRNA、lncRNA和mRNA,七种RNA网络反映了七种不同的边类型;所述七种边类型为:
①
miRNA
‑
lncRNA相互作用层代表已知的经验证的LMI,
②
miRNA
‑
miRNA序列相似性层测量miRNA之间的序列相似性,
③
miRNA
‑
miRNA共表达层测量miRNA之间的共表达关系,
④
miRNA
‑
mRNA相互作用层代表miRNA靶向的已知mRNA,
⑤
lncRNA
‑
lncRNA序列相似性层测量lncRNA之间的序列相似性,
⑥
lncRNA
‑
lncRNA共表达层测量lncRNA之间的表达相似性,
⑦
lncRNA
‑
mRNA相互作用层代表lncRNA靶向的已知mRNA;步骤2:采用基于特定图层的方法来聚合来自不同图层的特征,使用平均池化层进行聚合得到网络层中节点i的k阶特征即得到多层异质图中的每个节点在所在图层中的边嵌入,说明了节点i的第k阶特征取决于节点i以及其邻居的k
‑
1阶特征的平均值:其中σ(
·
)表示sigmoid函数,W
(k)
是一个需要在训练过程中学习的权重矩阵,mean(
·
)代表取平均操作,r代表图层编号即代表第r个网络层,N
i,r
是一个包含了节点i以及其邻居的节点集合,表示N
i,r
集合中节点j的(k
‑
1)阶特征,其中1≤k≤K,K表示每个网络层的最大特征聚集级别;步骤3:将节点i的所有图层中的边嵌入记为矩阵U
i
=(u
i,1
,
…
,u
i,l
),其中U
i
∈R
s
×
l
,即U
i
是一个s
×
l的矩阵,s代表节点的边嵌入维度,l代表图层的总数;使用多头自注意力机制来对节点v
i
的多个图层的边嵌入进行编码得到H
i,r
[k],为:其中:k代表注意力头的编号,k∈[1,m],m代表总注意力头数;H
i,r
[k]表示在第r图层中的节点v
i
的第k头表示;A
i,r
的计算公式如下:其中r代表图层编号,i代表节点编号,softmax(
·
)代表softmax函数,)代表softmax函数,和为可学习矩阵,其中m代表总注意力头数,s代表节点的边嵌入维度,d
a
代表变化过程中的中间维度;步骤4:使用投影方法将将边嵌入投影到任务空间,再提取来自各图层的特征并最终整合到一起;具体为:通过以下公式将单个节点的多注意力头的表示从R
s
映射到最终的任务空间R
d
中:P
i,r
[k]=H
i,r
[k]W
p
其中W
p
∈R
s
×
d
是要通过训练来学习的矩阵参数,s代表节点经过投影器之前的边嵌入维度,d代表节点经过投影器之后的边嵌入维度,k代表注意力头的编号,P
i,r
[k]代表经过投影之后节点的第k头表示;选择双线性相互作用Bi
‑
pool池进行池化操作来融合节点k个注意力头的表示,得到节点i在r层最终的边嵌入e
i,r
:其中:m表示总的注意力头数,j,k都代表注意力头的编号,p
i,r
[k]表示在第r图层的节点i的第k头表示,p
i,r
[j]表示在第r图层的节点i的第j头表示,表示两个向量的元素乘积,W
r,pool
是要通过训练来学习的矩阵参数;所述节点vi的基础嵌入在所有图层上共享,作为消息传递介质,融合来自各个图层的边嵌入,在各图层间传递;步骤5:通过从高斯分布中随机生成一组数值,可以随机初始化得到每一个节点的基础嵌入,采用下式对基础嵌入和边嵌入e
i,r
进行融合,得到t阶的融合嵌入进行融合,得到t阶的融合嵌入进行融合,得到t阶的融合嵌入代表t
‑
1阶的基础嵌入,代表t阶的边嵌入;通过上一轮的融合嵌入与边嵌入的混合来实现相邻邻域聚合层次上...
【专利技术属性】
技术研发人员:汪涛,肖翼甫,尚学群,邓强,彭佳杰,
申请(专利权)人:西北工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。