一种基于多层异构图的miRNA靶标预测方法及系统和应用技术方案

技术编号：38616980 阅读：12 留言：0更新日期：2023-08-26 23:44

本发明专利技术涉及一种基于多层异构图的miRNA靶标预测方法及系统和应用，首先在节点表征上，本方案将节点表示做了解耦，分为边嵌入和基础嵌入，每个图层单独维护所有节点在该图层上的边嵌入。第二在图传播上，因为浅层GCN不能大范围的传播特征，而深层GCN容易导致过平滑，因此我们选用了抽样平均聚合来解决这个问题，从节点邻域中抽取固定的k个节点嵌入做平均来表征中心节点。第三在注意力机制上，本方案在前人的基础上略作创新，对于多头注意力机制不是简单的将向量拼接，而是采用了池化层和全连接层，整体实现上更加符合逻辑，实验时参数调整更为简单。更为简单。更为简单。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多层异构图的miRNA靶标预测方法及系统和应用

[0001]本专利技术属于计算机应用技术，涉及一种利用计算机进行生物信息识别，具体涉及一种基于多层异构图的miRNA靶标预测方法及系统和应用。

技术介绍

[0002]非编码RNA(non
‑
coding RNA,ncRNA)是指在细胞中没有翻译成蛋白质的RNA分子，它们在细胞中扮演着多种生物学功能，例如基因表达调控、转录后修饰、组蛋白修饰、RNA剪接、RNA降解等等。ncRNA的两大类包括小RNA(siRNA、miRNA等)和非小RNA(lncRNA、circRNA等)，这两类RNA的失调与包含癌症在内的疾病息息相关，在细胞的调控中扮演重要角色，具有很高的临床和科学相关性，将会对未来的医学和疾病治疗有重要的影响。
[0003]其中，miRNA(microRNA)是最为广泛研究的非编码RNA之一。miRNA是一种长度约为20～25个核苷酸的小分子RNA，其广泛存在于真核生物的细胞中，主要通过与靶基因的互补结合，参与到转录后水平的基因表达调控中。miRNA是由细胞内的一系列酶以及蛋白质复合物协同作用合成的，其生物合成过程包括miRNA基因转录、pri
‑
miRNA的剪切、pre
‑
miRNA的释放和成熟的miRNA的结合等步骤。miRNA在细胞中的作用机制十分复杂，它们可以通过两种方式来调控靶基因的表达：一种是通过与mRNA的3'非翻译区(3'untranslated region,UTR)结合并抑制靶基...

【技术保护点】

【技术特征摘要】
1.一种基于多层异构图的miRNA靶标预测方法，其特征在于步骤如下：步骤1：构建由七种RNA网络组成的异质图，其中节点代表三种RNA中的一种：miRNA、lncRNA和mRNA，七种RNA网络反映了七种不同的边类型；所述七种边类型为：
①
miRNA
‑
lncRNA相互作用层代表已知的经验证的LMI，
②
miRNA
‑
miRNA序列相似性层测量miRNA之间的序列相似性，
③
miRNA
‑
miRNA共表达层测量miRNA之间的共表达关系，
④
miRNA
‑
mRNA相互作用层代表miRNA靶向的已知mRNA，
⑤
lncRNA
‑
lncRNA序列相似性层测量lncRNA之间的序列相似性，
⑥
lncRNA
‑
lncRNA共表达层测量lncRNA之间的表达相似性，
⑦
lncRNA
‑
mRNA相互作用层代表lncRNA靶向的已知mRNA；步骤2：采用基于特定图层的方法来聚合来自不同图层的特征，使用平均池化层进行聚合得到网络层中节点i的k阶特征即得到多层异质图中的每个节点在所在图层中的边嵌入，说明了节点i的第k阶特征取决于节点i以及其邻居的k
‑
1阶特征的平均值：其中σ(
·
)表示sigmoid函数，W
(k)
是一个需要在训练过程中学习的权重矩阵，mean(
·
)代表取平均操作，r代表图层编号即代表第r个网络层，N
i,r
是一个包含了节点i以及其邻居的节点集合，表示N
i,r
集合中节点j的(k
‑
1)阶特征，其中1≤k≤K，K表示每个网络层的最大特征聚集级别；步骤3：将节点i的所有图层中的边嵌入记为矩阵U
i
＝(u
i,1
,
…
,u
i,l
)，其中U
i
∈R
s
×
l
，即U
i
是一个s
×
l的矩阵，s代表节点的边嵌入维度，l代表图层的总数；使用多头自注意力机制来对节点v
i
的多个图层的边嵌入进行编码得到H
i,r
[k]，为：其中：k代表注意力头的编号，k∈[1,m]，m代表总注意力头数；H
i,r
[k]表示在第r图层中的节点v
i
的第k头表示；A
i,r
的计算公式如下：其中r代表图层编号，i代表节点编号，softmax(
·
)代表softmax函数，)代表softmax函数，和为可学习矩阵，其中m代表总注意力头数，s代表节点的边嵌入维度，d
a
代表变化过程中的中间维度；步骤4：使用投影方法将将边嵌入投影到任务空间，再提取来自各图层的特征并最终整合到一起；具体为：通过以下公式将单个节点的多注意力头的表示从R
s
映射到最终的任务空间R
d
中：P
i,r
[k]＝H
i,r
[k]W
p
其中W
p
∈R
s
×
d
是要通过训练来学习的矩阵参数，s代表节点经过投影器之前的边嵌入维度，d代表节点经过投影器之后的边嵌入维度，k代表注意力头的编号，P
i,r
[k]代表经过投影之后节点的第k头表示；选择双线性相互作用Bi
‑
pool池进行池化操作来融合节点k个注意力头的表示，得到节点i在r层最终的边嵌入e
i,r
：其中：m表示总的注意力头数，j,k都代表注意力头的编号，p
i,r
[k]表示在第r图层的节点i的第k头表示，p
i,r
[j]表示在第r图层的节点i的第j头表示，表示两个向量的元素乘积，W
r,pool
是要通过训练来学习的矩阵参数；所述节点vi的基础嵌入在所有图层上共享，作为消息传递介质，融合来自各个图层的边嵌入，在各图层间传递；步骤5：通过从高斯分布中随机生成一组数值，可以随机初始化得到每一个节点的基础嵌入，采用下式对基础嵌入和边嵌入e
i,r
进行融合，得到t阶的融合嵌入进行融合，得到t阶的融合嵌入进行融合，得到t阶的融合嵌入代表t
‑
1阶的基础嵌入，代表t阶的边嵌入；通过上一轮的融合嵌入与边嵌入的混合来实现相邻邻域聚合层次上...

【专利技术属性】
技术研发人员：汪涛，肖翼甫，尚学群，邓强，彭佳杰，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人