当前位置: 首页 > 专利查询>中南大学专利>正文

一种circRNA和疾病关联预测方法技术

技术编号:38707576 阅读:8 留言:0更新日期:2023-09-08 14:48
本公开实施例中提供了一种circRNA和疾病关联预测方法,属于生物信息学技术领域,具体包括:步骤1,计算初始特征表示;步骤2,得到circRNA和疾病节点的聚合特征表示,使用BPR方法获取图卷积网络的第一损失函数;步骤3,向聚合特征向量中添加随机噪声,并且构建对比学习范式,并构建第二损失函数;步骤4,获取初始预测模型的全局损失函数,并通过全局损失函数的反向传播更新初始预测模型的参数;步骤5,重复步骤2至4更新初始预测模型参数,直到模型拟合得到目标预测模型和其对应的circRNA和疾病节点的最终特征表示;步骤6,对最终特征表示进行内积操作,形成关联结果。通过本公开的方案,提高了预测效率和精准度。高了预测效率和精准度。高了预测效率和精准度。

【技术实现步骤摘要】
一种circRNA和疾病关联预测方法


[0001]本公开实施例涉及生物信息学
,尤其涉及一种circRNA和疾病关联预测方法。

技术介绍

[0002]虽然环状RNA(circRNA)的存在最早可以追溯到1971年,但在很长一段时间内它们并没有被认为是核糖核酸(RNA)表达分析中的重要因素。然而,自2013年以来,随着高分辨率和高通量的RNA测序数据的出现,特别是成对末端读取和深度测序技术的应用,识别和定量了许多新型circRNA。大多数circRNA通过不一致的映射读取进行识别,其中最后一个映射到转录本开头,因为RNA转录本的5

和3

末端形成了环状结构。相比线性RNA,circRNA在细胞中存在的时间更长,而且它们的表达水平保持稳定且具有组织特异性。最近的研究发现,circRNA与信使RNA(mRNA)和长非编码RNA(circRNA)竞争结合微小RNA(miRNA)在基因调控中起着重要作用。比如,circRNA

miRNA

mRNA形成竞争性内源性RNA(ceRNA)网络,似乎扮演着miRNA的海绵的角色。因此,circRNA与复杂疾病有关,发现它们之间的关系将在研究中发挥重要作用。
[0003]可见,亟需一种能大规模且高效精准预测的circRNA和疾病关联预测方法。

技术实现思路

[0004]有鉴于此,本公开实施例提供一种circRNA和疾病关联预测方法,至少部分解决现有技术中存在预测效率和精准度较差的问题。
[0005]本公开实施例提供了一种circRNA和疾病关联预测方法,包括:
[0006]步骤1,分别计算circRNA

circRNA序列相似性和疾病

疾病的语义相似性作为circRNA和疾病节点的初始特征表示;
[0007]步骤2,基于circRNA

疾病关联对构建circRNA

疾病关联二分图,并运行图卷积网络方法进行邻居节点信息聚合操作,得到circRNA和疾病节点的聚合特征表示,使用BPR方法获取图卷积网络的第一损失函数;
[0008]步骤3,向聚合特征向量中添加随机噪声,并且构建对比学习范式,并构建第二损失函数;
[0009]步骤4,对第一损失函数和第二损失函数进行联合学习,获取初始预测模型的全局损失函数,并通过全局损失函数的反向传播更新初始预测模型的参数,同时更新circRNA和疾病节点的特征表示;
[0010]步骤5,重复步骤2至4更新初始预测模型参数,直到模型拟合得到目标预测模型和其对应的circRNA和疾病节点的最终特征表示;
[0011]步骤6,对最终特征表示进行内积操作,获得circRNA

疾病得分矩阵,形成关联结果。
[0012]根据本公开实施例的一种具体实现方式,所述circRNA

circRNA序列相似性的表
达式为
[0013]CG(c(i),c(j))=exp(

θ
c
||V(c(i))

V(c(j))||2)
[0014]其中,n是circRNA的数量,i和j为circRNA的序号,V表示circRNA

疾病关联矩阵;
[0015]所述疾病

疾病的语义相似性的表达式为
[0016]DD=0.5
·
DD1+0.5
·
DD2[0017]其中,DD1为疾病i和j之间的第一相似性指标,DD2为疾病i和j之间的第二相似性指标。
[0018]根据本公开实施例的一种具体实现方式,所述步骤2具体包括:
[0019]基于circRNA

疾病关联对构建circRNA

疾病关联二分图,随机初始化circRNA和疾病节点的向量表示,并使用图卷积网络方法聚合circRNA和疾病节点对应的邻居节点的信息;
[0020]将每一个图卷积层获取到的circRNA和疾病节点的向量表示通过加权和方法聚合得到circRNA和疾病节点的聚合特征表示;
[0021]使用BPR方法获取图卷积网络的第一损失函数。
[0022]根据本公开实施例的一种具体实现方式,所述聚合circRNA和疾病节点对应的邻居节点的信息的表达式为
[0023][0024]其中,N
c
表示circRNA c的邻居节点,(N
d
)表示疾病d的邻居节点,表示circRNA在图卷积网络第l层的嵌入,表示疾病在图卷积网络第l层的嵌入;
[0025]所述第一损失函数的表达式为
[0026][0027]其中,σ是非线性激活函数,表示成对训练数据表示观察到的circRNA c与疾病d
+
之间存在相互关联,表示采样疾病d

与circRNA c没有实验验证的相互关联。
[0028]根据本公开实施例的一种具体实现方式,所述对比学习范式的表达式为
[0029][0030]其中,噪音向量

'
i

△”
i
独立同分布,符合条件分布||Δ||2=ε,其中Δ=
ε表示超球体半径;
[0031]所述第二损失函数的表达式为
[0032][0033]其中,i和j是从训练的batch中采样得到的circRNA和疾病,e”i
and e”j
分别是添加了随机的噪音之后的circRNA i和疾病j的特征向量,τ表示温度参数。
[0034]根据本公开实施例的一种具体实现方式,所述全局损失函数的表达式为
[0035][0036]其中,λ是超参数。
[0037]根据本公开实施例的一种具体实现方式,所述circRNA

疾病得分矩阵的表达式为
[0038][0039]其中为circRNA c和疾病d的关联分数,T表示向量转置操作。
[0040]本公开实施例中的circRNA和疾病关联预测方案,包括:步骤1,分别计算circRNA

circRNA序列相似性和疾病

疾病的语义相似性作为circRNA和疾病节点的初始特征表示;步骤2,基于circRNA

疾病关联对构建circRNA

疾病关联二分图,并运行图卷积网络方法进行邻居节点信息聚合操作,得到circRNA和疾病节点的聚合特征表示,使用BPR方法获取图卷积网络的第一损失函数;步骤3,向聚合特征向量中添加随机噪声,并且构建对比学习范式,并构建第二损失函数;步骤4,对第一损失函数和第二损失函数进行联合学习,获取初始预测模型的全局损失函数,并通过全局损失函数的反向传播更新初始预测模型的参数,同本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种circRNA和疾病关联预测方法,其特征在于,包括:步骤1,分别计算circRNA

circRNA序列相似性和疾病

疾病的语义相似性作为circRNA和疾病节点的初始特征表示;步骤2,基于circRNA

疾病关联对构建circRNA

疾病关联二分图,并运行图卷积网络方法进行邻居节点信息聚合操作,得到circRNA和疾病节点的聚合特征表示,使用BPR方法获取图卷积网络的第一损失函数;步骤3,向聚合特征向量中添加随机噪声,并且构建对比学习范式,并构建第二损失函数;步骤4,对第一损失函数和第二损失函数进行联合学习,获取初始预测模型的全局损失函数,并通过全局损失函数的反向传播更新初始预测模型的参数,同时更新circRNA和疾病节点的特征表示;步骤5,重复步骤2至4更新初始预测模型参数,直到模型拟合得到目标预测模型和其对应的circRNA和疾病节点的最终特征表示;步骤6,对最终特征表示进行内积操作,获得circRNA

疾病得分矩阵,形成关联结果。2.根据权利要求1所述的方法,其特征在于,所述circRNA

circRNA序列相似性的表达式为CG(c(i),c(j))=exp(

θ
c
||V(c(i))

V(c(j))||2)其中,n是circRNA的数量,i和j为circRNA的序号,V表示circRNA

疾病关联矩阵;所述疾病

疾病的语义相似性的表达式为DD=0.5
·
DD1+0.5
·
DD2其中,DD1为疾病i和j之间的第一相似性指标,DD2为疾病i和j之间的第二相似性指标。3.根据权利要求2所述的方法,其特征在于,所述步骤2具体包括:基于circ...

【专利技术属性】
技术研发人员:邓磊胡小文刘大运
申请(专利权)人:中南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1