【技术实现步骤摘要】
一种新型的环状RNA
‑
疾病关联预测方法
[0001]本专利技术涉及机器学习和生物信息学领域,更具体地,涉及一种新型的环状RNA
‑
疾病关联预测方法。
技术介绍
[0002]环状RNA是一种在生命中广泛表达的单链环状内源性非编码RNA,其长度在200到2000个核苷酸之间,缺乏游离的5'端帽或3'端聚腺苷酸尾。大多数环状RNA通常在低水平表达,曾经被认为是罕见的,并且在形成mRNAs 的过程中由于剪接错误而产生的功能性副产物。然而,随着全基因组分析和深度RNA测序技术的发展,发现环状RNA在真核细胞中广泛存在并大量表达,并表现出组织和细胞特异性。它们在细胞发育和疾病的病理生理中起着重要的调节作用,因此逐渐引起人们的广泛关注。
[0003]最近,越来越多的证据表明,环状RNA具有稳定性、保守性、丰度、组织和阶段特异性,能够抵抗核糖核酸酶的降解并稳定存在,是理想的疾病相关生物标记物。例如,王等人发现cZRANB1可以通过调节视网膜反应性胶质细胞的激活和影响视网膜神经节细胞(RGCs)的 ...
【技术保护点】
【技术特征摘要】
1.一种新型的环状RNA
‑
疾病关联预测方法,其特征在于,所述方法包括:基于环状RNA与疾病相关性数据构建预测环状RNA
‑
疾病关联的数据集;通过高斯相互作用谱核表征环状RNA和疾病的相似性属性,根据疾病分类注释,表征不同疾病之间的关联;基于所述预测环状RNA
‑
疾病关联的数据集,利用图注意网络并行计算网络节点及其相邻节点的注意力,通过处理不同维度的节点并将其应用于归纳学习问题,以提取注意力机制特征;基于随机化的深度学习分类器集成深度RVFL网络模型,基于所述注意力机制特征,通过闭式解的非迭代方式训练所述深度RVFL网络模型,得到用于环状RNA
‑
疾病关联预测的模型。2.根据权利要求1所述的一种新型的环状RNA
‑
疾病关联预测方法,其特征在于,在基于环状RNA与疾病相关性数据构建预测环状RNA
‑
疾病关联的数据集之后,所述方法还包括:通过下式(1)对所述预测环状RNA
‑
疾病关联的数据集进行拆分:其中为预测环状RNA
‑
疾病关联的数据集,为正样本,为未标记样本;基于下采样方法从未标记样本中随机选择预设数量的阴性样本。3.根据权利要求1所述的一种新型的环状RNA
‑
疾病关联预测方法,其特征在于,利用收集自CircR2Disease数据库的环状RNA与疾病相关性数据构建预测环状RNA
‑
疾病关联的数据集。4.根据权利要求1所述的一种新型的环状RNA
‑
疾病关联预测方法,其特征在于,所述通过高斯相互作用谱核表征环状RNA和疾病的相似性属性,包括:使用二元向量来表示环状RNA的相互作用谱核,当环状RNA与疾病相关时,其相应位置被赋值为1,否则为0;通过以下公式计算环状RNA的GIP信息D
GIP
(d(i),d(j)):(d(i),d(j)):其中σ
d
是宽度变量,m是数据集中环状RNA的数量,exp()是经验函数,d(i)是第i个疾病,是第i个疾病的在邻接矩阵中的向量,d(j)是第j个疾病,是第j个疾病的在邻接矩阵中的向量。5.根据权利要求1或4所述的一种新型的环状RNA
‑
疾病关联预测方法,其特征在于,所述根据疾病分类注释,表征不同疾病之间的关联,包括:根据疾病分类注释,利用有向无环图DAG来反映不同疾病之间的关联,其中节点用于表示DAG中的疾病,边用于表示疾病之间的关系;疾病集N
e
中的疾病d在DAG
e
中的贡献C
e
(d)的计算方法为:
其中,θ是语义贡献因子,
·
是点乘,d
′
是疾病d
′
,C
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。