【技术实现步骤摘要】
一种miRNA与疾病的关联预测方法及系统
[0001]本专利技术属于miRNA与疾病的关联预测
,尤其涉及一种miRNA与疾病的关联预测方法及系统。
技术介绍
[0002]随着生物学对人体研究的深入,发现人体内的非编码RNA(ncRNA)对人体的各种生物过程起着十分重要的作用。miRNA是一组单链内源短链ncRNA,miRNA通过与mRNA的碱基配对抑制基因的转录和表达,与各种疾病尤其是癌症的发生密切相关。然而确定miRNA与疾病的关联的生物实验昂贵而费时,因此使用计算模型预测miRNA和疾病的关联显得尤为重要。
[0003]应用计算模型预测miRNA和疾病的关联时,通常首先通过miRNA的功能相关性和miRNA的其他信息计算miRNA的综合相似度矩阵,然后通过疾病的有向无环图(DAG)计算疾病的语义相关性并结合其他疾病相关信息计算语义相似度矩阵,最后结合已知的miRNA与疾病关联矩阵,对未知的miRNA与疾病关联进行预测。
[0004]现有研究中提出基于变分自动编码器(VAE)的模型VAEMDA,将m ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种miRNA与疾病的关联预测方法,其特征在于,包括以下步骤:S1、获取miRNA和疾病数据,并根据miRNA和疾病数据结合额外生物信息,构建综合相似度矩阵;S2、基于归纳矩阵分解设计双流生成器,并将所述综合相似度矩阵作为双流生成器的固定参数训练双流生成器和判别器,生成miRNA与疾病关联预测矩阵;S3、利用所述miRNA与疾病关联预测矩阵对疾病关联进行预测,完成miRNA与疾病关联的预测。2.根据权利要求1所述的miRNA与疾病的关联预测方法,其特征在于,所述步骤S1包括以下步骤:S101、收集miRNA功能相似度数据,并构建miRNA功能相似度矩阵FM;S102、获取疾病术语,对每个疾病构建有向无环图DAG,并基于语义影响逐层递减的假设构建第一语义值;S103、根据所述第一语义值,计算得到疾病d
i
和疾病d
j
的第一语义相似度;S104、根据所述有向无环图DAG,计算得到以包含特定疾病占所有疾病比例的第二语义值;S105、根据所述第二语义值,计算得到疾病d
i
和疾病d
j
的第二语义相似度;S106、根据所述第一语义相似度和第二语义相似度,结合额外生物信息构建包括综合miRNA相似度矩阵和综合疾病相似度矩阵的综合相似度矩阵。3.根据权利要求2所述的miRNA与疾病的关联预测方法,其特征在于,所述步骤S106包括以下步骤:S1061、分别获取miRNA
‑
lncRNA相似度矩阵MI和疾病
‑
lncRNA相似度矩阵DI;S1062、基于所述miRNA
‑
lncRNA相似度矩阵MI和疾病
‑
lncRNA相似度矩阵DI,得到miRNA高斯谱核相似度矩阵和疾病高斯谱核相似度矩阵;S1063、根据所述第一语义相似度的疾病对集合、第二语义相似度的疾病对集合以及未知语义相似度的疾病对集合,计算得到第一语义相似度的权重、第二语义相似度的权重以及未知语义相似度的权重;S1064、根据所述第一语义相似度的权重、第二语义相似度的权重、未知语义相似度的权重以及疾病高斯谱核相似度矩阵,计算得到综合疾病相似度矩阵;S1065、根据功能相似度矩阵FM的miRNA对集合以及未知功能相似度的miRNA对的集合,计算得到功能相似度矩阵FM的权重和未知功能相似度的权重;S1066、根据所述功能相似度矩阵FM的权重、未知功能相似度的权重以及miRNA高斯谱核相似度矩阵,计算得到综合miRNA相似度矩阵。4.根据权利要求3所述的miRNA与疾病的关联预测方法,其特征在于,所述步骤S1062中miRNA高斯谱核相似度矩阵的表达式如下:AM=[A,MI]GM(m
i
,m
j
)=exp(
‑
β
m
||IV
AM
(m
i
)
‑
IV
AM
(m
j
)||2)所述疾病高斯谱核相似度矩阵的表达式如下:
AD=[A
T
,DI]GD(d
i
,d
j
)=exp(
‑
β
d
||IV
AD
(d
i
)
‑
IV
AD
(d
j
)||2)其中,A表示已知miRNA和疾病关联矩阵,GM(
·
)表示miRNA高斯谱核相似度矩阵,m
i
表示第i个miRNA,m
j
表示第j个miRNA,β
m
和β
d
均表示用于调整谱核带宽的系数,IV
AM
(m
i
)表示AM的第i行,AM表示融合了lncRNA数据的miRNA与疾病关联矩阵,IV
AM
(m
j
)表示AM的第j行,MI表示miRNA
‑
lncRNA相似度矩阵,nm表示miRNA的数量,β'
m
和β'
d
均表示为确定GM(
·
)和GD(
·
)的谱核带宽系数的超参数,GD(
·
)表示疾病高斯谱核相似度矩阵,IV
AD
(d
i
)表示AD的第i行,IV
AD
(d
j
)表示AD的第j行,AD表示融合了lncRNA数据的疾病与miNRA关联矩阵,A
T
表示已知关联矩阵的转置,DI表示疾病
‑
lncRNA相似度矩阵,nd表示疾病的数量。5.根据权利要求4所述的miRNA与疾病的关联预测方法,其特征在于,所述步骤S1064中综合疾病相似度的表达式如下:SD(d
i
,d
j
)=I
D
(d
i
,d
j
)*(λ
SS1
*SS1(d
i
,d
j
)+λ
SS2
*SS2(d
i
,d
j
)+λ
gd
*GD(d
i
,d
j
))+(1
‑
I
D
(d
i
技术研发人员:宋继辉,刘勇国,张云,朱嘉静,李巧勤,陆鑫,傅翀,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。