预测microRNA和疾病关联的模型的训练方法、模型技术

技术编号:36884529 阅读:34 留言:0更新日期:2023-03-15 21:25
本发明专利技术提供了一种预测microRNA和疾病关联的模型的训练方法,将microRNA和疾病的关联的样本集,输入链路传播网络进行训练,得到目标预测microRNA和疾病关联的模型。本发明专利技术解决了现有技术中存在的模型预测精确度不高的问题,利用链路传播原理,如果某一个节点和另一个节点的相似度较高,那么这个节点代表的microRNA和疾病的关联就可以被传播到另一个节点中,从而使得预测更加准确。从而使得预测更加准确。从而使得预测更加准确。

【技术实现步骤摘要】
预测microRNA和疾病关联的模型的训练方法、模型


[0001]本专利技术属于microRNA预测领域,具体涉及一种预测microRNA和疾病关联的模型的训练方法、模型。

技术介绍

[0002]MicroRNA是一种小分子非编码RNA(

22nt),在细胞中发挥着重要作用。据估计,人类基因组中1

4%的基因是MicroRNA,单个MicroRNA调节多达200个mRNA,MicroRNA通常通过序列特异性碱基对与靶mRNA的3

非翻译区(UTRs)结合,抑制靶mRNA的表达,从而参与生命过程中的一系列重要过程。在许多生物信息学研究项目中,识别潜在的microRNA和人类疾病关联一直是一个关键目标,这将有助于人类疾病的治疗和预防、分子工具设计和个性化诊断。
[0003]传统的生物实验对于大规模的关联检测是昂贵和费力的。因此,预测潜在MicroRNA疾病关联的有效计算方法越来越受到关注。基于功能相关的microRNA更有可能与有着相似表型的疾病关联的假设,一些基于得分函数的计算模型被提出,但这些模型没有进行特征融合,并且预测精确度不高。

技术实现思路

[0004]本专利技术针对上述现有技术中存在的现有训练方法无法有效的进行特征融合,使得训练模型的精确度不高,提供一种预测microRNA和疾病关联的模型的训练方法、模型。
[0005]根据本专利技术和实施例,本专利技术提供一种预测microRNA和疾病关联的模型的训练方法,将microRNA和疾病的关联的样本集,输入链路传播网络进行训练,得到目标预测microRNA和疾病关联的模型。
[0006]进一步地,所述链路传播网络使得相似度相同或相近的节点具有相同或相近的链接强度。
[0007]进一步地,包括如下步骤:
[0008]获取microRNA和疾病的样本集;
[0009]根据所述样本集中对应microRNA相似度与疾病相似度,获得多个microRNA空间相似度核与多个疾病空间相似度核;
[0010]根据所述样本集中microRNA和疾病关联,获得邻接矩阵;
[0011]根据权重分别对多个microRNA空间相似度核与多个疾病空间相似度核进行融合与归一化处理,获得融合microRNA空间相似度核与融合疾病空间相似度核;
[0012]将所述融合microRNA空间相似度核与融合疾病空间相似度核以及邻接矩阵输入链路传播网络进行训练,使得,
[0013]邻接矩阵具有相同或相近的RNA相似度以及相同或相近疾病相似度的节点,具有相同或相近的链接强度,得到目标预测microRNA和疾病关联的模型。
[0014]进一步地,所述链路传播网络的目标函数为:
[0015][0016]其中,为链路强度矩阵;Y
train
是邻接矩阵;σ是平衡系数参数。
[0017]进一步地,所述链路传播网络的最终求解形式为:
[0018][0019]其中,b核融合方法的参数;σ是平衡系数参数;Y
train
是邻接矩阵;是microRNA相似度特征向量,是疾病相似度特征向量;其中,矩阵的计算公式为:
[0020][0021]其中,b核融合方法的参数;σ是平衡系数参数;是进行核融合后的特征值。
[0022]可选地,其超参数设置方式为:当使用克罗内克乘积时,σ=0.2,当使用克罗内克求和时,σ=0.25,
[0023]可选地,其中,其超参数设置方式为:当使用克罗内克乘积时,σ=0.2,b=1,可选地,其中,其超参数设置方式为:当使用克罗内克乘积时,σ=0.2,b=1,当使用克罗内克求和时,σ=0.25,b=3,
[0024]microRNA空间相似度核包括:microRNA空间的高斯关联概要相似度核、microRNA空间的序列相似度核和microRNA空间的功能相似度核;
[0025]疾病空间相似度核包括:疾病空间的高斯关联概要相似度核、疾病空间的疾病语义相似度核和疾病功能相似度核。
[0026]可选地,其中,
[0027]microRNA空间的高斯关联概要相似度核K
mm,1
计算公式如下:
[0028][0029]其中,Y
train
为邻接矩阵,邻接矩阵Y
train
的第i行和第j行分别是第i个microRNA和第j个microRNA的疾病概要,为邻接矩阵Y
train
的第i行第i个microRNA的疾病概要和第j行第j个microRNA的疾病概要;γ代表了高斯核的带宽;
[0030]microRNA功能相似度核K
m,3
,计算公式如下所示:
[0031][0032]其中,疾病d
k
在疾病组D
i
中;疾病d
s
在疾病组D
j
中;是疾病dk和疾病组D
i
的功能相似度得分;是疾病d
s
和疾病组D
j
的功能相似度得分;|D
i
|代表疾病组D
i
的疾病个数;|D
j
|代表疾病组D
j
的疾病个数;
[0033]疾病空间的高斯关联概要相似度核K
d,1
计算公式如下所示:
[0034][0035]其中,和是邻接矩阵Y
train
的第i列和第j列,它们代表了第i个疾病和第j个疾病的microRNA关联概要,γ代表了高斯核的带宽;
[0036]疾病语义相似度核K
d,2
的计算公式如下所示:
[0037][0038]其中,d
i
是某个疾病的节点,为节点d
i
及其祖先节点组成元素的集合,DV(d
i
)是疾病d
i
的语义得分,DV(d
j
)是疾病d
j
的语义得分;其中是疾病d
i
和疾病t的相关语义值,是疾病d
j
和疾病t的相关语义值;
[0039]疾病功能相似度核矩阵K
d,3
计算公式如下所示:
[0040][0041]其中,基因g
k
在基因组G
j
中;基因g
s
在基因组G
i
中;是基因g
k
和基因组G
i
的功能相似度得分;是基因g
s
和基因组G
j
的功能相似度得分;|G
i
|代表基因组G
i
的基因个数;|G
j
|代表基因组G
j
的基因个数。
[0042]可选地,根据权重分别对多个microRNA空间相似度核与多个疾病空间相似本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预测microRNA和疾病关联的模型的训练方法,其特征在于,将microRNA和疾病的关联的样本集,输入链路传播网络进行训练,得到目标预测microRNA和疾病关联的模型。2.如权利要求1所述的预测microRNA和疾病关联的模型的训练方法,其特征在于,所述链路传播网络使得相似度相同或相近的节点具有相同或相近的链接强度。3.如权利要求1或2所述的预测microRNA和疾病关联的模型的训练方法,其特征在于,包括如下步骤:获取microRNA和疾病的样本集;根据所述样本集中对应microRNA相似度与疾病相似度,获得多个microRNA空间相似度核与多个疾病空间相似度核;根据所述样本集中microRNA和疾病关联,获得邻接矩阵;根据权重分别对多个microRNA空间相似度核与多个疾病空间相似度核进行融合与归一化处理,获得融合microRNA空间相似度核与融合疾病空间相似度核;将所述融合microRNA空间相似度核与融合疾病空间相似度核以及邻接矩阵输入链路传播网络进行训练,使得,邻接矩阵具有相同或相近的RNA相似度以及相同或相近疾病相似度的节点,具有相同或相近的链接强度,得到目标预测microRNA和疾病关联的模型。4.如权利要求1

3所述的预测microRNA和疾病关联的模型的训练方法,其特征在于,所述链路传播网络的目标函数为:其中,为链路强度矩阵;Y
train
是邻接矩阵;σ是平衡系数参数。5.如权利要求4所述的预测microRNA和疾病关联的模型的训练方法,其特征在于,所述链路传播网络的最终求解形式为:其中,b核融合方法的参数;σ是平衡系数参数;Y
train
是邻接矩阵;是microRNA相似度特征向量,是疾病相似度特征向量;其中,矩阵的计算公式为:其中,b核融合方法的参数;σ是平衡系数参数;是进行核融合后的特征值。6.如权利要求5所述的预测microRNA和疾病关联的模型的训练方法,其特征在于,其超参数设置方式为:当使用克罗内克乘积时,σ=0.2,b=1,当使用克罗内克求和时,σ=0.25,b=3,7.如权利要求3所述的预测microRNA和疾病关联的模型的训练方法,其特征在于,其中,microRNA空间相似度核包括:microRNA空间的高斯关联概要相似度核、microRNA空间的序列相似度核和microRNA空间的功能相似度核;
疾病空间相似度核包括:疾病空间的高斯关联概要相似度核、疾病空间的疾病语义相似度核和疾病功能相似度核。8.如权利要求7所述的预测microRNA和疾病关联的模型的训练方法,其特征在于,其中,microRNA空间的高斯关联概要相似度核K
m,1
计算公式如下:其中,Y
train
为邻接矩阵,邻接矩阵Y
train
的第i行和第j行分别是第i个microRNA和第j个microRNA的疾病概要,为邻接矩阵Y
train
的第i行第i个microRNA的疾病概要和第j行第j个microRNA的疾病概要;γ代...

【专利技术属性】
技术研发人员:邹权王一争丁漪杰
申请(专利权)人:电子科技大学长三角研究院衢州
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1