当前位置: 首页 > 专利查询>中南大学专利>正文

基于多尺度模块核的致病基因识别方法及系统技术方案

技术编号:32834111 阅读:31 留言:0更新日期:2022-03-26 20:51
本公开实施例中提供了一种基于多尺度模块核的致病基因识别方法及系统,属于生物信息学技术领域,具体包括:通过指数抽样的多尺度模块度优化算法从综合的蛋白质相互作用组提取网络多尺度模块,得到标准化多尺度模块谱;根据标准化多尺度模块谱构建多尺度模块核矩阵并进行核稀疏;提取两个预测列表;融合两个预测列表得到基因概率列表,并根据基因概率列表预测疾病的致病基因。通过本公开的方案,提取多尺度模块谱并标准化,有效融合不同层次、特异性的网络模块结构信息后进行稀疏化,提供了新的基因

【技术实现步骤摘要】
基于多尺度模块核的致病基因识别方法及系统


[0001]本公开实施例涉及生物信息学
,尤其涉及一种基于多尺度模块核的致病基因识别方法及系统。

技术介绍

[0002]目前,疾病相关基因的鉴定对于人类复杂疾病的研究非常重要,这是理解疾病分子机制的基础。传统方法存在候选空间大且候选基因的实验鉴定既昂贵又耗时等问题。因此,疾病致病基因预测方法的开发成为计算生物学的一个重要课题,它对复杂疾病的研究有着重要的促进作用。
[0003]已经提出了许多计算方法来预测疾病相关基因,而基于网络的方法是疾病基因预测中最流行的策略之一。通过候选基因和种子基因(即已知与特定疾病相关的基因)之间的直接相互作用、网络距离或接近度来预测疾病相关基因是一种自然而有效的策略。带重启的随机行走等网络传播方法可以更有效地探索生物网络中种子周围的邻域拓扑,因此已被广泛应用于疾病基因预测以及相关问题,并且还被扩展到更复杂的网络模型,如同质或异构网络中的多图模型、多网络模型和多重网络模型。这些模型可以集成多种类型的生物网络。然而,由于生物网络中的数据噪声等问题,这些方法仍有进一步本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多尺度模块核的致病基因识别方法,其特征在于,包括:通过指数抽样的多尺度模块度优化算法从综合的蛋白质相互作用组提取网络多尺度模块,构建包含网络局部信息和全局信息的初始多尺度模块谱,并采用特征信息量方法对其进行权重化处理,得到标准化多尺度模块谱;根据所述标准化多尺度模块谱构建多尺度模块核矩阵并进行核稀疏,得到稀疏矩阵;根据所述蛋白质相互作用组、疾病

疾病关联和疾病

基因关联,以及,根据所述稀疏矩阵、所述疾病

疾病关联和所述疾病

基因关联,分别构建两个概率矩阵,并通过游走动力学过程从两个所述概率矩阵中提取两个预测列表;通过基于节点排位聚合的概率模型融合两个所述预测列表,得到基因概率列表,并根据所述基因概率列表预测疾病的致病基因。2.根据权利要求1所述的方法,其特征在于,所述网络多尺度模块的公式为其中,e
ss
表示模块s内的边比例,a
s
表示在随机模型中模块s内的边比例,γ为分辨率参数,通过指数抽样方式获得对应不同尺度的γ分辨率参数值;所述标准化多尺度模块谱:B=(B
(1)
,B
(2)
,...,B
(h)
,...),其中,B
(h)
是每个尺度的模块划分矩阵,该矩阵的元素表示基因i是否属于模块s;所述权重化处理的公式为其中,对角矩阵D
IC
的对角元素(D
IC
)
ss


log(∑
i
I(B
is
)/N),I(x)表示计数函数,N表示节点数目。3.根据权利要求1所述的方法,其特征在于,所述根据所述标准化多尺度模块谱构建多尺度模块核矩阵并进行核稀疏,得到稀疏矩阵的步骤,包括:将所述标准化多尺度模块谱作为节点特征谱并通过所述节点特征谱向量内积计算得到所述多尺度模块核矩阵;通过节点度相关的标准化方法对所述多尺度模块核矩阵内的元素进行标准化,使其元素值约束至0和1之间,得到标准化模块核矩阵;保留所述标准化模块核矩阵中每个节点对应的预设数量的相似邻居节点,将所述标准化的模块核矩阵进行核稀疏,得到所述稀疏矩阵。4.根据权利要求3所述的方法,其特征在于,所述保留所述标准化模块核矩阵中每个节点对应的预设数量的相似邻居节点,将所述标准化模块核矩阵进行核稀疏,得到所述稀疏矩阵的步骤,包括:计算所述...

【专利技术属性】
技术研发人员:李敏项炬
申请(专利权)人:中南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1