当前位置: 首页 > 专利查询>江南大学专利>正文

一种基于相似性网络融合算法的生物数据网络处理方法技术

技术编号:23788385 阅读:60 留言:0更新日期:2020-04-15 01:14
本发明专利技术公开了一种基于相似性网络融合算法的生物数据网络处理方法,属于生物信息分析技术领域。所述方法通过首先对生物多种遗传信息如mRNA,miRNA,lncRNA等构建相似性网络,再使用SNF算法对相似矩阵进行融合,创建可用的样本网络,利用谱聚类进行聚类,分析网络之间的关系,从而用于疾病致病机理的发现,早期诊断和后期治疗等领域。本发明专利技术方法能够利用不同类型的数据的互补性得到更为综合的结果,大大优于单一数据的分析和建立,为后续的综合分析建立基础。

A biological data network processing method based on similarity network fusion algorithm

【技术实现步骤摘要】
一种基于相似性网络融合算法的生物数据网络处理方法
本专利技术涉及一种基于相似性网络融合算法的生物数据网络处理方法,属于生物信息分析

技术介绍
伴随着人类基因组计划的发展,生物信息学也在迅速完善和发展。高通量测序技术的发展促进了更全面更深入地对基因组进行分析。随着测序成本的不断降低,包括基因组学、转录组学等在内的多组学数据不断积累,海量生物学数据有助于全面地有效地挖掘其中所蕴含的生物学知识,为生物信息分析提供了丰富的数据资源,同时也带来了新的挑战。随着具备大数据特征的生物学数据的不断积累及精准医疗战略计划的开启,生物信息分析的重要性也日益增长,对当前相关领域的发展具有重大的推动意义。而如何通过生物实验数据挖掘出生物网络的潜在变化,一直是以系统的方法研究生命现象的热点和难点。常规的方法往往只能同时针对某一生物类型数据进行分析,而无法同时对多种生物类型数据进行分析,无法利用不同类型数据蕴含的不同特征。肖斌(《Luminal亚型乳腺癌细胞与正常乳腺细胞的circRNA表达谱差异分析》,南方医科大学学报,2018,38(8),1014-本文档来自技高网...

【技术保护点】
1.一种生物数据网络处理方法,其特征在于,所述方法包括:/nS1:根据不同生物数据类型的样本数据集分别构建各个类型对应的样本相似性矩阵;/nS2:根据S1构建的各个类型对应的样本相似性矩阵,采用SNF算法构建多种类型的样本数据的融合相似性矩阵;/nS3:采用谱聚类方法将S2得到的多种类型的样本数据对应的融合相似性矩阵进行聚类确定样本数据所属子类。/n

【技术特征摘要】
1.一种生物数据网络处理方法,其特征在于,所述方法包括:
S1:根据不同生物数据类型的样本数据集分别构建各个类型对应的样本相似性矩阵;
S2:根据S1构建的各个类型对应的样本相似性矩阵,采用SNF算法构建多种类型的样本数据的融合相似性矩阵;
S3:采用谱聚类方法将S2得到的多种类型的样本数据对应的融合相似性矩阵进行聚类确定样本数据所属子类。


2.根据权利要求1所述的方法,其特征在于,所述S1包括:
对包含有不同生物数据类型的样本数据集中的每一类型数据进行归一化处理;
归一化后计算同一类型的样本间的欧式距离,构建距离矩阵;
采用高斯热核函数构建各个类型的样本数据的样本相似性矩阵。


3.根据权利要求2所述的方法,其特征在于,所述欧式距离dij计算公式为:



其中,样本数据集共包含M个类型的样本数据,样本个数为n,mv为每个类型的样本数据所包含的基因数量,v=1…M,xik代表样本i的第k个基因,i、j取值范围为[1,n],k取值范围为[1,mv];xjk代表样本j的第k个基因。


4.根据权利要求3所述的方法,其特征在于,所述采用高斯热核函数构建各个类型的样本数据的样本相似性矩阵,包括:
每个类型的样本数据的样本相似性矩阵记为wv,则各个类型的样本数据的样本相似性矩阵为:



其中,μ为一个超参数,取值范围为[0.3,0.8];εij为用于消除缩放比例问题的参数。


5.根据权利要求4所述的方法,...

【专利技术属性】
技术研发人员:刘伟郑明霞赵溶丁彦蕊
申请(专利权)人:江南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1