【技术实现步骤摘要】
一种融合全局和局部拓扑结构的蛋白质复合体的检测方法
本专利技术属于生命科学研究领域,具体涉及一种融合全局和局部拓扑结构的蛋白质复合体的检测方法。
技术介绍
随着后基因组时代的到来,生命科学研究的重点已经从基因组学转向了蛋白质组学。蛋白质组学的一个重要任务就是从蛋白质-蛋白质相互作用网络中检测出具有一定生物功能的蛋白质复合体。诸如酵母双杂交、微阵列、蛋白质芯片、质谱分析法等生物技术的发展,人类利用这些技术产生了大规模的蛋白质相互作用数据,通过这些相互作用数据可以直接构建蛋白质-蛋白质相互作用网络。其网络的每一个节点代表一个蛋白质,每一条边代表蛋白质和蛋白质之间的相互作用。蛋白质-蛋白质相互作用网络是生命有机体内一种极其重要的生物分子关系网络,从蛋白质-蛋白质相互作用网络中检测出蛋白质复合体不仅能够揭示细胞组织和功能原理,而且能够预测蛋白质功能模块,在疾病致病基因预测以及药物靶点预测方面具有良好的应用前景。由于蛋白质-蛋白质相互作用网络具有稀疏性和噪声数据的局限性,本专利技术提出了一种融合全局和局部拓扑结构的蛋白质复合体 ...
【技术保护点】
1.一种融合全局和局部拓扑结构的蛋白质复合体的检测方法,其特征在于,按照以下步骤实施:/n步骤1、获取用于实验测试的蛋白质互作网络数据集,并对数据集进行预处理;/n步骤2、将步骤1预处理得到的蛋白质互作网络数据集转换成网络对应的邻接矩阵A;/n步骤3、依据蛋白质互作网络的拓扑特性对非负矩阵分解算法加以改进,构建一种蛋白质复合体检测模型;/n步骤4、对步骤3所形成的模型进行训练和测试,并且使用precision、recall、F-score、Sn、PPV、Acc、MMR七个指标值对训练结果进行评估;/n步骤5、对最终输出的蛋白质复合体进行基因的富集分析,从而检测出待测蛋白质复 ...
【技术特征摘要】
1.一种融合全局和局部拓扑结构的蛋白质复合体的检测方法,其特征在于,按照以下步骤实施:
步骤1、获取用于实验测试的蛋白质互作网络数据集,并对数据集进行预处理;
步骤2、将步骤1预处理得到的蛋白质互作网络数据集转换成网络对应的邻接矩阵A;
步骤3、依据蛋白质互作网络的拓扑特性对非负矩阵分解算法加以改进,构建一种蛋白质复合体检测模型;
步骤4、对步骤3所形成的模型进行训练和测试,并且使用precision、recall、F-score、Sn、PPV、Acc、MMR七个指标值对训练结果进行评估;
步骤5、对最终输出的蛋白质复合体进行基因的富集分析,从而检测出待测蛋白质复合体所代表的生物功能。
2.根据权利要求1所述的一种融合全局和局部拓扑结构的蛋白质复合体的检测方法,其特征在于,所述的步骤1中预处理的具体过程为:获取到的蛋白质互作网络数据集每一行有两个蛋白质节点,将每个蛋白质节点的SYMBOL字符串形式均转换成数字形式,同时保持蛋白质互作网络的整体结构不变即可。
3.根据权利要求2所述的一种融合全局和局部拓扑结构的蛋白质复合体的检测方法,其特征在于,所述步骤2的具体步骤为:
步骤2.1、求出步骤1预处理之后网络数据集的最大值n,构建一个n×n的初始矩阵A;
步骤2.2、按行遍历网络数据集,将每一行的两个蛋白质节点数字依次作为i、j,并且将初始矩阵A[i][j]置1,其余的置0;
步骤2.3、将初始矩阵A的主对角线元素置1,即构建出邻接矩阵A。
4.根据权利要求3所述的一种融合全局和局部拓扑结构的蛋白质复合体的检测方法,其特征在于,所述步骤3具体步骤为:
步骤3.1、根据步骤2求得的邻接矩阵A计算得到蛋白质间的自表示系数矩阵Z;
步骤3.2中对非负矩阵分解算法加以改进,形成一种新的蛋白质复合体检测模型,其模型对应的目标函数为:
其中,代表求解矩阵的F2范数,A代表蛋白质互作网络对应的邻接矩阵,A∈Rn×n,R表示正实数域,n代表蛋白质网络中的总节点数,Z代表蛋白质间的自表示系数矩阵,Z∈Rn×n...
【专利技术属性】
技术研发人员:刘光明,丁翠,王彬,李爱民,刘雅君,罗靖,
申请(专利权)人:西安理工大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。