基于交替方向乘子法的蛋白质间相互作用预测装置和方法制造方法及图纸

技术编号:26602310 阅读:44 留言:0更新日期:2020-12-04 21:25
本发明专利技术公开一种基于交替方向乘子法的蛋白质间相互作用预测装置和方法,包括S1:输入初始蛋白质间相互作用数据并构造对称稀疏矩阵W;S2:构建增广拉格朗日函数并进行参数初始化;S3:对增广拉格朗日函数进行迭代优化,得到优化后的隐特征矩阵;S4:计算缺失蛋白质间相互作用预测值。本发明专利技术通过利用交替方向乘子法的对称非负隐特征分解方法,能够以较小的时间和空间复杂度,提供高精度的蛋白质相互作用数据预测,以提高考虑数据非负对称性的缺失蛋白质间相互作用预测精度,对科研起到重要作用。

【技术实现步骤摘要】
基于交替方向乘子法的蛋白质间相互作用预测装置和方法
本专利技术涉及数据处理
,特别涉及基于交替方向乘子法的蛋白质间相互作用预测装置和方法。
技术介绍
物种存在多种多样的蛋白质,人们对生命活动的理解往往离不开蛋白质间的相互作用,通过传统的生物实验方法难以完全确定物种所有的蛋白质间相互作用、然而,可以通过计算机设计来对物种的所有的蛋白质间相互作用来进行全预测。因此,如何通过计算机设计来高效且准确地预测出蛋白质间缺失的相互作用成为了业界日益关注的问题。一般而言,由于物种所包含的蛋白质有许多不同的种类,且我们在现实中只能确定部分的蛋白质间的相互作用信息,所以由物种的蛋白质间的相互作用所构成的网络是一个无向高维稀疏网络。近年来,许多学者提出了用于预测缺失蛋白质间相互作用的算法,其中,使用奇异值分解方法可以进行缺失值的有效预测。然而,这种方法不仅无法处理高维数据,而且也没有考虑到数据的非负对称性问题,即是说算法的建模并不是针对蛋白质间相互作用这个无向网络来进行设计的。另一方面,有学者使用对称非负矩阵分解方法来对其他对称数据问题来进行缺失值的预本文档来自技高网...

【技术保护点】
1.基于交替方向乘子法的蛋白质间相互作用预测装置,其特征在于,包括数据转换模块、数据初始化模块、交替方向乘子训练模块和预测数据生成模块;其中,/n所述数据转换模块,用于将接收的初始蛋白质间相互作用数据构建为对应的对称稀疏矩阵,并将对称稀疏矩阵中所有的非缺失值进行存储;/n所述数据初始化模块,用于生成初始的隐特征矩阵、线性偏差向量、乘子矩阵以及乘子向量,然后根据非缺失值、隐特征矩阵、线性偏差向量、乘子矩阵和乘子向量来构造对应的增广拉格朗日函数,并对该函数进行初始化;/n所述交替方向乘子训练模块,用于先将隐特征矩阵按隐特征维度进行切片,然后分片依次对迭代参数、非负参数及乘子参数进行迭代优化更新,从...

【技术特征摘要】
20200904 CN 202010921436X1.基于交替方向乘子法的蛋白质间相互作用预测装置,其特征在于,包括数据转换模块、数据初始化模块、交替方向乘子训练模块和预测数据生成模块;其中,
所述数据转换模块,用于将接收的初始蛋白质间相互作用数据构建为对应的对称稀疏矩阵,并将对称稀疏矩阵中所有的非缺失值进行存储;
所述数据初始化模块,用于生成初始的隐特征矩阵、线性偏差向量、乘子矩阵以及乘子向量,然后根据非缺失值、隐特征矩阵、线性偏差向量、乘子矩阵和乘子向量来构造对应的增广拉格朗日函数,并对该函数进行初始化;
所述交替方向乘子训练模块,用于先将隐特征矩阵按隐特征维度进行切片,然后分片依次对迭代参数、非负参数及乘子参数进行迭代优化更新,从而可以得到收敛后的隐特征矩阵;
所述预测数据生成模块,用于根据收敛后的隐特征矩阵,计算缺失蛋白质间相互作用的预测值。


2.如权利要求1所述的基于交替方向乘子法的蛋白质间相互作用预测装置,其特征在于,所述数据转换模块包括对称稀疏矩阵生成单元和蛋白质间相互作用数据存储单元;其中,
所述对称稀疏矩阵生成单元,用于将接收到的初始蛋白质间相互作用数据构建为对称稀疏矩阵W;
所述蛋白质间相互作用数据存储单元,用于存储已构建的对称稀疏矩阵W内所有的非缺失值。


3.如权利要求1所述的基于交替方向乘子法的蛋白质间相互作用预测装置,其特征在于,所述数据初始化模块包括线性偏差数据生成单元,增广拉格朗日函数构建单元以及初始化单元;其中,
所述线性偏差数据生成单元,用于生成初始的蛋白质间相互作用线性偏差向量;
所述增广拉格朗日函数构建单元,用于根据初始的蛋白质间相互作用线性偏差向量和非缺失值构造对应的增广拉格朗日函数;
所述初始化单元,用于初始化蛋白质间相互作用预测过程中所涉及的参数。


4.基于交替方向乘子法的蛋白质间相互作用预测方法,其特征在于,具体包括以下步骤:
S1:输入初始蛋白质间相互作用数据并构造对称稀疏矩阵W;
S2:构建增广拉格朗日函数并进行参数初始化;
S3:对增广拉格朗日函数进行迭代优化,得到优化后的隐特征矩阵;
S4:计算缺失蛋白质间相互作用预测值。


5.如权利要求4所述的基于交替方向乘子法的蛋白质间相互作用预测方法,其特征在于,所述S1包括:
S1-1:构建对称稀疏矩阵W;
对于接收到的初始蛋白质间相互作用数据,以三元组条目存储的,该三元组条目的表示形式为(pi,pj,vij),其中pi表示第i个蛋白质,pj表示第j个蛋白质,vij表示第i个蛋白质与第j个蛋白质间的相互作用值;将每个三元组条目所对应的对称条目给生成出来,从而构建对称稀疏矩阵W。


6.如权利要求4所述的基于交替方向乘子法的蛋白质间相互作用预测方法,其特征在于,所述S2包括:
S2-1:构建目标损失函数Q;
根据对称稀疏矩阵W,得到所有的非缺失值集合Γ,结合集合Γ及所生成的线性偏差向量H和G,以欧式距离来作为优化目标,构建对应的目标损失函数Q:



s.t.E=F,E≥0;G=H,G≥0;(1)
公式(1)中,E,F为M行D列的隐特征矩阵;线性偏差向量H,G的容量为M;Γ表示蛋白质间相互作用数据所对应的对称稀疏矩阵W中的非缺失值集合;D表示隐特征维数;wi,j表示蛋白质i与蛋白质j间相互作用值;ei,d∈E,表示隐特征矩阵E中第i个蛋白质所对应隐特征的第d个元素;fi,d∈F,表示隐特征矩阵F中第i个蛋白质所对应隐特征的第d个元素;gi∈G,表示线性偏差向量G的第i个元素;hi∈H,表示线性偏差向量H的第i个元素;hj∈H,表示线性偏差向量H的第j个元素;
S2-2:构建增广拉格朗日函数。
根据交替方向乘子法的原理,可得到对应的增广拉格朗日函数ε,使用以下公式表示:



公式(2)中,Γ表示蛋白质间相互作用数据所对应的对称稀疏矩阵W中的非缺失值集合;M表示蛋白质的个数,D表示隐特征维数;wi,j表示蛋白质i与蛋白质j间相互作用值;ei,d∈E,表示隐特征矩阵E中第i个蛋白质所对应隐特征的第d个元素;fi,d∈F,表示隐特征矩阵F中第i个蛋白质所对应隐特征的第d个元素;fj,d∈F,表示隐特征矩阵F中第j个蛋白质所对应隐特征的第d个元素;gi∈G,表示线性偏差向量G的第i个元...

【专利技术属性】
技术研发人员:陈际秋钟裕荣吴昊袁野
申请(专利权)人:中国科学院重庆绿色智能技术研究院重庆大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1