【技术实现步骤摘要】
蛋白质序列的水解位点预测方法及装置、设备、存储介质
[0001]本专利技术属于生物信息学
,具体涉及一种蛋白质序列的水解位点预测方法及装置、设备、存储介质。
技术介绍
[0002]蛋白质被认为是人体内所有物质中最活跃和最多样化的分子,它们能够催化各类生物化学反应,在各项生命活动中扮演者重要的作用,这意味着其在缓解并治疗疾病等方面具有十分重要意义。蛋白质在治疗领域具有众多的优势,首先,蛋白质通常具有高度复杂的功能,而这些功能是简单的化学物质无法模仿的。第二,由于蛋白质的作用具有高度的特异性,因此蛋白质治疗剂干扰正常生物过程和引起不良反应的可能性通常较小。第三,由于人体自然产生许多被用作治疗的蛋白质,这些药剂通常具有良好的耐受性,不太可能引起免疫反应。正是由于上述优点,人们对于蛋白质在医疗领域的探索一直以来是一个热点,尤其在近几年以来,随着计算机算力的提升,人们已经越发的关注如何针对特定疾病人为设计蛋白质序列并用于治疗领域。
[0003]由于各种蛋白酶介导的蛋白分解是细胞内和细胞外普遍存在的,在设计蛋白质序列时不可 ...
【技术保护点】
【技术特征摘要】
1.蛋白质序列的水解位点预测方法,其特征在于,包括:计算所述蛋白质序列的特征矩阵和VHSE描述向量;所述VHSE描述向量用于表示所述蛋白质序列的亲疏水特性、几何特性和电荷特性;根据所述特征矩阵和所述VHSE描述向量,计算获得所述蛋白质序列各个位点的先验裂解概率;获取所述蛋白质序列的目标位置特异性矩阵;根据所述目标位置特异性矩阵,计算所述蛋白质序列各个位点的第一概率和第二概率;根据所述第一概率、所述第二概率和所述先验裂解概率,利用贝叶斯公式计算获得所述蛋白质序列各个位点的预测裂解概率;将所述预测裂解概率达到指定概率阈值的位点确定为水解位点。2.如权利要求1所述的蛋白质序列的水解位点预测方法,其特征在于,根据所述特征矩阵和所述VHSE描述向量,计算获得所述蛋白质序列各个位点的先验裂解概率,包括:对所述特征矩阵进行卷积计算,获得第一矩阵;根据所述VHSE描述向量学习得到权重参数和偏置参数;根据所述权重参数和所述偏置参数,对第一矩阵进行更新获得第二矩阵;对所述第二矩阵进行特征提取,获得第三矩阵;根据所述第三矩阵的特征空间映射得到标签信息,并根据所述标签信息获得所述蛋白质序列各个位点的先验裂解概率。3.如权利要求1所述的蛋白质序列的水解位点预测方法,其特征在于,获取所述蛋白质序列的目标位置特异性矩阵,包括:获取所述蛋白质序列的多序列比对数据;根据所述多序列比对数据,计算得到第一位置特异性矩阵;将所述第一位置特异性矩阵作为目标位置特异性矩阵。4.如权利要求3所述的蛋白质序列的水解位点预测方法,其特征在于,根据所述多序列比对数据,计算得到第一位置特异性矩阵之后,所述方法还包括:对所述特征矩阵进行特征提取,获得所述蛋白质序列的局部特征信息;根据所述特征矩阵和所述第一位置特异性矩阵进行特征编码,获得相互作用特征信息;根据所述局部特征信息和所述相互作用特征信息,获得第二位置特异性矩阵;以及,将所述第一位置特异性矩阵作为目标位置特异性矩阵,包括:将所述第二位置特异性矩阵作为目标位置特异性矩阵。5.蛋白质序列的水解位点预测装置,其特征在于,包括:第一计算单元,用于计算所述蛋白质序列的特征矩阵和VHSE描述向量;所述VHSE描述向量用于表示所述蛋白质序列的亲疏水特性、几何特性和电荷特性;第二计算单元,用于根据所述特征矩阵和所述VHSE描述向量,计算获得所述蛋白质序列各个位点的先验裂解概率;获取单元,用于获取所述蛋...
【专利技术属性】
技术研发人员:万季,汪健,沈一鸣,潘有东,赵钊,王弈,
申请(专利权)人:北京新合睿恩生物医疗科技有限公司深圳市新合生物医疗科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。