【技术实现步骤摘要】
本专利技术涉及蛋白质,特别涉及一种蛋白质溶解度预测方法、装置、设备及介质。
技术介绍
1、蛋白质的一级结构,特别是氨基酸序列,是蛋白质溶解度的主要决定因素。许多研究表明,蛋白质的溶解度与基于序列的特征之间存在很强的相关性,例如:疏水延伸的存在、不同残基类型的组成和蛋白质序列的长度。因此,使用基于序列的信息来估计溶解度的预测技术在蛋白质工程研究界获得了相当大的关注。这些技术提供了通过预选最有前景的蛋白质序列来取代昂贵的实验程序的潜力。现有技术中,已经开发了许多基于机器学习的预测方法来使用基于序列的信息来估计蛋白质溶解度。这些方法采用了诸如支持向量机svm(support vector machine)、朴素贝叶斯和神经网络的模型,以及包含结构和生物特征的手工特征。通过优化各种生物工艺的设计,机器学习模型显著提高了溶解度预测的准确性。然而大多数现有的机器学习模型都是针对二元分类任务进行训练的,将数据集分类为可溶和不可溶类别,而不是提供更理想的连续溶解度值。在蛋白质工程领域,连续溶解度值比二元分类更重要,因为它们为下游任务提供了更多信息指导。
...【技术保护点】
1.一种蛋白质溶解度预测方法,其特征在于,包括:
2.根据权利要求1所述的蛋白质溶解度预测方法,其特征在于,所述将待预测蛋白质序列输入至目标蛋白质溶解度预测模型中的目标零样本特征学习模型之前,还包括:
3.根据权利要求2所述的蛋白质溶解度预测方法,其特征在于,所述利用所述完整溶解度数据库中的蛋白质数据对初始蛋白质溶解度预测模型进行模型训练,以得到基于蛋白质三维结构特征的目标蛋白质溶解度预测模型之前,还包括:
4.根据权利要求1所述的蛋白质溶解度预测方法,其特征在于,所述将待预测蛋白质序列输入至目标蛋白质溶解度预测模型中的目标零样本特
...【技术特征摘要】
1.一种蛋白质溶解度预测方法,其特征在于,包括:
2.根据权利要求1所述的蛋白质溶解度预测方法,其特征在于,所述将待预测蛋白质序列输入至目标蛋白质溶解度预测模型中的目标零样本特征学习模型之前,还包括:
3.根据权利要求2所述的蛋白质溶解度预测方法,其特征在于,所述利用所述完整溶解度数据库中的蛋白质数据对初始蛋白质溶解度预测模型进行模型训练,以得到基于蛋白质三维结构特征的目标蛋白质溶解度预测模型之前,还包括:
4.根据权利要求1所述的蛋白质溶解度预测方法,其特征在于,所述将待预测蛋白质序列输入至目标蛋白质溶解度预测模型中的目标零样本特征学习模型,以便通过所述目标零样本特征学习模型提取所述待预测蛋白质序列的生物特征和高级深度特征,包括:
5.根据权利要求1所述的蛋白质溶解度预测方法,其特征在于,所述利用所述目标蛋白质溶解度预测模型的特征加权模块对所述生物...
【专利技术属性】
技术研发人员:张慧锋,李加忠,于铁妹,潘俊锋,刘建,
申请(专利权)人:深圳瑞德林生物技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。