【技术实现步骤摘要】
蛋白质预测模型的生成方法、装置、设备和存储介质
本申请涉及生物信息
,特别是涉及一种蛋白质预测模型的生成方法、装置、设备及存储介质。
技术介绍
通常,在蛋白质中,一些蛋白质具有跟其他物质(例如:糖类、脂质、脱氧核糖核酸(英文:DeoxyribonucleicAcid,简称:DNA)或核糖核酸(英文:RibonucleicAcid,简称:RNA))发生作用的能力,该类蛋白质也被称为该物质结合蛋白质,例如:如果蛋白质序列中具有和糖类分子结合的位点,那么,可以认为该蛋白质可以和糖类发生作用,该蛋白质即为糖类结合蛋白质。快速有效的识别出这些物质结合蛋白质,对于蛋白质分析、分类以及其他研究具有重要意义。目前,通常需要借助X射线或核磁共振等方式,通过人工实验去识别蛋白质是否为物质结合蛋白质,耗费大量人力和物力资源,识别效率较低。
技术实现思路
为了解决上述技术问题,本申请实施例提供了一种蛋白质预测模型的生成方法、装置、设备及存储介质,生成用于预测蛋白质和其他物质结合功能的预测模型,通过借助该预测模型,能 ...
【技术保护点】
1.一种蛋白质预测模型的生成方法,其特征在于,包括:/n获取多个第一蛋白质,每个所述第一蛋白质均包括第一位点和第二位点,所述第一位点为与目标物质发生结合作用的位点;/n提取每个所述第一位点对应的第一特征向量和每个所述第二位点对应的第二特征向量;/n利用所述第一特征向量和所述第二特征向量训练预先构建的初始预测模型,生成目标预测模型,所述目标预测模型用于预测蛋白质中的位点是否具有和所述目标物质结合的功能。/n
【技术特征摘要】
1.一种蛋白质预测模型的生成方法,其特征在于,包括:
获取多个第一蛋白质,每个所述第一蛋白质均包括第一位点和第二位点,所述第一位点为与目标物质发生结合作用的位点;
提取每个所述第一位点对应的第一特征向量和每个所述第二位点对应的第二特征向量;
利用所述第一特征向量和所述第二特征向量训练预先构建的初始预测模型,生成目标预测模型,所述目标预测模型用于预测蛋白质中的位点是否具有和所述目标物质结合的功能。
2.根据权利要求1所述的方法,其特征在于,所述第一特征向量的数量和所述第二特征向量的数量相同。
3.根据权利要求1所述的方法,其特征在于,所述提取每个所述第一位点对应的第一特征向量和每个所述第二位点对应的第二特征向量,包括:
利用蛋白质对比工具获得各所述第一蛋白质对应的第一位置特异性得分矩阵PSSM;
以各所述第一蛋白质的每个所述第一位点为中心,基于所述第一PSSM向外扩展预设长度,得到各所述第一位点对应的所述第一特征向量;
以各所述第一蛋白质的每个所述第二位点为中心,基于所述第一PSSM向外扩展所述预设长度,得到各所述第二位点对应的所述第二特征向量。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取待预测的第二蛋白质,所述第二蛋白质包括N个位点,N为大于1的整数;
提取所述第二蛋白质的第i位点对应的第i特征向量,其中,i=1,2,…,N;
根据所述第i特征向量和所述目标预测模型,获得第i预测结果,所述第i预测结果用于表征所述第i位点是否具有和所述目标物质结合的功能;
当所述第i预测结果表征所述第i位点具有和所述目标物质结合的功能,则,确定所述第二蛋白质为能够和所述目标物质结合的蛋白质。
5.根据权利要求4所述的方法,其特征在于,...
【专利技术属性】
技术研发人员:汤一凡,崔朝辉,赵立军,张霞,
申请(专利权)人:东软集团股份有限公司,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。