当前位置: 首页 > 专利查询>深圳大学专利>正文

一种噬菌体预测方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:41710258 阅读:17 留言:0更新日期:2024-06-19 12:40
本申请提供了一种噬菌体预测方法、装置、电子设备及可读存储介质。所述方法包括:获取待预测噬菌体向量,待预测噬菌体向量包括至少两个第一氨基酸词元向量,词元向量包括表征内容的词嵌入向量和表征位置的位置嵌入向量;将待预测噬菌体向量输入至已训练的预测模型,获得已训练的预测模型根据第一语义向量确定并输出的第一蛋白质类别,第一语义向量是已训练的预测模型根据提取的待预测噬菌体向量中各词元向量之间的关联信息确定的。本申请能够提取待预测噬菌体向量中各氨基酸之间的关联信息,并根据关联信息确定更能表征噬菌体的蛋白质的语义向量,能够自动化且准确预测噬菌体的蛋白质的类别,无需借助人工干预,提高预测模型的预测能力。

【技术实现步骤摘要】

本申请属于生物信息,尤其涉及一种噬菌体预测方法、装置、电子设备及可读存储介质


技术介绍

1、噬菌体为侵染细菌的病毒,由核酸和蛋白质构成。其中,噬菌体的蛋白质包括噬菌体结构蛋白和非结构蛋白两类。因噬菌体的结构蛋白在维持噬菌体的结构完整性以及感染宿主细菌的过程中发挥着关键作用,预测噬菌体结构蛋白有助于揭示噬菌体与细菌之间的相互作用,并为新型治疗药物的设计和噬菌体疗法的发展提供推动力。

2、但现有的噬菌体的蛋白质预测通常依赖于提取蛋白质序列的统计特征,导致预测方法需要人工干预,预测方法的预测性能较低。


技术实现思路

1、本申请实施例提供了一种噬菌体预测方法、装置、电子设备、可读存储介质及计算机程序产品,可以解决预测方法的预测性能较低的问题。

2、第一方面,本申请实施例提供了一种噬菌体预测方法,包括:

3、获取待预测噬菌体向量,所述待预测噬菌体向量包括至少两个第一氨基酸词元向量,词元向量包括表征内容的词嵌入向量和表征位置的位置嵌入向量;

4、将所述待预测噬菌体向量输入本文档来自技高网...

【技术保护点】

1.一种噬菌体预测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取待预测噬菌体向量,包括:

3.根据权利要求1或2所述的方法,其特征在于,将所述待预测噬菌体向量输入至已训练的预测模型之前,还包括:

4.根据权利要求3所述的方法,其特征在于,所述利用第一预设损失函数,根据各所述待遮蔽词元向量的所述第一词元类别和第一真实类别确定第一损失值,并根据所述第一损失值更新所述预测模型的参数之后,还包括:

5.根据权利要求4所述的方法,其特征在于,所述第一预设损失函数为交叉熵损失函数,所述第二预设损失函数为焦点损失函数。...

【技术特征摘要】

1.一种噬菌体预测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取待预测噬菌体向量,包括:

3.根据权利要求1或2所述的方法,其特征在于,将所述待预测噬菌体向量输入至已训练的预测模型之前,还包括:

4.根据权利要求3所述的方法,其特征在于,所述利用第一预设损失函数,根据各所述待遮蔽词元向量的所述第一词元类别和第一真实类别确定第一损失值,并根据所述第一损失值更新所述预测模型的参数之后,还包括:

5.根据权利要求4所述的方法,其特征在于,所述第一预设损失函数为交叉熵损失函数,所述第二预设损失函数为焦点损失函数。...

【专利技术属性】
技术研发人员:马里佳高鹏周文祥吉君恺林秋镇李坚强
申请(专利权)人:深圳大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1