【技术实现步骤摘要】
本专利技术涉及生物信息学,具体为一种生物肽活性数据分析方法及系统。
技术介绍
1、在当前生物肽活性分析的研究与应用中,普遍采用单一深度学习模型对肽序列进行建模与预测。这类方法通常通过固定的编码方式将原始肽序列转换为特征表示,并在统一模型结构中进行训练与推理。这种架构虽然在部分任务上取得了一定成果,但面对不同类型的肽序列数据,其建模能力显得相对有限。随着任务复杂性和数据异质性的增加,单一模型结构难以兼顾泛化能力与表达精度。
2、为提升整体性能,部分方案尝试采用多模型集成策略,将多个模型的预测结果进行融合,以期增强系统的稳定性。然而,常见的集成方式大多基于静态规则,如加权平均或多数投票,并未根据具体样本的特征状态动态调整模型组合方式。这样的处理逻辑在实际应用中往往导致资源利用率低,且融合效果对异常样本不具备适应能力。
3、在推理阶段,多模型结构的调用关系通常缺乏有效的路径规划机制。模型间的执行顺序预设为固定流程,无法结合输入数据的状态动态调整调用结构。当模型之间存在显著的差异性,例如计算复杂度不同或对样本特征的敏感性
...【技术保护点】
1.一种生物肽活性数据分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种生物肽活性数据分析方法,其特征在于,所述嵌入向量的生成采用预训练蛋白质语言模型实现,所述语言模型包括双向编码机制。
3.根据权利要求1所述的一种生物肽活性数据分析方法,其特征在于,所述概率模型为多维高斯分布,所述多维高斯分布的参数包括嵌入向量的均值和协方差矩阵。
4.根据权利要求1所述的一种生物肽活性数据分析方法,其特征在于,所述适配度指标基于每个模型在当前样本上的近似后验概率计算,所述近似后验概率通过变分推断方式获得。
5.根据权利
...【技术特征摘要】
1.一种生物肽活性数据分析方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种生物肽活性数据分析方法,其特征在于,所述嵌入向量的生成采用预训练蛋白质语言模型实现,所述语言模型包括双向编码机制。
3.根据权利要求1所述的一种生物肽活性数据分析方法,其特征在于,所述概率模型为多维高斯分布,所述多维高斯分布的参数包括嵌入向量的均值和协方差矩阵。
4.根据权利要求1所述的一种生物肽活性数据分析方法,其特征在于,所述适配度指标基于每个模型在当前样本上的近似后验概率计算,所述近似后验概率通过变分推断方式获得。
5.根据权利要求1所述的一种生物肽活性数据分析方法,其特征在于,所述模型路径图的路径代价由两个部分构成,一部分基于模型结构参数之间的空间距离,另一部分基于预测适配分布之间的相对熵度量。
6...
【专利技术属性】
技术研发人员:李欣磊,任杨,沙马佳驰,任柯宇,王睿崛,
申请(专利权)人:云南缮阳生物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。