一种生物肽活性数据分析方法及系统技术方案

技术编号：46094893 阅读：11 留言：0更新日期：2025-08-12 18:13

本发明专利技术涉及生物信息学技术领域，公开了一种生物肽活性数据分析方法及系统，该方法包括：对输入的生物肽样本进行嵌入向量构建；基于嵌入表示，结合预设的候选模型集合，计算各模型与样本之间的适配概率；以模型为节点构建路径图结构，引入模型切换代价函数，基于适配概率与代价联合优化推理路径；执行路径中模型的推理流程，完成中间结果的顺序传递与调度控制；最终整合所有模型输出，生成生物肽活性预测结果。系统支持动态路径规划、推理过程容错与执行优化，提升了生物肽分析的精度与效率。该发明专利技术有效解决了现有方法中模型适配单一、资源利用低及执行流程不稳定的问题，具有良好的通用性与扩展能力。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及生物信息学，具体为一种生物肽活性数据分析方法及系统。

技术介绍

1、在当前生物肽活性分析的研究与应用中，普遍采用单一深度学习模型对肽序列进行建模与预测。这类方法通常通过固定的编码方式将原始肽序列转换为特征表示，并在统一模型结构中进行训练与推理。这种架构虽然在部分任务上取得了一定成果，但面对不同类型的肽序列数据，其建模能力显得相对有限。随着任务复杂性和数据异质性的增加，单一模型结构难以兼顾泛化能力与表达精度。

2、为提升整体性能，部分方案尝试采用多模型集成策略，将多个模型的预测结果进行融合，以期增强系统的稳定性。然而，常见的集成方式大多基于静态规则，如加权平均或多数投票，并未根据具体样本的特征状态动态调整模型组合方式。这样的处理逻辑在实际应用中往往导致资源利用率低，且融合效果对异常样本不具备适应能力。

3、在推理阶段，多模型结构的调用关系通常缺乏有效的路径规划机制。模型间的执行顺序预设为固定流程，无法结合输入数据的状态动态调整调用结构。当模型之间存在显著的差异性，例如计算复杂度不同或对样本特征的敏感性...

【技术保护点】

1.一种生物肽活性数据分析方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种生物肽活性数据分析方法，其特征在于，所述嵌入向量的生成采用预训练蛋白质语言模型实现，所述语言模型包括双向编码机制。

3.根据权利要求1所述的一种生物肽活性数据分析方法，其特征在于，所述概率模型为多维高斯分布，所述多维高斯分布的参数包括嵌入向量的均值和协方差矩阵。

4.根据权利要求1所述的一种生物肽活性数据分析方法，其特征在于，所述适配度指标基于每个模型在当前样本上的近似后验概率计算，所述近似后验概率通过变分推断方式获得。

5.根据权利要求1所述的一种生物...

【技术特征摘要】

1.一种生物肽活性数据分析方法，其特征在于，包括以下步骤：

5.根据权利要求1所述的一种生物肽活性数据分析方法，其特征在于，所述模型路径图的路径代价由两个部分构成，一部分基于模型结构参数之间的空间距离，另一部分基于预测适配分布之间的相对熵度量。

6...

【专利技术属性】
技术研发人员：李欣磊，任杨，沙马佳驰，任柯宇，王睿崛，
申请(专利权)人：云南缮阳生物科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人