一种混合专家多模态大模型特征融合方法及系统技术方案

技术编号：45099007 阅读：22 留言：0更新日期：2025-04-25 18:38

本发明专利技术提供了一种混合专家多模态大模型特征融合方法及系统，该方法包括：大模型的自回归预训练，对文本、图像和语音数据进行token化并预测下一个元素；大模型到小模型的蒸馏过程，通过软标签将大模型的知识传递给小模型；小模型扩容，通过增加多模态小模型和调整门控网络以处理更多样化的任务。在特征融合方面，采用token嵌入的自适应门控策略，实现不同模态之间的有效信息整合。本发明专利技术设计了多种多模态小模型，综合利用多个模态的大模型专家来完成任务，显著提升了模型性能、处理效率和任务普适性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及多模态机器学习领域，具体涉及一种混合专家多模态大模型特征融合方法及系统。

技术介绍

1、在自然语言处理和多模态机器学习领域，随着深度学习技术的迅速发展，基于transformer架构的大模型已经成为应对复杂任务的主要手段。然而，现有的大模型在处理多模态任务时，往往无法充分捕捉和融合不同模态间的信息。这种局限性导致模型在处理跨模态任务时，信息融合效果不佳，进而影响任务的整体性能。例如，在同时处理图像、文本和语音信息时，现有模型通常难以有效结合这些模态的信息，从而导致模型在复杂场景中的表现不尽如人意。

2、为了提升模型在多模态任务中的表现，研究人员提出了多种方法，如直接将多模态数据拼接输入模型或利用简单的注意力机制进行模态间的信息交互。然而，这些方法往往难以应对模态间信息不对齐的问题。具体来说，不同模态的数据在时序、尺度、甚至语义上都可能存在显著差异，直接进行信息融合可能导致重要信息的丢失或噪声的引入，从而影响模型的准确性和泛化能力。此外，现有的方法在处理大规模多模态数据时，也面临着计算效率和存储需求方面的挑战，难...

【技术保护点】

1.一种混合专家多模态大模型特征融合方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种混合专家多模态大模型特征融合方法，其特征在于，进行大模型到小模型的蒸馏过程，得到每个模态下的小模型，具体包括步骤：

3.根据权利要求2所述的一种混合专家多模态大模型特征融合方法，其特征在于，所述教师模型的soft labels为：

4.根据权利要求3所述的一种混合专家多模态大模型特征融合方法，其特征在于，所述步骤S2.3的蒸馏损失为：

5.根据权利要求4所述的一种混合专家多模态大模型特征融合方法，其特征在于，步骤S2.4的损失为：

...

【技术特征摘要】

1.一种混合专家多模态大模型特征融合方法，其特征在于，包括以下步骤：

3.根据权利要求2所述的一种混合专家多模态大模型特征融合方法，其特征在于，所述教师模型的soft labels为：

4.根据权利要求3所述的一种混合专家多模态大模型特征融合方法，其特征在于，所述步骤s2.3的蒸馏损失为：

5.根据权利要求4所述的一种混合专家多模态大模型特征融合方法，其特征在于，步骤s2.4的损失为：

6.根据权利要求1所述的一种混合专家...

【专利技术属性】
技术研发人员：周思远，周春云，朱玉鹤，包敏，乔运涛，
申请(专利权)人：扬州万方科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人