结构识别模型训练、模型结构识别方法、设备及介质技术

技术编号：40537643 阅读：28 留言：0更新日期：2024-03-01 14:00

本发明专利技术实施例公开了一种结构识别模型训练、模型结构识别方法、设备及介质，包括：将目标结构模型转换为静态图结构数据；其中，所述静态图结构数据包括目标结构模型的算子节点，以及各所述算子节点之间的数据流向边；对所述静态图结构数据中的各算子节点和数据流向边进行特征编码，得到静态图编码信息，其中，所述静态图编码信息包括算子节点对应的节点编码和数据流向边对应的邻接矩阵；根据所述静态图编码信息构建模型训练样本数据；根据所述模型训练样本数据训练图神经网络模型；其中，训练完成的图神经网络模型用于识别网络模型的结构。本发明专利技术实施例的技术方案能够提高模型结构的识别精度和识别效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术实施例涉及人工智能，尤其涉及一种结构识别模型训练、模型结构识别方法、装置、电子设备及存储介质。

技术介绍

1、目前，各种网络模型的结构变化越来越复杂，尤其llm（large language model，大语言模型）更是不断涌现出新的结构，如attention（注意力机制）和moe（mixture ofexperts，混合专家模型）等，同时，其他类型的模型如diffusion（扩散模型）以及gan（generative adversarial network，生成对抗网络）等及其变种的文生图/文生视频类模型，模型结构也在不断更新。在ai（artificial intelligence，人工智能）芯片上提高模型性能的关键在于如何快速高效地进行新型结构模型的图优化和图编译。传统的人工操作在识别复杂度高的模型结构时往往耗时耗力，且识别精度较低，无法自动化地分析模型结构以进行图优化、图编译和实现高效的硬件执行。

2、专利技术人在实现本专利技术的过程中发现：现有的图优化框架直接对网络模型的计算图进行优化，不具备模型结构的识别...

【技术保护点】

1.一种结构识别模型训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述将目标结构模型转换为静态图结构数据，包括：

3.根据权利要求1所述的方法，其特征在于，所述对所述静态图结构数据中的各算子节点和数据流向边进行特征编码，包括：

4.根据权利要求3所述的方法，其特征在于，所述目标结构模型的数量为多个，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述根据所述静态图编码信息构建模型训练样本数据，包括：

6.一种模型结构识别方法，其特征在于，包括：

7.根据权利要求6所述的方法，其特...

【技术特征摘要】

1.一种结构识别模型训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述将目标结构模型转换为静态图结构数据，包括：

3.根据权利要求1所述的方法，其特征在于，所述对所述静态图结构数据中的各算子节点和数据流向边进行特征编码，包括：

4.根据权利要求3所述的方法，其特征在于，所述目标结构模型的数量为多个，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述根据所述静态图编码信息构建模型训练样本数据，包括：

6.一种模型结构识别方法，其特征在于，包括：

7.根据权...

【专利技术属性】
技术研发人员：郭敬明，刘晶晶，刘彦，胡侨娟，李翔，
申请(专利权)人：北京燧原智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人