【技术实现步骤摘要】
本专利技术实施例涉及人工智能,尤其涉及一种结构识别模型训练、模型结构识别方法、装置、电子设备及存储介质。
技术介绍
1、目前,各种网络模型的结构变化越来越复杂,尤其llm(large language model,大语言模型)更是不断涌现出新的结构,如attention(注意力机制)和moe(mixture ofexperts,混合专家模型)等,同时,其他类型的模型如diffusion(扩散模型)以及gan(generative adversarial network,生成对抗网络)等及其变种的文生图/文生视频类模型,模型结构也在不断更新。在ai(artificial intelligence,人工智能)芯片上提高模型性能的关键在于如何快速高效地进行新型结构模型的图优化和图编译。传统的人工操作在识别复杂度高的模型结构时往往耗时耗力,且识别精度较低,无法自动化地分析模型结构以进行图优化、图编译和实现高效的硬件执行。
2、专利技术人在实现本专利技术的过程中发现:现有的图优化框架直接对网络模型的计算图进行优化,不具备模型结构的识别
...【技术保护点】
1.一种结构识别模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述将目标结构模型转换为静态图结构数据,包括:
3.根据权利要求1所述的方法,其特征在于,所述对所述静态图结构数据中的各算子节点和数据流向边进行特征编码,包括:
4.根据权利要求3所述的方法,其特征在于,所述目标结构模型的数量为多个,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,所述根据所述静态图编码信息构建模型训练样本数据,包括:
6.一种模型结构识别方法,其特征在于,包括:
7.根据权利要
...【技术特征摘要】
1.一种结构识别模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述将目标结构模型转换为静态图结构数据,包括:
3.根据权利要求1所述的方法,其特征在于,所述对所述静态图结构数据中的各算子节点和数据流向边进行特征编码,包括:
4.根据权利要求3所述的方法,其特征在于,所述目标结构模型的数量为多个,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,所述根据所述静态图编码信息构建模型训练样本数据,包括:
6.一种模型结构识别方法,其特征在于,包括:
7.根据权...
【专利技术属性】
技术研发人员:郭敬明,刘晶晶,刘彦,胡侨娟,李翔,
申请(专利权)人:北京燧原智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。