神经网络模型自动生成方法、系统、电子设备及存储介质技术方案

技术编号:37790029 阅读:18 留言:0更新日期:2023-06-09 09:20
本发明专利技术提供一种自动生成神经网络模型的方法(100),应用于计算机领域,该方法(100)包括:信息获取步骤(S101):获取神经网络模型信息;数据准备步骤(S102):对获取到的神经网络模型信息进行编码,以得到神经网络模型信息编码序列;以及模型训练步骤(S103):将神经网络模型信息编码序列作为神经网络生成模型的输入数据进行训练,以得到神经网络生成模型NNGM。本发明专利技术提供的自动生成神经网络模型的方法,可实现自动根据对业务应用的理解设计相应的神经网络模型,以及对已有神经网络模型的迁移学习。该方法可降低神经网络模型设计的门槛,提高设计效率,同时复用已有的知识和经验,助力推动AI的规模化应用。还提供了相应的系统、电子设备及存储介质。电子设备及存储介质。电子设备及存储介质。

【技术实现步骤摘要】
神经网络模型自动生成方法、系统、电子设备及存储介质


[0001]本专利技术涉及计算机领域,尤其涉及一种自动生成神经网络模型的方法以及相应的系统、电子设备和存储介质。

技术介绍

[0002]数字经济快速发展的当下,各行各业都在追求数字化转型,企业实施数字化转型的基本思想是借助数字技术来改善业务流程,提高作业效率,挖掘数据价值。人工智能技术通过对算力、算法和数据等数字资源进行整合利用,实现机器代替人工作业,正加速在各行各业的深度融合和落地应用。然而企业在推进人工智能的探索应用中遇到的关键难题是AI专业人才的缺乏。
[0003]对于机器学习的新手而言,使用机器学习算法的一个主要的障碍就是算法的性能受许多的设计决策影响。随着深度学习的流行,AI工程师需要选择相应的神经网络架构,超参数,训练过程,正则化方法等,所有的这些因素都对算法的性能有很大的影响。
[0004]目前神经网络模型的设计主要依赖人工,需要根据对业务应用的理解对神经网络模型进行设计和训练,人力成本耗费较高。自动机器学习技术的引入使用自动化的数据驱动方式在模型设计过程中进行决本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种自动生成神经网络模型的方法(100),包括:信息获取步骤(S101):获取神经网络模型信息;数据准备步骤(S102):对获取到的神经网络模型信息进行编码,以得到神经网络模型信息编码序列;以及模型训练步骤(S103):将所述神经网络模型信息编码序列作为神经网络生成模型的输入数据进行训练,以得到神经网络生成模型NNGM。2.根据权利要求1所述的方法(100),其特征在于,所述信息获取步骤(S101)包括:模型资料收集步骤(S1011):收集模型资料;和元素解析步骤(S1012):对收集到的模型资料进行元素解析标注,以获取所述神经网络模型信息;并且在所述数据准备步骤(S102)中,将在所述元素解析步骤(S1012)中解析到的神经网络模型信息进行编码以获得神经网络模型信息编码,并且由所述神经网络模型信息编码和元素分隔符编码共同拼接构成所述神经网络模型信息编码序列。3.根据权利要求2所述的方法(100),其特征在于,所述神经网络模型信息包括模型应用信息、模型类型信息、模型结构信息、模型超参数信息以及模型训练信息,并且所述神经网络模型信息编码包括模型应用信息编码、模型类型信息编码、模型结构信息编码、模型超参数信息编码和模型训练信息编码。4.根据权利要求3所述的方法(100),其特征在于,所述模型应用信息包括行业类型、数据类型;所述模型类型信息包括领域类型、场景类型;所述模型结构信息包括多个结构单元信息,结构单元信息包括结构单元类型和结构参数数值;所述模型超参数信息包括超参数类型和超参数数值;以及所述模型训练信息包括损失函数、评估指标。5.根据权利要求4所述的方法(100),其特征在于,所述行业类型包括社交、零售、交通、医疗、教育、家居、安防,所述数据类型包括文本数据、图像数据、语音数据、图数据;所述领域类型包括CNN、RNN、DNN、GNN、GAN、NLP,所述场景类型包括CNN领域的目标检测、图像分类、目标识别、NLP领域的文本翻译、文本分类、实体识别、以及GNN领域的节点分类、链路预测、图分类;所述结构单元信息对应的结构单元包括卷积模块、池化模块、线性变换模块、激活函数模块、归一化模块、残差模块、聚合函数模块、组合函数模块,当所述结构单元为所述卷积模块时所述结构参数数值为M
×
N,其中M、N为大于0的整数;所述超参数类型包括学习率、epoch数、batch size,当所述超参数类型为所述学习率时所述超参数数值为0.01或0.005;以及所述损失函数包括MAE、MSE、Huber损失、LogLoss、交叉熵损失函数,所述评估指数包括ACC、F1值、AUC、ROC、Recall。
6.根据权利要求5所述的方法(100),其特征在于,所述模型应用信息编码为A,A是长度为2的一维向量,该一维向量中的第一个值代表所述行业类型,第二个值代表所述数据类型;所述模型类型信息编码为B,B是长度为2的一维向量,该一维向量中的第一个值代表所述领域类型,第二个值代表所述场景类型;所述模型结构信息编码为C,C是由多个结构单元信息编码C
ms
和模型结构分隔符编码C
sc
拼接构成的编码序列,其中所述结构单元信息编码C
ms
是长度为2的一维向量,该一维向量中的第一个值代表所述结构单元类型,第二个值代表所述结构参数数值,并且所述模型结构分隔符编码C
sc
是长度为2的一维向量,该一维向量中的第一个值代表模型结构分...

【专利技术属性】
技术研发人员:郭熹贺鸣张珂珂程新洲
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1