一种面向天线罩代理模型的神经网络架构搜索方法技术

技术编号:43539400 阅读:18 留言:0更新日期:2024-12-03 12:21
本发明专利技术公开了一种面向天线罩代理模型的神经网络架构搜索方法,包括以下步骤;向神经网络模型中输入训练集、验证集、预测集、搜索空间参数;训练神经网络模型;计算多任务冲突矩阵;根据多任务冲突矩阵计算指示矩阵;根据计算后的指示矩阵生成调制模块;判断当前神经网络模型是否满足最大模型限制;将调制模块添加至神经网络模型中;使用训练集对新添加的调制模块进行训练,完成预训练;输出并保存当前神经网络模型架构及其参数;将待检测的天线罩样本输入训练好的神经网络模型中;根据读入的待检测的天线罩样本生成预测值,输出预测结果。本发明专利技术有效缓解了梯度冲突,灵活实现了模型架构搜索,可用于后续的详细优化过程。

【技术实现步骤摘要】

本专利技术属于天线罩,具体涉及一种面向天线罩代理模型的神经网络架构搜索方法


技术介绍

1、天线罩代理模型技术是一种用来代替天线罩复杂电性能分析的技术,其在天线罩的设计和优化中至关重要。为了保证在工程周期内能够根据所给定需求快速做出设计决策,多任务学习(mtl)通过知识共享同时解决多个相关任务,提供了一种有效的方法。然而,阻碍其应用的一个关键问题是任务干扰问题,即不同任务之间相互竞争,导致优化过程中的梯度冲突和负迁移。

2、yu等在文献“gradient surgery for multi-task learning(advances inneural information processing systems,2020)”提出通过操纵梯度/损失在竞争任务之间取得平衡的方法。梯度操作技术是调整梯度方向,删除部分梯度矢量并旋转共享特征,将设置的梯度方向与任一任务的梯度不冲突,然而这忽略了帕累托平稳点的性质。

3、yue等在文献“learning conflict-noticed architecture for multi-task本文档来自技高网...

【技术保护点】

1.一种面向天线罩代理模型的神经网络架构搜索方法,其特征在于,包括以下步骤;

2.根据权利要求1所述的一种面向天线罩代理模型的神经网络架构搜索方法,其特征在于,所述步骤(1)中,向神经网络模型中先后分别输入训练数据集Dtrain、验证数据集Dval、预测数据集Dpre的数据参数,神经网络的共享层结构fS、调制模块hi,j、最大模型容量限制、梯度冲突阈值的神经网络结构参数,训练轮次、学习步长、检测次数的神经网络训练参数。

3.根据权利要求2所述的一种面向天线罩代理模型的神经网络架构搜索方法,其特征在于,所述步骤(2)中,初始化训练集以及共享层网络,利用训练集训练共享...

【技术特征摘要】

1.一种面向天线罩代理模型的神经网络架构搜索方法,其特征在于,包括以下步骤;

2.根据权利要求1所述的一种面向天线罩代理模型的神经网络架构搜索方法,其特征在于,所述步骤(1)中,向神经网络模型中先后分别输入训练数据集dtrain、验证数据集dval、预测数据集dpre的数据参数,神经网络的共享层结构fs、调制模块hi,j、最大模型容量限制、梯度冲突阈值的神经网络结构参数,训练轮次、学习步长、检测次数的神经网络训练参数。

3.根据权利要求2所述的一种面向天线罩代理模型的神经网络架构搜索方法,其特征在于,所述步骤(2)中,初始化训练集以及共享层网络,利用训练集训练共享层网络并使用早停策略至收敛;

4.根据权利要求3所述的一种面向天线罩代理模型的神经网络架构搜索方法,其特征在于,所述步骤(3)中,对步骤(2)中得到的训练后的神经网络模型利用验证集计算多任务梯...

【专利技术属性】
技术研发人员:张树新钟颖谭育正李鹏张文武袁航许万业王伟
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1