一种基于泰勒展开的神经网络架构搜索方法及系统技术方案

技术编号：38756893 阅读：9 留言：0更新日期：2023-09-10 09:42

本发明专利技术提出了一种基于泰勒展开的神经网络架构搜索方法及系统，涉及神经网络领域。一种基于泰勒展开的神经网络架构搜索方法，其包括如下步骤，将DARTS

全部详细技术资料下载

【技术实现步骤摘要】
一种基于泰勒展开的神经网络架构搜索方法及系统

[0001]本专利技术涉及神经网络领域，具体而言，涉及一种基于泰勒展开的神经网络架构搜索方法及系统。

技术介绍

[0002]随着深度学习技术的发展，较多的人工智能技术被应用到了日常生活当中，比如，疫情期间的人脸检测技术，手机助手的语音识别。这些人工智能技术虽然在很大程度上方便了人们的生活，但是在人脸检测模型的构建过程中，花费了算法工程师较多的时间。为进一步缩短算法工程师在模型构建方面所花费的时间，较多的学者开始研究基于泰勒展开的神经网络架构搜索，旨在通过设定搜索空间(定义网络所有可选架构和操作)，搜索策略(通过策略来引导模型找到最优的网络结构)以及性能评估方式来实现高性能网络结构的自动化搜索。
[0003]目前在基于泰勒展开的神经网络架构搜索方法，较为常用的方法是可微分架构搜索方法Darts，Darts搜索空间的定义如图1所示，Darts定义整个网络由几个cell组合而来，其中如图1(a)所示，cell中由6条边组成，其中每条边的可选的op有8个，如图1(b)所示。8个op主要有3
×
3和5
×
5的可分离卷积(dil_sepc_3x3、dil_sepc_5x5)，3
×
3和5
×
5的扩张可分离卷积(dua_sepc_3x3、dua_sepc_5x5)，3
×
3最大池化(max_pool_3x3)，3
×
3平均池化(avg_pool_3x3)、跳过连接(ski...

【技术保护点】

【技术特征摘要】
1.一种基于泰勒展开的神经网络架构搜索方法，其特征在于，包括如下步骤，S1：将DARTS
‑
PT随机选择一条边开始进行离散，替换成根据的泰勒展开，来计算边的重要性，如下列等式二所示，重要性，如下列等式二所示，重要性，如下列等式二所示，重要性，如下列等式二所示，表示选择第i条边进行离散时对应的值，表示第i条边进行离散前对应的值，表示超网中值为的一阶导，表示超网中值为的二阶导；S2：确定从哪条边开始进行离散后，衡量op重要性，选择最重要的op。2.如权利要求1所述的一种基于泰勒展开的神经网络架构搜索方法，其特征在于，步骤S1中，假设Darts
‑
pt对一个cell只有三条边，三个op的空间开始进行离散时，对应的离散前的值如等式三所示，分别计算的值，选择abs[最大值对应的边，确定从哪条边开始进行离散，的示例分别如等式四至等式六所示，的示例分别如等式四至等式六所示，的示例分别如...

【专利技术属性】
技术研发人员：请求不公布姓名，
申请(专利权)人：天翼电子商务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人