【技术实现步骤摘要】
获取目标网络模型的方法、装置、计算机设备及存储介质
[0001]本专利技术涉及人工智能算法
,尤其涉及一种获取目标网络模型的方法、装置、计算机设备及存储介质。
技术介绍
[0002]随着深度学习的应用领域不断增加,深度学习网络模型的功能复杂性也日益增加,虽然采用该网络模型进行识别或者分类的准确率提高了,但是,模型的结构和容量不断提升,而与之使用配套的硬件要求也面临复杂化,因此,也就无法应用在小型化产品上。
[0003]因此,如何降低网络模型的复杂性,以确保其性能是目前亟待解决的技术问题。
技术实现思路
[0004]鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的获取目标网络模型的方法、装置、计算机设备以及存储介质。
[0005]第一方面,本专利技术提供了一种获取目标网络模型的方法,包括:
[0006]获取教师网络模型和学生网络模型,所述学生网络模型为所述教师网络模型简化后的模型;
[0007]在所述学生网络模型中,在初始相邻的两个卷积层之 ...
【技术保护点】
【技术特征摘要】
1.一种获取目标网络模型的方法,其特征在于,包括:获取教师网络模型和学生网络模型,所述学生网络模型为所述教师网络模型简化后的模型;在所述学生网络模型中,在初始相邻的两个卷积层之间增加残差结构,得到目标网络模型,以使得训练数据集经过所述目标网络模型中的第一个卷积层之后得到的卷积数据集中,部分卷积数据集经过所述残差结构的处理之后加权至剩余卷积数据集中,使得所述卷积数据集的局部特征增强,进而输入第二个卷积层中。2.如权利要求1所述的方法,其特征在于,所述残差结构包括:第一层消除影响层,用于对所述部分卷积数据集中的第一异常数据进行消除;残差处理层,用于对消除异常数据之后的部分卷积数据进行数据增强,并加权至剩余卷积数据集中,得到局部特征增强的卷积数据集;第二层消除影响层,用于对所述局部特征增强的卷积数据集中的第二异常数据进行消除。3.如权利要求1所述的方法,其特征在于,所述残差结构,具体用于:对部分卷积数据进行特征增强,得到特征增强数据:v2=∑
i
p
i2
/c其中,p
i
为部分卷积数据集中任一向量中的任一数据,c为部分卷积数据集的通道数,v2为部分卷积数据集中任一向量的均方计算结果,p
i
′
为对所述均方计算结果经过归一化处理后得到的向量集中的任一向量,γ和β为可训练的超参数,∈为防止分母为零的正数;将所述归一化后得到的向量集中的任一向量与剩余卷积数据集中相同位置数据进行融合,得到局部特征增强的卷积数据集。4.如权利要求1所述的方法,其特征在于,在所述学生网络模型中,在初始相邻的两个卷积层之间增加残差结构,得到目标网络模型之后,还包括:获取所述目标网络模型与所述教师网络模型之间的局部特征相似性差异、输出差异以及所述目标网络模型与真实目标的差异;基于所述目标网络模型与所述教师网络模型之间的局部特征相似性差异、输出差异以及所述目标网络模型与真实目标的差异,确定所述目标网络模型的网络总损失。5.如权利要求4所述的方法,其特征在于,所述获取所述目标网络模型与所述教师网络模型之间的局部特征相似性差异,包括:获取所述目标网络模型的多个第一特征输出以及所述教师网络模型中相同位置的第二特征输出;基于所述第一特征输出和第二特征输出,确定所述目标网络模型与所述教师网络...
【专利技术属性】
技术研发人员:江宁,卿海峰,石璐瑶,吴文青,
申请(专利权)人:西南科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。