System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及网络,尤其涉及一种模型训练方法、图像处理方法、交通管控方法及设备。
技术介绍
1、随着网络技术的飞速发展,由于轻量化网络模型能够在保持模型精度的基础上进一步减少模型参数量和复杂度,因此,轻量化网络模型的应用范围越来越广泛,例如:mobilenet、shufflenet等经典卷积神经网络结构被广泛应用于各类边缘设备中作为图像视频算法的基础网络结构。而vits(vision transformers)作为一种视觉transformers模型,自提出便成为了视觉领域的主流框架,特别是在海量数据和超大规模模型参数的加持下,其展现出了超越经典卷积神经网络(convolutional neural networks,简称cnns)框架的优异性能。
2、然而,对于轻量化的网络模型而言,由于模型容量和学习能力有限,从而降低了网络模型的处理性能。
技术实现思路
1、本申请实施例提供一种模型训练方法、图像处理方法、交通管控方法及设备,能够有效地保证轻量化网络模型的处理性能和质量。
2、第一方面,本申请实施例提供了一种模型训练方法,包括:
3、获取待训练的神经网络模型,所述神经网络模型包括至少一个线性层;
4、确定与所述神经网络模型相对应的重参数化模块,其中,所述重参数化模块为用于实现提取特征操作的多分支结构;
5、利用所述重参数化模块替换所述神经网络模型中的任意一个线性层,获得替换后网络模型;
6、基于所述替换后网络模型
7、第二方面,本申请实施例提供了一种模型训练装置,包括:
8、第一获取模块,用于获取待训练的神经网络模型,所述神经网络模型包括至少一个线性层;
9、第一确定模块,用于确定与所述神经网络模型相对应的重参数化模块,所述重参数化模块为用于实现提取特征操作的多分支结构;
10、第一处理模块,用于利用所述重参数化模块替换所述神经网络模型中的任意一个线性层,获得替换后网络模型;
11、第一训练模块,用于基于所述替换后网络模型进行模型训练操作,获得用于实现预设训练任务的目标网络模型。
12、第三方面,本申请实施例提供了一种电子设备,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第一方面所示的模型训练方法。
13、第四方面,本专利技术实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第一方面所示的模型训练方法。
14、第五方面,本专利技术实施例提供了一种计算机程序产品,包括:计算机程序,当所述计算机程序被电子设备的处理器执行时,使所述处理器执行上述第一方面所示的模型训练方法中的步骤。
15、第六方面,本申请实施例提供了一种图像处理方法,包括:
16、获取待处理图像;
17、确定用于对所述待处理图像进行分析处理的目标网络模型,所述目标网络模型基于上述第一方面所示的方法训练所获得;
18、利用所述目标网络模型对所述待处理图像进行分析处理,获得图像处理结果。
19、第七方面,本申请实施例提供了一种图像处理装置,包括:
20、第二获取模块,用于获取待处理图像;
21、第二确定模块,用于确定用于对所述待处理图像进行分析处理的目标网络模型,所述目标网络模型基于上述第一方面所示的方法训练所获得;
22、第二处理模块,用于利用所述目标网络模型对所述待处理图像进行分析处理,获得图像处理结果。
23、第八方面,本申请实施例提供了一种电子设备,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第六方面所示的图像处理方法。
24、第九方面,本专利技术实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第六方面所示的图像处理方法。
25、第十方面,本专利技术实施例提供了一种计算机程序产品,包括:计算机程序,当所述计算机程序被电子设备的处理器执行时,使所述处理器执行上述第六方面所示的图像处理方法中的步骤。
26、第十一方面,本申请实施例提供了一种交通管控方法,包括:
27、获取待处理的车流图像;
28、确定用于对所述车流图像进行分析处理的目标网络模型,所述目标网络模型基于上述第一方面所示的方法训练所获得;
29、利用所述目标网络模型对所述车流图像进行处理,获得车辆通行信息,所述车辆通行信息包括:在设定时间内通过的车辆数量、车辆在设定时间段内的平均通行车速;
30、基于所述车辆通行信息进行交通管控操作。
31、第十二方面,本申请实施例提供了一种交通管控装置,包括:
32、第三获取模块,用于获取待处理的车流图像;
33、第三确定模块,用于确定用于对所述车流图像进行分析处理的目标网络模型,所述目标网络模型基于上述第一方面所示的方法训练所获得;
34、第三处理模块,用于利用所述目标网络模型对所述车流图像进行处理,获得车辆通行信息,所述车辆通行信息包括:在设定时间内通过的车辆数量、车辆在设定时间段内的平均通行车速;
35、第三管控模块,用于基于所述车辆通行信息进行交通管控操作。
36、第十三方面,本申请实施例提供了一种电子设备,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第十一方面所示的交通管控方法。
37、第十四方面,本专利技术实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第十一方面所示的交通管控方法。
38、第十五方面,本专利技术实施例提供了一种计算机程序产品,包括:计算机程序,当所述计算机程序被电子设备的处理器执行时,使所述处理器执行上述第十一方面所示的交通管控方法中的步骤。
39、本申请实施例提供的模型训练方法、图像处理方法、交通管控方法及设备,通过获取待训练的神经网络模型,确定与所述神经网络模型相对应的重参数化模块,而后利用所述重参数化模块替换所述神经网络模型中的任意一个线性层,获得替换后网络模型;而后在基于由重参数化模块所构成的替换后网络模型进行模型训练操作时,可以稳定地获得用于实现预设训练任务的目标网络模型,由于重参数化模块为用于实现提取特征操作的多分支结构,进而有效地增加了模型训练过程中所对应的模型训练数据量,并且,由于模型的拟合能力与模型训练的数据量呈正相关,即数据量越多,模型的拟合能力越强,进而也有效地提升了网络模型中线性层的拟合能力,即提高了网络模型的模型容量和学习能力,因此,上述过程不仅有效地提高本文档来自技高网...
【技术保护点】
1.一种模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求2所述的方法,其特征在于,利用所述重参数化模块替换所述神经网络模型中的任意一个线性层,获得替换后网络模型,包括:
4.根据权利要求3所述的方法,其特征在于,基于所述输入数据,确定所述重参数化模块的输出特征,包括:
5.根据权利要求2所述的方法,其特征在于,基于所述替换后网络模型进行模型训练操作,获得用于实现预设训练任务的目标网络模型,包括:
6.根据权利要求5所述的方法,其特征在于,将所述中间网络模型中的重参数化模块还原为线性层,获得训练好的神经网络模型,包括:
7.根据权利要求6所述的方法,其特征在于,对所述重参数化模块中的每个分支结构中包括的各个子单元进行合并,获得与多个分支结构各自对应的分支线性层,包括:
8.根据权利要求7所述的方法,其特征在于,对所述重参数化模块中的位于同一个组合子单元中的线性子层和批量归一化子层进行合并处理,获得合并线性层,包括:
9.根据权利要求6所述的方
10.根据权利要求6所述的方法,其特征在于,在所述替换后网络模型是利用预设的批量归一化层进行矫正之后所确定时,基于所述还原线性层,获得训练好的目标网络模型,包括:
11.根据权利要求6所述的方法,其特征在于,在所述替换后网络模型是利用预设系数进行矫正之后所确定时,基于所述还原线性层,获得训练好的目标网络模型,包括:
12.根据权利要求1-11中任意一项所述的方法,其特征在于,
13.一种图像处理方法,其特征在于,包括:
14.一种交通管控方法,其特征在于,包括:
15.根据权利要求14所述的方法,其特征在于,所述方法还包括:
16.一种电子设备,其特征在于,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如权利要求1-15中任意一项所述的方法。
...【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求2所述的方法,其特征在于,利用所述重参数化模块替换所述神经网络模型中的任意一个线性层,获得替换后网络模型,包括:
4.根据权利要求3所述的方法,其特征在于,基于所述输入数据,确定所述重参数化模块的输出特征,包括:
5.根据权利要求2所述的方法,其特征在于,基于所述替换后网络模型进行模型训练操作,获得用于实现预设训练任务的目标网络模型,包括:
6.根据权利要求5所述的方法,其特征在于,将所述中间网络模型中的重参数化模块还原为线性层,获得训练好的神经网络模型,包括:
7.根据权利要求6所述的方法,其特征在于,对所述重参数化模块中的每个分支结构中包括的各个子单元进行合并,获得与多个分支结构各自对应的分支线性层,包括:
8.根据权利要求7所述的方法,其特征在于,对所述重参数化模块中的位于同一个组合子单元中的线性子层和批量归一化子层进行合并处理,获得合并线性层,包括:
【专利技术属性】
技术研发人员:谭振涛,吴岳,叶杰平,
申请(专利权)人:杭州阿里云飞天信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。