System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于知识蒸馏的实时车辆重识别方法、设备、存储介质技术_技高网

基于知识蒸馏的实时车辆重识别方法、设备、存储介质技术

技术编号:40668556 阅读:7 留言:0更新日期:2024-03-18 19:04
本发明专利技术涉及一种基于知识蒸馏的实时车辆重识别方法、设备、存储介质,方法包括如下步骤:构建轻量化的教师‑学生模型;基于多源数据集,对所述教师‑学生模型进行知识蒸馏训练;针对训练后的教师‑学生模型中的学生模型进行压缩和优化处理,并完成部署;获取输入的车辆图片信息,利用部署好的教师‑学生模型中的学生模型计算特征相似度,输出车辆的重识别结果。与现有技术相比,本发明专利技术具有模型推理和部署效率高、模型泛化性能良好、模型设计轻量化等优点。

【技术实现步骤摘要】

本专利技术涉及交通运输,尤其是涉及一种基于知识蒸馏的实时车辆重识别方法、设备、存储介质


技术介绍

1、现有的车辆重识别方法,通常的流程包括六个主要步骤:分别为构建数据集-构建重识别模型-模型训练-模型推理-特征相似度计算-重识别结果获取。

2、现有的车辆重识别方法主要在各公开数据集上进行精度的评估,倾向使用较大的深度学习模型来提升车辆重识别效果,很少有工作将重识别模型在移动端部署时所需的实时推理性能纳入考虑。当前的车辆重识别方法存在以下主要技术缺陷:

3、数据集偏向性:在数据准备阶段,当前的车辆重识别方法在模型评估中主要使用公开数据集,由于训练场景和测试场景存在分布差异,这可能导致模型在真实世界场景中的泛化能力不足。由于真实数据集的制作费时费力,对每个场景都制作大规模的车辆重识别数据集是不可接受的。

4、过度依赖大型深度学习模型:在构建模型阶段,现有方法通常采用大型深度学习模型,这些模型需要大量的计算资源和内存,不适合移动端或嵌入式设备;同时,大型模型的体积庞大,导致模型部署和存储成本高昂,不适用于资源受限的环境。

5、忽视实时推理性能:在模型推理阶段,大型深度学习模型通常需要较长的推理时间,这对于需要快速响应的实时应用(如交通监控和自动驾驶)来说是不可接受的;推理时间长不仅降低实时性能,还会影响其他系统功能的运行。

6、缺乏针对移动端的优化:在模型部署阶段,当前的车辆重识别方法缺乏对模型在移动设备上进行剪枝和量化的研究,以降低模型的计算复杂度。

7、综上,当前缺少一种考虑移动端部署的车辆重识别方法。


技术实现思路

1、本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种基于知识蒸馏的实时车辆重识别方法、设备、存储介质,以实现模型的高效推理和部署。

2、本专利技术的目的可以通过以下技术方案来实现:

3、本专利技术的一个方面,提供了一种基于知识蒸馏的实时车辆重识别方法,包括如下步骤:

4、构建轻量化的教师-学生模型;

5、基于多源数据集,对所述教师-学生模型进行知识蒸馏训练;

6、针对训练后的教师-学生模型中的学生模型进行压缩和优化处理,并完成部署;

7、获取输入的车辆图片信息,利用部署好的教师-学生模型中的学生模型计算特征相似度,输出车辆的重识别结果。

8、作为优选的技术方案,所述的教师-学生模型的构建过程包括:

9、分别构建教师子模型和学生子模型;

10、基于所述多源数据集对所述教师子模型进行预训练。

11、作为优选的技术方案,所述的教师子模型包括基于non-local非局部注意力机制的resnet101主干网络、ibn层以及广义平均池化聚合层。

12、作为优选的技术方案,所述的学生子模型包括resnet18主干网络、全局平均池化层和线性决策层。

13、作为优选的技术方案,所述的多源数据集包括大规模仿真驾驶场景车辆重识别数据集、真实公开数据集和真实应用场景的车辆重识别数据集。

14、作为优选的技术方案,对所述教师-学生模型进行知识蒸馏训练的过程包括:

15、基于所述多源数据集构建训练批次数据;

16、基于所述训练批次数据,利用教师-学生模型提取车辆重识别特征,并通过预测得到分类逻辑值和重识别特征;

17、基于所述分类逻辑值和重识别特征计算损失函数值,基于所述损失函数值调整教师-学生模型的参数,完成本轮训练。

18、作为优选的技术方案,利用图形处理高性能推理库实现教师-学生模型的压缩和优化处理。

19、作为优选的技术方案,所述的特征相似度的计算过程包括:

20、通过查询预先储存的车辆图片信息生成特征向量库;

21、针对所述输入的车辆图片信息,生成重识别特征向量;

22、计算重识别特征向量与特征向量库中各个向量的余弦相似度。

23、本专利技术的另一个方面,提供了一种基于知识蒸馏的实时车辆重识别设备,包括:

24、车辆充实别数据集准备模块,用于准备用于知识蒸馏训练的多源数据集;

25、模型构建模块,用于实现轻量化的教师-学生模型的构建;

26、教师-学生模型知识蒸馏模块,用于实现所述教师-学生模型的蒸馏训练;

27、模型推理模块,用于针对训练后的教师-学生模型进行压缩和优化处理;

28、特征相似度计算模块,用于针对输入的车辆图片信息,利用部署好的教师-学生模型计算特征相似度;

29、车辆重识别结果识别输出模块,用于基于计算得到的特征相似度,输出车辆的重识别结果。

30、本专利技术的另一个方面,提供了一种计算机可读存储介质,包括供电子设备的一个或多个处理器执行的一个或多个程序,所述一个或多个程序包括用于执行上述基于知识蒸馏的实时车辆重识别方法的指令。

31、与现有技术相比,本专利技术具有以下部分/全部有益效果:

32、(1)模型推理和部署效率高:本申请针对移动端的使用场景,通过对训练后的模型进行压缩和优化可在移动设备上高效运行模型。这不仅提高了实时性能,还降低了资源消耗,使得该方法适用于各种资源受限的环境。

33、(2)模型泛化性能良好:本申请通过知识蒸馏,可以从大规模的仿真和公开数据集中构建强大的教师子模型,然后将其知识传递给学生子模型。这提高了学生子模型在真实世界场景中的泛化能力,降低了对特定数据集的依赖。结果是更准确的车辆重识别,即使在有限的真实数据集上也能表现出色。

34、(3)模型设计轻量化:本申请针对移动端和嵌入式设备提供了轻量级的车辆重识别模型。这种轻量级模型在保持高性能的同时,减小了模型体积和计算复杂度,为实时推理性能提供了突出的优势。

本文档来自技高网...

【技术保护点】

1.一种基于知识蒸馏的实时车辆重识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于知识蒸馏的实时车辆重识别方法,其特征在于,所述的教师-学生模型的构建过程包括:

3.根据权利要求2所述的一种基于知识蒸馏的实时车辆重识别方法,其特征在于,所述的教师子模型包括基于Non-local非局部注意力机制的ResNet101主干网络、IBN层以及广义平均池化聚合层。

4.根据权利要求2所述的一种基于知识蒸馏的实时车辆重识别方法,其特征在于,所述的学生子模型包括ResNet18主干网络、全局平均池化层和线性决策层。

5.根据权利要求1所述的一种基于知识蒸馏的实时车辆重识别方法,其特征在于,所述的多源数据集包括大规模仿真驾驶场景车辆重识别数据集、真实公开数据集和真实应用场景的车辆重识别数据集。

6.根据权利要求1所述的一种基于知识蒸馏的实时车辆重识别方法,其特征在于,对所述教师-学生模型进行知识蒸馏训练的过程包括:

7.根据权利要求1所述的一种基于知识蒸馏的实时车辆重识别方法,其特征在于,利用图形处理高性能推理库实现教师-学生模型的压缩和优化处理。

8.根据权利要求1所述的一种基于知识蒸馏的实时车辆重识别方法,其特征在于,所述的特征相似度的计算过程包括:

9.一种基于知识蒸馏的实时车辆重识别设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,包括供电子设备的一个或多个处理器执行的一个或多个程序,所述一个或多个程序包括用于执行如权利要求1-8任一所述基于知识蒸馏的实时车辆重识别方法的指令。

...

【技术特征摘要】

1.一种基于知识蒸馏的实时车辆重识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于知识蒸馏的实时车辆重识别方法,其特征在于,所述的教师-学生模型的构建过程包括:

3.根据权利要求2所述的一种基于知识蒸馏的实时车辆重识别方法,其特征在于,所述的教师子模型包括基于non-local非局部注意力机制的resnet101主干网络、ibn层以及广义平均池化聚合层。

4.根据权利要求2所述的一种基于知识蒸馏的实时车辆重识别方法,其特征在于,所述的学生子模型包括resnet18主干网络、全局平均池化层和线性决策层。

5.根据权利要求1所述的一种基于知识蒸馏的实时车辆重识别方法,其特征在于,所述的多源数据集包括大规模仿真驾驶场景车辆重识别数据集、真实公开数据...

【专利技术属性】
技术研发人员:杨明殷承良庄瀚洋王春香严威豪秦文刚王颖
申请(专利权)人:上海智能网联汽车技术中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1