一种神经网络模型训练方法、装置、终端及存储介质制造方法及图纸

技术编号：41103452 阅读：2 留言：0更新日期：2024-04-25 13:58

本发明专利技术提供一种神经网络模型训练方法、装置、终端及存储介质，神经网络模型训练方法包括：获取多个原始数据集，基于原始数据集中各样本图像的初始特征图与其他原始数据集中各样本图像的初始特征图之间的相似度，确定各原始数据集对应的近邻数据集；从分配的原始数据集及其近邻数据集中分别选取样本图像组成训练数据集；基于训练数据集中的样本图像生成多个训练数据组，基于多个训练数据组对神经网络模型进行迭代训练。本申请将近邻图像集中的样本图像作为对应的原始图像集中的样本图像的难例图像，基于样本图像和难例图像组成的训练数据组对神经网络模型进行训练，可以提高神经网络模型的训练效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像，特别是涉及一种神经网络模型训练方法、装置、终端及计算机可读存储介质。

技术介绍

1、近年来，随着物联网技术和深度学习技术的快速发展，各种先进的智能感知设备提供了丰富的数据源，尤其在自然监控场景，如何从海量的视频监控数据中挖掘有效的数据信息用于人工智能算法的训练，是当前重要的研究课题之一，随着训练数据量的增加，基于cnn和transformer范式的神经网络参数规模也在不断增大，规模效应和有限的算力资源，导致模型训练周期不断增加。尤其在细粒度的图像检索任务中，例如人体以图搜图，机动车车辆以图搜图等应用，常常采用距离度量学习技术提升样本对之间的细粒度表征能力，但随着训练集数据类别数规模的增加，基于批处理的数据随机采样方法越来越无法满足度量学习的要求。

技术实现思路

1、本专利技术主要解决的技术问题是提供一种神经网络模型训练方法、装置、终端及计算机可读存储介质，解决现有技术中神经网络模型的训练效率低的问题。

2、为解决上述技术问题，本专利技术采用的第一个技术方案是：提供一种神经网络模型训练方法，神经网络模型训练方法包括：

3、获取多个原始数据集，原始数据集包含同一目标对象的多张样本图像，样本图像具有包含的目标对象的标注类别；各样本图像具有初始特征图；

4、基于原始数据集中各样本图像的初始特征图与其他原始数据集中各样本图像的初始特征图之间的相似度，确定各原始数据集对应的近邻数据集；

5、从分配的原始数据集及其近邻数据集中分

6、基于训练数据集中的样本图像生成多个训练数据组，训练数据组包括目标图像、正样本图像和负样本图像，正样本图像和目标图像的标注类别相同，负样本图像和目标图像的标注类别不同；

7、基于多个训练数据组对神经网络模型进行迭代训练。

8、其中，从分配的原始数据集及其近邻数据集中分别选取样本图像组成训练数据集，包括：

9、遍历分配的原始数据集及其对应的近邻数据集分别作为目标数据集；

10、响应于目标数据集的采样概率值未超过预设概率值，则在目标数据集中选取一样本图像作为目标图像；

11、基于目标图像的属性信息，在目标数据集中选取与目标图像的属性相似度最低的样本图像归属于训练数据集；

12、响应于目标数据集的采样概率值超过预设概率值，则在目标数据集中随机选取预设数量的样本图像归属于训练数据集；训练数据集中包含各标注类别对应的样本图像的数量相同。

13、其中，目标图像的属性信息包括目标位姿信息和/或目标图像质量评分；

14、基于目标图像的属性信息，在目标数据集中选取与目标图像的属性相似度最低的样本图像归属于训练数据集，包括：

15、响应于目标图像的目标位姿信息为正面，则在目标数据集中选取目标位姿信息为侧面或背面的样本图像归属于训练数据集；

16、响应于目标图像对应的目标图像质量评分超过预设评分，则在目标数据集中选取未超过预设评分的目标图像质量评分对应的样本图像归属于训练图像集。

17、其中，基于原始数据集中各样本图像的初始特征图与其他原始数据集中各样本图像的初始特征图之间的相似度，确定各原始数据集对应的近邻数据集，包括：

18、计算得到原始数据集中各样本图像的初始特征图与其他各原始图像集中各样本图像的初始特征图之间的相似度；

19、将相似度从大到小进行排序；

20、将排序靠前的相似度对应的样本图像所属的图像集作为原始图像集的近邻图像集。

21、其中，对神经网络模型进行训练的图像处理单元gpu为多个，

22、从分配的原始数据集及其近邻数据集中分别选取样本图像组成训练数据集的步骤之前，还包括：

23、响应于原始图像集的数量为多个，将多个原始图像集平均分配至图像处理单元gpu上得到图像处理单元gpu对应的多个目标图像集；

24、选取目标数据集对应的预设数量的近邻图像集分配至目标数据集所属的图像处理单元gpu上。

25、其中，样本图像的目标特征和图像特征；目标特征包括目标属性信息和目标完整度信息；图像特征包括目标图像质量评分；

26、获取多个原始数据集的步骤之后，包括：

27、基于样本图像对应的目标属性信息、目标完整度信息和/或目标图像质量评分，对原始图像集中的样本图像进行过滤；

28、基于目标完整度信息和/或目标图像质量评分对原始图像集中的样本图像进行分类，得到第一图像集和第二图像集；第一图像集包含的各样本图像的质量优于第二图像集包含的样本图像；

29、基于第一策略对第一图像集中的样本图像进行数据增强处理，并将得到的增强图像归属于样本图像所属的原始图像集；

30、基于第二策略对第二图像集中的样本图像进行数据增强处理，并将得到的增强图像归属于样本图像所属的原始图像集。

31、其中，基于原始数据集中各样本图像的初始特征图与其他原始数据集中各样本图像的初始特征图之间的相似度，确定各原始数据集对应的近邻数据集的步骤之前，还包括：

32、对神经网络模型进行k轮训练；

33、通过k轮训练后的神经网络模型对样本图像进行特征提取，得到样本图像的初始特征图；

34、基于多个训练数据组对神经网络模型进行迭代训练，包括：

35、通过训练数据组中目标图像的初始特征图分别与正样本图像的初始特征图之间的距离、与负样本图像的初始特征图之间的距离确定损失值对神经网络模型进行第k+1轮训练。

36、为解决上述技术问题，本专利技术采用的第二个技术方案是：提供一种神经网络模型训练装置，神经网络模型训练装置包括：

37、获取模块，用于获取多个原始数据集，原始数据集包含同一目标对象的多张样本图像，样本图像具有包含的目标对象的标注类别；各样本图像具有初始特征图；

38、分析模块，用于基于原始数据集中各样本图像的初始特征图与其他原始数据集中各样本图像的初始特征图之间的相似度，确定各原始数据集对应的近邻数据集；

39、处理模块，用于从分配的原始数据集及其近邻数据集中分别选取样本图像组成训练数据集；

40、生成模块，用于基于训练数据集中的样本图像生成多个训练数据组，训练数据组包括目标图像、正样本图像和负样本图像，正样本图像和目标图像的标注类别相同，负样本图像和目标图像的标注类别不同；

41、训练模块，用于基于多个训练数据组对神经网络模型进行迭代训练。

42、为解决上述技术问题，本专利技术采用的第三个技术方案是：提供一种终端，终端包括存储器、处理器以及存储于存储器中并在处理器上运行的计算机程序，处理器用于执行程序数据以实现如上述的联动变倍方法中的步骤。

43、为解决上述技术问题，本专利技术采用的第四个技术方案是：提供一种计算机可读存储介质，计算机可读存本文档来自技高网...

【技术保护点】

1.一种神经网络模型训练方法，其特征在于，所述训练方法包括：

2.根据权利要求1所述的训练方法，其特征在于，

3.根据权利要求2所述的训练方法，其特征在于，所述目标图像的属性信息包括目标位姿信息和/或目标图像质量评分；

4.根据权利要求1所述的训练方法，其特征在于，

5.根据权利要求1所述的训练方法，其特征在于，对所述神经网络模型进行训练的图像处理单元GPU为多个，

6.根据权利要求1所述的训练方法，其特征在于，所述样本图像的目标特征和图像特征；所述目标特征包括目标属性信息和目标完整度信息；所述图像特征包括目标图像质量评分；

7.根据权利要求1所述的训练方法，其特征在于，

8.一种神经网络模型训练装置，其特征在于，所述神经网络模型训练装置包括：

9.一种终端，其特征在于，所述终端包括存储器、处理器以及存储于所述存储器中并在所述处理器上运行的计算机程序，所述处理器用于执行程序数据以实现如权利要求1～7任一项所述的神经网络模型训练方法中的步骤。

10.一种计算机可读存储介质，其

...

【技术特征摘要】

1.一种神经网络模型训练方法，其特征在于，所述训练方法包括：

2.根据权利要求1所述的训练方法，其特征在于，

3.根据权利要求2所述的训练方法，其特征在于，所述目标图像的属性信息包括目标位姿信息和/或目标图像质量评分；

4.根据权利要求1所述的训练方法，其特征在于，

5.根据权利要求1所述的训练方法，其特征在于，对所述神经网络模型进行训练的图像处理单元gpu为多个，

6.根据权利要求1所述的训练方法，其特征在于，所述样本图像的目标特征和图像特征；所述目标特征包括目标属性信息和目标完整度信息；所述图像特征...

【专利技术属性】
技术研发人员：孙立波，邵晓雯，殷俊，
申请(专利权)人：浙江大华技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人