一种基于困难样本挑选的模型训练方法和系统技术方案

技术编号：40103833 阅读：24 留言：0更新日期：2024-01-23 18:06

本发明专利技术提供一种基于困难样本挑选的模型训练方法和系统，涉及深度学习技术领域，所述方法包括：根据人工标注的第一数据集和目标模型，通过pool‑based的困难样本挑选策略进行困难样本集筛选，并根据筛选的第一困难样本集针对性采集未标注的第二困难样本集，将第二困难样本集送给标注者标注后与第一困难数据集组合成第二数据集；用第二数据集去有监督更新目标模型从而得到精度更高的所述目标模型，迭代目标模型至达到预设精度。本申请通过设计针对3D模型的pool‑based的主动学习策略，解决现有技术中缺乏对于3D目标模型的困难样本挑选策略、缺乏针对多目标模型的主动学习策略的技术问题，提高了困难样本挑选效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及深度学习，特别涉及一种基于困难样本挑选的模型训练方法和系统。

技术介绍

1、在工业界，为了更好的用深度学习的方法解决实际的业务问题，除了在深度学习模型上不断优化之外，还可以通过挑选对于深度学习模型来说表现较差的数据，即挑选困难样本，有针对性的去更多的采集及标注此类数据，从而达到用较少样本和较低人工标注成本让深度学习模型得到较高的精度提升的目的。

2、困难样本挑选往往采用主动学习的策略，主动学习是一种通过主动选择最有价值的样本进行标注的机器学习或人工智能方法，其目的在于尽可能挑选出较少的高质量样本进行标注，从而使目标模型达到尽可能好的性能。主动学习方法是一种提高样本及标注的增益，在有限标注预算的前提下最大化模型性能的方法，是一种从样本的角度，提高数据效率的方案，往往被应用在标注成本高，标注难度大等任务中。

3、现有技术中，困难样本挑选策略的目标模型一般为2d的分类或检测模型，而缺乏对于3d目标模型和3d样本的困难样本挑选策略，比起2d样本只需要考虑2d的像素坐标系，3d样本需要考虑三维的世界坐标系的空间信息；同时也缺乏针对多目标模型的主动学习策略。

技术实现思路

1、本专利技术第一方面提供了一种基于困难样本挑选的模型训练方法，以解决现有技术中缺乏对于3d目标模型的困难样本挑选策略、缺乏针对多目标模型的主动学习策略的技术问题。该方法包括：

2、获取已标注的第一数据集；

3、根据pool-based困难样本挑选策略，从所述第一

4、对所述第二困难样本集进行标注，获得已标注的所述第二困难样本集；

5、结合所述第一数据集和已标注的所述第二困难样本集，获得第二数据集；

6、以所述第二数据集为训练数据集训练目标模型，获得训练后的所述目标模型。

7、进一步的，所述以所述第二数据集为训练数据集训练目标模型，获得训练后的所述目标模型，包括：

8、循环执行以下步骤，直至训练后的所述目标模型的精度达到预设精度，结束循环：

9、判断当前训练后的目标模型的精度是否达到所述预设精度；

10、若是，循环结束，输出训练后的所述目标模型和所述第二数据集；

11、否则，根据pool-based困难样本挑选策略，从所述第二数据集中筛选出困难样本集，根据筛选的困难样本集采集获得未标注的困难样本集；

12、对所述未标注的困难样本集进行标注，获得已标注的困难样本集；

13、结合所述第二数据集和所述已标注的困难样本集，获得新的所述第二数据集；

14、以新的所述第二数据集为训练数据集训练所述目标模型，输出训练后的所述目标模型。

15、进一步的，所述根据pool-based困难样本挑选策略，从所述第一数据集中筛选出第一困难样本集，包括：

16、根据所述第一数据集和所述目标模型，使用不确定性采样方式生成不确定性熵图，其中，所述不确定性熵图包括所述目标模型在所述第一数据集上逐帧的算法精度；

17、根据所述不确定性熵图，基于委员会查询从所述第一数据集中筛选出所述第一困难样本集。

18、进一步的，当所述目标模型为复数个时，所述根据所述不确定性熵图，基于委员会查询从所述第一数据集中筛选出所述第一困难样本集，还包括：

19、逐帧对所述不确定性熵图进行矩阵加法操作；

20、对矩阵加法操作后的所述不确定性熵图进行按位求和；

21、对按位求和所获得的各数值按照从大到小进行排序，从排序后的各数值中选取前k个值对应的已标注样本作为优先级最高的困难样本；

22、逐帧对所述不确定性熵图进行矩阵异或操作；

23、将异或操作后的所述不确定性熵图进行按位求和；

24、对按位求和所获得的各数值按照从大到小进行排序，从排序后的各数值中选取前k个值对应的已标注样本作为优先级次高的困难样本；

25、将所述优先级最高的困难样本和所述优先级次高的困难样本组成所述第一困难样本集。

26、进一步的，根据所述第一数据集和所述目标模型，使用不确定性采样方式生成不确定性熵图，包括：

27、将所述目标模型在单帧上的检测结果与所述目标模型在所述第一数据集上的检测结果进行比较，根据比较的结果生成所述不确定性熵图，其中，所述目标模型为3d检测目标模型，所述不确定性熵图为矩阵。

28、进一步的，所述目标模型的数量包括单个模型和复数个模型；所述目标模型的目标算法包括单个自动驾驶感知算法和复数个自动驾驶感知算法。

29、本专利技术第二方面提供了一种基于困难样本挑选的模型训练系统，用于解决现有技术中缺乏对于3d目标模型的困难样本挑选策略、缺乏针对多目标模型的主动学习策略的技术问题。所述系统包括：

30、困难样本挑选模块，用于获取已标注的第一数据集；根据pool-based困难样本挑选策略，从所述第一数据集中筛选出第一困难样本集，根据所述第一困难样本集采集获得第二困难样本集，其中，所述第二困难样本集包括的是未标注的困难样本，所述pool-based困难样本挑选策略为不确定性采样与委员会查询的混合查询策略；

31、困难样本标注模块，用于对所述第二困难样本集进行标注，获得已标注的所述第二困难样本集；

32、目标模型训练模块，用于结合所述第一数据集和已标注的所述第二困难样本集，获得第二数据集；以所述第二数据集为训练数据集训练目标模型，获得训练后的所述目标模型。

33、本专利技术第三方面提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任意的一种基于困难样本挑选的模型训练方法。

34、本专利技术第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有执行上述任意的一种基于困难样本挑选的模型训练方法的计算机程序。

35、与现有技术相比，本说明书实施例采用的上述至少一个技术方案能够达到的有益效果至少包括：本专利技术设计了pool-based的困难样本挑选策略，通过采用不确定性采样与委员会查询的混合查询策略，实现了针对3d样本的更高效的困难样本挑选，进而有利于提高3d检测模型的精度。

本文档来自技高网...

【技术保护点】

1.一种基于困难样本挑选的模型训练方法，其特征在于，包括：

2.根据权利要求1所述的一种基于困难样本挑选的模型训练方法，其特征在于，所述以所述第二数据集为训练数据集训练目标模型，获得训练后的所述目标模型，包括：

3.根据权利要求1所述的一种基于困难样本挑选的模型训练方法，其特征在于，所述根据pool-based困难样本挑选策略，从所述第一数据集中筛选出第一困难样本集，包括：

4.根据权利要求3所述的一种基于困难样本挑选的模型训练方法，其特征在于，当所述目标模型为复数个时，根据所述不确定性熵图，基于委员会查询从所述第一数据集中筛选出所述第一困难样本集，还包括：

5.根据权利要求3所述的基于困难样本挑选的模型训练方法，其特征在于，根据所述第一数据集和所述目标模型，使用不确定性采样方式生成不确定性熵图，包括：

6.根据权利要求1所述的一种基于困难样本挑选的模型训练方法，其特征在于，所述目标模型的数量包括单个模型和复数个模型。

7.根据权利要求1所述的一种基于困难样本挑选的模型训练方法，其特征在于，所述目标模型的目标

8.一种基于困难样本挑选的模型训练系统，其特征在于，包括：

9.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的一种基于困难样本挑选的模型训练方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有执行权利要求1至7中任一项所述的一种基于困难样本挑选的模型训练方法的计算机程序。

...

【技术特征摘要】

1.一种基于困难样本挑选的模型训练方法，其特征在于，包括：

5.根据权利要求3所述的基于困难样本挑选的模型训练方法，其特征在于，根据所述第一数据集和所述目标模型，使用不确定性采样方式生成不确定性...

【专利技术属性】
技术研发人员：王汝卓，李章洪，黄飞鸿，王雅儒，程建伟，胡亚捷，
申请(专利权)人：武汉极目智能技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人