System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种视觉任务处理方法、装置、可读存储介质及终端设备制造方法及图纸_技高网

一种视觉任务处理方法、装置、可读存储介质及终端设备制造方法及图纸

技术编号:41310320 阅读:13 留言:0更新日期:2024-05-13 14:54
本申请属于视觉任务处理技术领域,尤其涉及一种视觉任务处理方法、装置、计算机可读存储介质及终端设备。所述方法包括:获取待处理的目标视觉任务;使用预设的视觉任务处理模型对所述目标视觉任务进行处理,得到所述目标视觉任务的任务处理结果;其中,所述视觉任务处理模型在半监督训练过程中使用添加聚合损失项的损失函数,所述聚合损失项用于表征无标注训练图像的聚合置信概率与预期置信概率之间的差异,所述聚合置信概率由所述无标注训练图像的第一置信概率和对应的各个邻近点的第二置信概率聚合得到。通过在半监督训练过程中使用添加聚合损失项的损失函数,计算更加精准,有效提高了训练所得的模型在进行视觉任务处理时的准确率。

【技术实现步骤摘要】

本申请属于视觉任务处理,尤其涉及一种视觉任务处理方法、装置、计算机可读存储介质及终端设备。


技术介绍

1、半监督训练技术在视觉任务处理领域已得到了较为普遍的使用,半监督训练技术是一种借助少量标注数据和大量无标注数据来联合训练神经网络的方案,主流的半监督视觉任务处理方案(如efficient-teacher等)一般采用教师-学生(teacher-student)解决范式,运用教师(teacher)模型对无标注数据生成的伪标签来指导学生(student)模型学到全量数据的分布,同时学生模型又会以集成学习的方式来更新教师模型的参数,形成互学习的飞轮效应。

2、损失函数是半监督训练的重要组成部分之一,损失函数通过最小化模型对于数据的预测值和该数据真实值之间的误差来优化模型,从而提高模型提取特征的能力。但在现有技术中所使用的损失函数计算往往不够精准,导致训练所得的模型在进行视觉任务处理时准确率较低。


技术实现思路

1、有鉴于此,本申请实施例提供了一种视觉任务处理方法、装置、计算机可读存储介质及终端设备,以解决现有技术中所使用的损失函数计算往往不够精准,导致训练所得的模型在进行视觉任务处理时准确率较低的问题。

2、本申请实施例的第一方面提供了一种视觉任务处理方法,可以包括:

3、获取待处理的目标视觉任务;

4、使用预设的视觉任务处理模型对所述目标视觉任务进行处理,得到所述目标视觉任务的任务处理结果;

5、其中,所述视觉任务处理模型在半监督训练过程中使用添加聚合损失项的损失函数,所述聚合损失项用于表征无标注训练图像的聚合置信概率与预期置信概率之间的差异,所述聚合置信概率由所述无标注训练图像的第一置信概率和对应的各个邻近点的第二置信概率聚合得到。

6、在第一方面的一种具体实现方式中,所述添加聚合损失项的损失函数的构建过程可以包括:

7、获取所述无标注训练图像的所述第一置信概率;

8、获取与所述无标注训练图像对应的各个邻近点的所述第二置信概率;

9、对所述第一置信概率和各个邻近点的所述第二置信概率进行聚合计算,得到所述聚合置信概率;

10、根据所述聚合置信概率和所述预期置信概率确定所述聚合损失项;

11、在初始的损失函数中添加所述聚合损失项,得到所述添加聚合损失项的损失函数。

12、在第一方面的一种具体实现方式中,所述对所述第一置信概率和各个邻近点的所述第二置信概率进行聚合计算,得到所述聚合置信概率,可以包括:

13、对各个邻近点的所述第二置信概率进行聚合计算,得到第三置信概率;

14、对所述第一置信概率和所述第三置信概率进行聚合计算,得到所述聚合置信概率。

15、在第一方面的一种具体实现方式中,所述对各个邻近点的所述第二置信概率进行聚合计算,得到第三置信概率,可以包括:

16、将各个邻近点的所述第二置信概率分别与对应的邻近点权重进行相乘计算,得到各个邻近点的加权置信概率;

17、对各个邻近点的所述加权置信概率进行求和计算,得到所述第三置信概率。

18、在第一方面的一种具体实现方式中,所述对所述第一置信概率和所述第三置信概率进行聚合计算,得到所述聚合置信概率,可以包括:

19、计算所述第一置信概率与预设的第一权重之间的第一乘积;

20、计算所述第三置信概率与预设的第二权重之间的第二乘积;

21、对所述第一乘积和所述第二乘积进行求和计算,得到所述聚合置信概率。

22、在第一方面的一种具体实现方式中,所述根据所述聚合置信概率和所述预期置信概率确定所述聚合损失项,可以包括:

23、在所述聚合置信概率中的最大值大于等于预设的置信阈值的情况下,计算所述聚合置信概率和所述预期置信概率之间的交叉熵,并根据所述交叉熵确定所述聚合损失项。

24、在第一方面的一种具体实现方式中,所述聚合损失项可以包括第一聚合损失项、第二聚合损失项和/或第三聚合损失项,所述第一聚合损失项对应于类别预测、所述第二聚合损失项对应于边界框回归、所述第三聚合损失项对应于对象存在概率。

25、本申请实施例的第二方面提供了一种视觉任务处理装置,可以包括:

26、视觉任务获取模块,用于获取待处理的目标视觉任务;

27、视觉任务处理模块,用于使用预设的视觉任务处理模型对所述目标视觉任务进行处理,得到所述目标视觉任务的任务处理结果;

28、其中,所述视觉任务处理模型在半监督训练过程中使用添加聚合损失项的损失函数,所述聚合损失项用于表征无标注训练图像的聚合置信概率与预期置信概率之间的差异,所述聚合置信概率由所述无标注训练图像的第一置信概率和对应的各个邻近点的第二置信概率聚合得到。

29、在第二方面的一种具体实现方式中,所述视觉任务处理装置还可以包括:

30、第一置信概率获取模块,用于获取所述无标注训练图像的所述第一置信概率;

31、第二置信概率获取模块,用于获取与所述无标注训练图像对应的各个邻近点的所述第二置信概率;

32、聚合置信概率计算模块,用于对所述第一置信概率和各个邻近点的所述第二置信概率进行聚合计算,得到所述聚合置信概率;

33、聚合损失项确定模块,用于根据所述聚合置信概率和所述预期置信概率确定所述聚合损失项;

34、聚合损失项添加模块,用于在初始的损失函数中添加所述聚合损失项,得到所述添加聚合损失项的损失函数。

35、在第二方面的一种具体实现方式中,所述聚合置信概率计算模块可以包括:

36、第一聚合计算单元,用于对各个邻近点的所述第二置信概率进行聚合计算,得到第三置信概率;

37、第二聚合计算单元,用于对所述第一置信概率和所述第三置信概率进行聚合计算,得到所述聚合置信概率。

38、在第二方面的一种具体实现方式中,所述第一聚合计算单元可以具体用于:将各个邻近点的所述第二置信概率分别与对应的邻近点权重进行相乘计算,得到各个邻近点的加权置信概率;对各个邻近点的所述加权置信概率进行求和计算,得到所述第三置信概率。

39、在第二方面的一种具体实现方式中,所述第二聚合计算单元可以具体用于:计算所述第一置信概率与预设的第一权重之间的第一乘积;计算所述第三置信概率与预设的第二权重之间的第二乘积;对所述第一乘积和所述第二乘积进行求和计算,得到所述聚合置信概率。

40、在第二方面的一种具体实现方式中,所述聚合损失项确定模块可以具体用于:在所述聚合置信概率中的最大值大于等于预设的置信阈值的情况下,计算所述聚合置信概率和所述预期置信概率之间的交叉熵,并根据所述交叉熵确定所述聚合损失项。

41、在第二方面的一种具体实现方式中,所述聚合损失项可以包括第一聚合损失项、第二聚合损失项和/或第三聚合损失项,所述第一聚合损失本文档来自技高网...

【技术保护点】

1.一种视觉任务处理方法,其特征在于,包括:

2.根据权利要求1所述的视觉任务处理方法,其特征在于,所述添加聚合损失项的损失函数的构建过程包括:

3.根据权利要求2所述的视觉任务处理方法,其特征在于,所述对所述第一置信概率和各个邻近点的所述第二置信概率进行聚合计算,得到所述聚合置信概率,包括:

4.根据权利要求3所述的视觉任务处理方法,其特征在于,所述对各个邻近点的所述第二置信概率进行聚合计算,得到第三置信概率,包括:

5.根据权利要求3所述的视觉任务处理方法,其特征在于,所述对所述第一置信概率和所述第三置信概率进行聚合计算,得到所述聚合置信概率,包括:

6.根据权利要求2所述的视觉任务处理方法,其特征在于,所述根据所述聚合置信概率和所述预期置信概率确定所述聚合损失项,包括:

7.根据权利要求1至6中任一项所述的视觉任务处理方法,其特征在于,所述聚合损失项包括第一聚合损失项、第二聚合损失项和/或第三聚合损失项,所述第一聚合损失项对应于类别预测、所述第二聚合损失项对应于边界框回归、所述第三聚合损失项对应于对象存在概率。

8.一种视觉任务处理装置,其特征在于,包括:

9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的视觉任务处理方法的步骤。

10.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的视觉任务处理方法的步骤。

...

【技术特征摘要】

1.一种视觉任务处理方法,其特征在于,包括:

2.根据权利要求1所述的视觉任务处理方法,其特征在于,所述添加聚合损失项的损失函数的构建过程包括:

3.根据权利要求2所述的视觉任务处理方法,其特征在于,所述对所述第一置信概率和各个邻近点的所述第二置信概率进行聚合计算,得到所述聚合置信概率,包括:

4.根据权利要求3所述的视觉任务处理方法,其特征在于,所述对各个邻近点的所述第二置信概率进行聚合计算,得到第三置信概率,包括:

5.根据权利要求3所述的视觉任务处理方法,其特征在于,所述对所述第一置信概率和所述第三置信概率进行聚合计算,得到所述聚合置信概率,包括:

6.根据权利要求2所述的视觉任务处理方法,其特征在于,所述根据所述聚合置信概率和所述预期置信概率确定所述...

【专利技术属性】
技术研发人员:赵煜冰王侃董培庞建新谭欢
申请(专利权)人:深圳市优必选科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1