基于多任务AI大模型的目标检测方法、模型训练方法技术

技术编号：40512189 阅读：10 留言：0更新日期：2024-03-01 13:28

本公开提供了基于多任务AI大模型的目标检测方法、模型训练方法，本公开涉及计算机技术领域，尤其涉及人工智能、神经网络模型、智慧城市技术领域。目标检测方法的具体实现方案为：识别待检测图像中的目标对象，得到第一识别结果；根据第一识别结果的置信度和对应第一精确率的第一阈值，从第一识别结果中确定第一告警对象，以作为检测结果；在满足触发条件的情况下，对第一识别结果对应的待补检图像进行目标检测，得到第二识别结果；根据第二识别结果的置信度和对应第二精确率的第二阈值，从第二识别结果中确定第二告警对象；以及根据第二告警对象，更新检测结果。本公开可以保证目标检测的高精确率，同时降低漏召率。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及计算机，尤其涉及人工智能、神经网络模型、目标检测、智慧城市。

技术介绍

1、通过人工智能等先进技术的应用，可以实现对城市的精细化管理、智能化分析和科学化施策，例如，在智慧交通、智慧工地、智慧社区、智慧电梯等应用场景中，都需要使用ai(artificial intelligence，人工智能)模型对监控视频中出现的行人、机动车、非机动车等目标进行识别，以便于检测出其中的违规目标。

技术实现思路

1、本公开提供了一种基于多任务ai大模型的目标检测方法、模型训练方法、装置、设备以及存储介质。

2、根据本公开的一方面，提供了一种基于多任务ai大模型的目标检测方法，包括：

3、识别待检测图像中的目标对象，得到第一识别结果；

4、根据第一识别结果的置信度和对应第一精确率的第一阈值，从第一识别结果中确定第一告警对象，以作为检测结果；

5、在满足触发条件的情况下，对第一识别结果对应的待补检图像进行目标检测，得到第二识别结果；

6、根据第二识别结果的置信度和对应第二精确率的第二阈值，从第二识别结果中确定第二告警对象；其中，第一精确率高于第二精确率；以及

7、根据第二告警对象，更新检测结果。

8、根据本公开的另一方面，提供了一种多任务ai大模型的模型训练方法，包括：

9、获取多种检测场景的样本图像、样本图像的场景标识以及样本图像的真实标签；

10、利用第二模型的多个输出网络，对样本图像

11、根据样本图像的真实标签、场景标识以及多个预测标签，确定第一损失函数；以及

12、根据第一损失函数，更新第二模型的参数，以得到训练后的多任务检测模型。

13、根据本公开的另一方面，提供了一种基于多任务ai大模型的目标检测装置，包括：

14、第一识别模块，用于识别待检测图像中的目标对象，得到第一识别结果；

15、第一筛选模块，用于根据第一识别结果的置信度和对应第一精确率的第一阈值，从第一识别结果中确定第一告警对象，以作为检测结果；

16、第二识别模块，用于在满足触发条件的情况下，对第一识别结果对应的待补检图像进行目标检测，得到第二识别结果；

17、第二筛选模块，用于根据第二识别结果的置信度和对应第二精确率的第二阈值，从第二识别结果中确定第二告警对象；其中，第一精确率高于第二精确率；以及

18、更新模块，用于根据第二告警对象，更新检测结果。

19、根据本公开的另一方面，提供了一种多任务ai大模型的模型训练装置，包括：

20、获取模块，用于获取多种检测场景的样本图像、样本图像的场景标识以及样本图像的真实标签；

21、预测模块，用于利用第二模型的多个输出网络，对样本图像进行目标检测，得到多个预测标签；其中，多个输出网络对应多种检测场景；

22、损失函数确定模块，用于根据样本图像的真实标签、场景标识以及多个预测标签，确定第一损失函数；以及

23、训练模块，用于根据第一损失函数，更新第二模型的参数，以得到训练后的多任务检测模型。

24、根据本公开的另一方面，提供了一种电子设备，包括：

25、至少一个处理器；以及

26、与该至少一个处理器通信连接的存储器；其中，

27、该存储器存储有可被该至少一个处理器执行的指令，该指令被该至少一个处理器执行，以使该至少一个处理器能够执行本公开实施例中任一的方法。

28、根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，该计算机指令用于使该计算机执行根据本公开实施例中任一的方法。

29、根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，该计算机程序在被处理器执行时实现根据本公开实施例中任一的方法。

30、本公开可以保证目标检测的高精确率的同时，对漏召目标进行补充召回，降低漏召率。

31、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种基于多任务AI大模型的目标检测方法，包括：

2.根据权利要求1所述的方法，还包括：

3.根据权利要求1所述的方法，其中，识别待检测图像中的目标对象，得到第一识别结果，包括：

4.根据权利要求1所述的方法，其中，识别待检测图像中的目标对象，得到第一识别结果，包括：

5.根据权利要求1所述的方法，其中，根据所述第一识别结果的置信度和对应第一精确率的第一阈值，从所述第一识别结果中确定第一告警对象，以作为检测结果，包括：

6.根据权利要求1所述的方法，还包括：

7.根据权利要求1或6所述的方法，其中，所述多任务AI大模型根据多种检测场景的样本图像训练得到。

8.一种多任务AI大模型的模型训练方法，包括：

9.根据权利要求8所述的方法，其中，根据所述样本图像的真实标签、所述场景标识以及所述预测标签，确定第一损失函数，包括：

10.根据权利要求9所述的方法，其中，根据所述样本图像的真实标签和所述目标输出网络生成的预测标签，确定第二损失函数，包括：

11.根据权利要求

12.根据权利要求9所述的方法，其中，根据所述第一损失函数，更新所述第二模型的参数，以得到训练后的多任务AI大模型，包括：

13.一种基于多任务AI大模型的目标检测装置，包括：

14.根据权利要求13所述的装置，还包括阈值确定模块，用于：

15.根据权利要求13所述的装置，其中，所述第一识别模块用于：

16.根据权利要求13所述的装置，其中，所述第一识别模块用于：

17.根据权利要求13所述的装置，其中，所述第一筛选模块用于：

18.根据权利要求13所述的装置，还包括：

19.根据权利要求13或18所述的装置，其中，所述多任务AI大模型根据多种检测场景的样本图像训练得到。

20.一种多任务AI大模型的模型训练装置，包括：

21.根据权利要求20所述的装置，其中，所述损失函数确定模块，包括：

22.根据权利要求21所述的装置，其中，所述第一确定子模块用于：

23.根据权利要求21所述的装置，其中，所述第一确定子模块用于：

24.根据权利要求21所述的装置，其中，所述训练模块用于：

25.一种电子设备，包括：

26.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-12中任一项所述的方法。

27.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-12中任一项所述的方法。

...

【技术特征摘要】

1.一种基于多任务ai大模型的目标检测方法，包括：

2.根据权利要求1所述的方法，还包括：

3.根据权利要求1所述的方法，其中，识别待检测图像中的目标对象，得到第一识别结果，包括：

4.根据权利要求1所述的方法，其中，识别待检测图像中的目标对象，得到第一识别结果，包括：

6.根据权利要求1所述的方法，还包括：

7.根据权利要求1或6所述的方法，其中，所述多任务ai大模型根据多种检测场景的样本图像训练得到。

8.一种多任务ai大模型的模型训练方法，包括：

9.根据权利要求8所述的方法，其中，根据所述样本图像的真实标签、所述场景标识以及所述预测标签，确定第一损失函数，包括：

10.根据权利要求9所述的方法，其中，根据所述样本图像的真实标签和所述目标输出网络生成的预测标签，确定第二损失函数，包括：

11.根据权利要求9所述的方法，其中，根据所述样本图像的真实标签和所述目标输出网络生成的预测标签，确定第二损失函数，包括：

12.根据权利要求9所述的方法，其中，根据所述第一损失函数，更新所述第二模型的参数，以得到训练后的多任务ai大模型，包括...

【专利技术属性】
技术研发人员：姬东飞，杜雨亭，陆勤，龚建，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人