一种安全帽检测方法、装置、终端设备及存储介质制造方法及图纸

技术编号：40383959 阅读：7 留言：0更新日期：2024-02-20 22:19

本发明专利技术是关于一种安全帽检测方法、装置、终端设备及存储介质。该方法包括：获取人员头部的图像；通过预先训练的视觉语言大模型对所述人员头部的图像中是否佩戴安全帽进行检测。本发明专利技术提供的技术方案，通过视觉语言大模型对模型进行安全帽检测，无需对不同类型的安全帽进行标注训练，降低了数据采集、数据标注、数据训练的工作量，可实现对多种类型安全帽的检测。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能及安全管理领域，尤其涉及一种安全帽检测方法、装置、终端设备及存储介质。

技术介绍

1、目前，对于人员是否佩戴安全帽的检测方法中，主要是通过目标检测算法来实现的。通常使用目标检测算法来识别图像或视频中的人头部和安全帽。常用的目标检测算法包括faster r-cnn、yolo(you only look once)、ssd(single shot multibox detector)等，它们可以检测并定位图像中的多个目标，从而判断出人员是否佩戴安全帽。这种目标检测具有一定的局限性，其主要的问题在于安全帽的种类较多，不同的场景中佩戴不同的安全帽，而目标检测算法需要在训练集中对这些安全帽的类别都进行训练，从而才能达到较好的识别效果，这在数据采集和数据标注训练方面的工作量是十分巨大的。因此目前的这种直接对安全帽进行标注训练的方式是存在局限性的，其数据采集是较为困难的。

技术实现思路

1、为克服相关技术中存在的问题，本专利技术提供一种结合姿态估计和视觉语言预训练大模型的方法来对是否佩戴安全帽进行检测的方法及装置。这种方式无需标注训练，可快速应用于实际领域，且准确率较高。

2、根据本专利技术实施例的第一方面，提供一种安全帽检测方法，包括：

3、获取人员头部的图像；

4、通过预先训练的视觉语言大模型对所述人员头部的图像中是否佩戴安全帽进行检测。

5、进一步，所述获取人员头部的图像，具体包括：

6、通过姿态估计模型确定

7、根据所述位置裁剪人员头部的图像。

8、进一步，该方法还包括：训练所述视觉语言大模型，具体包括：

9、使用对比损失函数，将安全帽相关的图像和文本对进行比较，即对于每个图像，选择一个与之相关的文本描述，对于每个文本描述，选择一个与之相关的图像；

10、计算图像和文本描述之间的相似度，确定相似图像和文本对和不相关文本对；

11、最小化所述相似图像和文本对的距离，并最大化所述不相关图像和文本对的距离。

12、进一步，该方法还包括：

13、在检测到未佩戴安全帽时，生成报警信息。

14、根据本专利技术实施例的第二方面，提供一种安全帽检测装置，其特征在于，包括：

15、图像获取模块，用于获取人员头部的图像；

16、安全帽检测模块，用于通过预先训练的视觉语言大模型对所述图像获取模块获取的所述人员头部的图像中是否佩戴安全帽进行检测。

17、进一步，所述图像获取模块，具体包括：

18、关键点检测单元，用于通过姿态估计模型确定视频画面中人员头部的关键点的位置；

19、图像裁剪单元，用于根据所述位置裁剪人员头部的图像。

20、进一步，该装置还包括：训练模块，用于训练所述视觉语言大模型，具体用于：

21、使用对比损失函数，将安全帽相关的图像和文本对进行比较，即对于每个图像，选择一个与之相关的文本描述，对于每个文本描述，选择一个与之相关的图像；

22、计算图像和文本描述之间的相似度，确定相似图像和文本对和不相关文本对；

23、最小化所述相似图像和文本对的距离，并最大化所述不相关图像和文本对的距离。

24、进一步，该装置还包括：

25、报警模块，用于在所述安全帽检测模块检测到未佩戴安全帽时，生成报警信息。

26、根据本专利技术实施例的第三方面，提供一种终端设备，包括：

27、处理器；以及

28、存储器，其上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行如上所述的方法。

29、根据本专利技术实施例的第四方面，提供一种非暂时性机器可读存储介质，其上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行如上所述的方法。

30、本专利技术的实施例提供的技术方案可以包括以下有益效果：

31、通过视觉语言大模型对模型进行安全帽检测，无需对不同类型的安全帽进行标注训练，降低了数据采集、数据标注、数据训练的工作量，可实现对多种类型安全帽的检测。

32、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本专利技术。

本文档来自技高网...

【技术保护点】

1.一种安全帽检测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述获取人员头部的图像，具体包括：

3.根据权利要求1所述的方法，其特征在于，还包括：训练所述视觉语言大模型，具体包括：

4.根据权利要求1-3任一项所述的方法，其特征在于，还包括：

5.一种安全帽检测装置，其特征在于，包括：

6.根据权利要求5所述的装置，其特征在于，所述图像获取模块，具体包括：

7.根据权利要求5所述的装置，其特征在于，还包括：训练模块，用于训练所述视觉语言大模型，具体用于：

8.根据权利要求5-7任一项所述的装置，其特征在于，还包括：

9.一种终端设备，其特征在于，包括：

10.一种非暂时性机器可读存储介质，其上存储有可执行代码，其特征在于，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行如权利要求1-4中任一项所述的方法。

【技术特征摘要】

1.一种安全帽检测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述获取人员头部的图像，具体包括：

3.根据权利要求1所述的方法，其特征在于，还包括：训练所述视觉语言大模型，具体包括：

4.根据权利要求1-3任一项所述的方法，其特征在于，还包括：

5.一种安全帽检测装置，其特征在于，包括：

6.根据权利要求5所述的装置，其特征在于，所述图像获取模...

【专利技术属性】
技术研发人员：李忠义，任帅，李大壮，刘志，朱晓宁，
申请(专利权)人：精英数智科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人