基于多模态的图像检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号：30786170 阅读：13 留言：0更新日期：2021-11-16 07:48

本公开提出了基于多模态的图像检测方法、装置、电子设备及存储介质，涉及人工智能技术领域，尤其涉及计算机视觉和深度学习等技术领域，可应用于人脸识别场景下。具体实现方案：获取参考帧图像和待处理帧图像，参考帧图像和待处理帧图像的模态不相同，并从参考帧图像之中识别出参考检测框，以及将参考检测框映射至待处理帧图像之中，以得到目标检测框，目标检测框被用于进行图像检测，能够实现对不同模态图像中的检测框进行准确地映射，当采用映射得到的目标检测框进行图像检测时，能够有效提升复杂场景下图像检测准确率与召回率，提高图像识别系统的有效性。别系统的有效性。别系统的有效性。

全部详细技术资料下载

【技术实现步骤摘要】
基于多模态的图像检测方法、装置、电子设备及存储介质

[0001]本公开涉及人工智能
，尤其涉及计算机视觉和深度学习等
，可应用于人脸识别场景下，具体涉及基于多模态的图像检测方法、装置、电子设备及存储介质。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术，以及机器学习、深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]人脸识别是计算机视觉技术和图像处理技术的重要组成部分，广泛应用于交通、金融等领域。而图像检测是人脸识别过程中的一个关键环节，相关技术中，主要基于可见光摄像头与近红外摄像头采集的视频帧进行图像检测。

技术实现思路

[0004]提供了一种基于多模态的图像检测方法、装置、电子设备、存储介质及计算机程序产品。
[0005]根据第一方面，提供了一种基于多模态的图像检测方法，包括：获取参考帧图像和待处理帧图像，参考帧图像和待处理帧图像的模态不相同；从参考帧图像之中识别出参考检测框；以及将参考检测框映射至待处理帧图像之中，以得到目标检测框，目标检测框被用于进行图像检测。
[0006]根据第二方面，提供了一种基于多模态的图像检测装置，包括：第一获取模块，用于获取参考帧图像和待处理帧图像，参考帧图...

【技术保护点】

【技术特征摘要】
1.一种基于多模态的图像检测方法，包括：获取参考帧图像和待处理帧图像，所述参考帧图像和所述待处理帧图像的模态不相同；从所述参考帧图像之中识别出参考检测框；以及将所述参考检测框映射至所述待处理帧图像之中，以得到目标检测框，所述目标检测框被用于进行图像检测。2.根据权利要求1所述的方法，所述参考帧图像由参考摄像头捕获，所述待处理帧图像由目标摄像头捕获，其中，所述将所述参考检测框映射至所述待处理帧图像之中，以得到目标检测框，包括：获取所述参考摄像头的参考摄像参数，并获取所述目标摄像头的目标摄像参数；确定所述参考摄像参数和所述目标摄像参数之间的参数映射关系；以及根据所述参数映射关系，将所述参考检测框映射至所述待处理帧图像之中，以得到所述目标检测框。3.根据权利要求2所述的方法，其中，所述确定所述参考摄像参数和所述目标摄像参数之间的参数映射关系，包括：获取所述参考摄像头的参考深度信息，并获取所述目标摄像头的目标深度信息；根据所述参考摄像参数、所述参考深度信息结合世界坐标系，确定所述参考帧图像中的参考像素坐标；根据所述目标摄像参数、所述目标深度信息结合所述世界坐标系，确定所述待处理帧图像中的目标像素坐标；以及确定所述参考像素坐标和所述目标像素坐标之间的映射关系并作为所述参数映射关系。4.根据权利要求3所述的方法，其中，所述根据所述参数映射关系，将所述参考检测框映射至所述待处理帧图像之中，以得到所述目标检测框，包括：确定所述参考检测框对应的第一像素坐标，所述第一像素坐标，是所述参考检测框所包含的参考像素点的坐标；根据所述第一像素坐标结合所述参数映射关系确定第二像素坐标，所述第二像素坐标，是所述待处理帧图像中的目标像素点的坐标；以及将所述待处理帧图像中包含所述目标像素点的坐标的检测框作为所述目标检测框。5.根据权利要求2所述的方法，在所述将所述参考检测框映射至所述待处理帧图像之中，以得到目标检测框之后，还包括：获取所述目标检测框的检测框坐标；根据所述检测框坐标生成目标摄像参数；控制所述目标摄像头基于所述目标摄像参数，捕获所述待处理帧图像的下一帧图像。6.根据权利要求1
‑
5任一项所述的方法，所述参考帧图像和所述待处理帧图像是相同时刻捕获得到的图像。7.一种基于多模态的图像检测装置，包括：第一获取模块，用于获取参考帧图像和待处理帧图像，所述参考帧图像和所述待处理帧图像的模态不相同；
识别模块，用于从所述参考帧图像之中识别出参考检测框；以及映射模块，用于将所述参考检测框映射至所述待处理帧图像之中...

【专利技术属性】
技术研发人员：岳海潇，王珂尧，冯浩城，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人