多模态目标识别方法和系统技术方案

技术编号：27132541 阅读：16 留言：0更新日期：2021-01-25 20:17

本公开提供了一种多模态目标识别方法，包括：在多对象场景中对每个对象进行多模态跟踪，以获取每个对象在各个模态下的模态信息；关联所述对象在各个模态下的模态信息以形成所述对象的模态信息集；在所述多对象场景中选择目标；基于所选目标确定所述目标的模态信息集；在所述目标的模态信息集中选择可用的模态信息；以及基于所述可用的模态信息识别所述目标。标。标。

全部详细技术资料下载

【技术实现步骤摘要】
多模态目标识别方法和系统

[0001]本公开主要涉及目标识别，尤其涉及多模态下的目标识别。

技术介绍

[0002]线下刷脸支付的摄像头，为了极高的安全性，基本上都采用2D+3D或者2D+IR+3D的多模态摄像头。常规的方案一般选择在2D上做检测，基于2D脸的大小进行选脸，或者结合人脸检测框对应的平均深度值计算人脸检测框在空间的位置进行选脸。
[0003]但是各个模态对各自环境的适应能力不同，只依赖2D摄像头进行主要的检测和选脸逻辑，使得在极端光线等情况下3D或者IR模态能够检测到人脸，但是2D模态检测失败，也不能继续进行人脸识别的全链路，对全链路通过率造成了很大的伤害。
[0004]在其它场景中，例如危险人物追踪或儿童失踪、高价值货物丢失等的场景，同样需要在关键地点实现不受光线或遮挡影响的目标识别。
[0005]因此，本领域需要在极端光线条件下或者目标受到遮挡的情况下，仍然能够进行目标识别的方法和系统。

技术实现思路

[0006]为解决上述技术问题，本公开提供了一种在极端光线条件下或者目标受到遮挡的情况下，仍然能够进行目标识别的方案。
[0007]在本公开一实施例中，提供了一种多模态目标识别方法，包括：在多对象场景中对每个对象进行多模态跟踪，以获取每个对象在各个模态下的模态信息；关联对象在各个模态下的模态信息以形成对象的模态信息集；在多对象场景中选择目标；基于所选目标确定目标的模态信息集；在目标的模态信息集中选择可用的模态信息；以及基于可用的模态信息识别目标。
...

【技术保护点】

【技术特征摘要】
1.一种多模态目标识别方法，包括：在多对象场景中对每个对象进行多模态跟踪，以获取所述对象在各个模态下的模态信息；关联所述对象在各个模态下的模态信息以形成所述对象的模态信息集；在所述多对象场景中选择目标；基于所选目标确定所述目标的模态信息集；在所述目标的模态信息集中选择可用的模态信息；以及基于所述可用的模态信息识别所述目标。2.如权利要求1所述的方法，所述模态信息包括：RGB图像、IR图像、3D图像、视频帧、声音、姿态、指纹、脉搏波。3.如权利要求1所述的方法，关联所述对象在各个模态下的模态信息以形成所述对象的模态信息集进一步包括：在所述模态信息是图像的情况下，采用图像哈希技术进行关联映射。4.如权利要求1所述的方法，关联所述对象在各个模态下的模态信息以形成所述对象的模态信息集进一步包括：在所述多对象场景是密集场景的情况下，采用区域交并比(IOU)和非极大值抑制(NMS)进行关联映射。5.如权利要求1所述的方法，在所述多对象场景中选择目标包括基于空间位置来选择所述目标。6.如权利要求1所述的方法，在所述多对象场景中选择目标包括基于场景选择所述目标。7.如权利要求1所述的方法，在所述目标的模态信息集中选择可用的模态信息包括选择具备区分度的模态信息。8.如权利要求1所述的方法，在所述目标的模态信息集中选择可用的模态信息包括根据不同的场景选择不同的模态信息。9.一种多模态目标识别系统，包括：模态信息收集模块，用于：在多对象场景中对每个对象进行多模态跟踪，以获取每个对象在各个模态下的模态信息；关联所述对象在各个模态下的模态信息以形成所述对象的模态信息集；目标选择模块，...

【专利技术属性】
技术研发人员：郑丹丹，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人