交互关系检测方法、模型训练方法、设备及存储介质技术

技术编号：32640753 阅读：17 留言：0更新日期：2022-03-12 18:16

本申请实施例提供一种交互关系检测方法、模型训练方法、设备及存储介质。其中，方法包括如下的步骤：获取待检测图像；利用训练过的交互关系检测模型对所述待检测图像进行交互关系检测；其中，所述交互关系检测模型，用于：根据所述待检测图像，确定所述待检测图像中多个目标的视觉特征；对所述多个目标的视觉特征进行特征融合，得到所述多个目标各自的融合后视觉特征；根据所述多个目标中第一目标和第二目标各自的融合后视觉特征，对所述第一目标和所述第二目标进行交互关系检测，得到第一交互关系检测结果。本申请实施例提供的交互关系检测方案的检测准确率高。方案的检测准确率高。方案的检测准确率高。

全部详细技术资料下载

【技术实现步骤摘要】
交互关系检测方法、模型训练方法、设备及存储介质

[0001]本申请涉及计算机
，尤其涉及一种交互关系检测方法、模型训练方法、设备及存储介质。

技术介绍

[0002]近年来，目标检测技术和目标分类技术取得了较大进展。但是，图像所涉及的场景信息是无法通过基础的目标检测和目标分类方法进行判断，需要更深层次的语义识别才能实现，比如：违规遛狗、游商小贩经营人识别，等等。为了了解到图像中的场景信息，也就需要认识到图像中各个目标之间是如何互动的。交互关系检测是一种针对图像中多个目标之间的交互关系的高语义、细粒度的理解任务，目的是识别出图片中发生交互关系的三元组<目标1，关系，目标2>。其中，目标可以为物体(例如物品、动物、植物等)，也可以为人物。人物交互关系检测(Human
‑
object interaction，HOI)是交互关系检测中的重要分支，在人物交互关系检测中，目标分别为人与物体。
[0003]目前，现有的交互关系检测方法存在检测结果准确性较低的问题。

技术实现思路

[0004]鉴于上述问题，提出了本申请以提供一种解决上述问题或至少部分地解决上述问题的交互关系检测方法、模型训练方法、设备及存储介质。
[0005]于是，在本申请的一个实施例中，提供了一种交互关系检测方法。该方法包括：
[0006]获取待检测图像；
[0007]利用训练过的交互关系检测模型对所述待检测图像进行交互关系检测；
[0008]其中，所述交互关...

【技术保护点】

【技术特征摘要】
1.一种交互关系检测方法，其中，包括：获取待检测图像；利用训练过的交互关系检测模型对所述待检测图像进行交互关系检测；其中，所述交互关系检测模型，用于：根据所述待检测图像，确定所述待检测图像中多个目标的视觉特征；对所述多个目标的视觉特征进行特征融合，得到所述多个目标各自的融合后视觉特征；根据所述多个目标中第一目标和第二目标各自的融合后视觉特征，对所述第一目标和所述第二目标进行交互关系检测，得到第一交互关系检测结果。2.根据权利要求1所述的方法，其中，所述交互关系检测模型中包括第一自注意力网络；所述第一自注意力网络用于对所述多个目标的视觉特征进行特征融合，得到所述多个目标各自的融合后视觉特征。3.根据权利要求1或2所述的方法，其中，所述交互关系检测模型，还用于：根据所述待检测图像中所述第一目标和所述第二目标的位置信息，确定所述第一目标与所述第二目标的空间特征；根据所述第一目标和所述第二目标各自的视觉特征，确定所述第一目标与所述第二目标的组合视觉特征；根据所述组合视觉特征和所述空间特征，对所述第一目标和所述第二目标进行交互关系检测，得到第二交互关系检测结果；根据所述第一交互关系检测结果以及所述第二交互关系检测结果，确定目标交互关系检测结果。4.根据权利要求3所述的方法，其中，根据所述组合视觉特征和所述空间特征，对所述第一目标和所述第二目标进行交互关系检测，得到第二交互关系检测结果，包括：利用所述交互关系检测模型中第二自注意力网络对所述组合视觉特征以及所述空间特征进行特征融合，得到融合后组合视觉特征和融合后空间特征；根据所述融合后组合视觉特征和所述融合后空间特征，对所述第一目标和所述第二目标进行交互关系检测，得到第二交互关系检测结果。5.根据权利要求3所述的方法，其中，根据所述待检测图像，确定所述待检测图像中多个目标的视觉特征，包括：对所述待检测图像进行特征提取，得到视觉特征图；根据所述待检测图像中所述多个目标各自的位置信息，在所述视觉特征图中确定出所述多个目标各自的视觉特征。6.根据权利要求5所述的方法，其中，所述交互关系检测模型，还用于：在所述待检测图像中确定出包围所述第一目标的边界框和所述第二目标的边界框的外接框；根据所述待检测图像中所述外接框的位置信息，在所述视觉特征图中确定出外接框区域视觉特征；根据所述第一目标和所述第二目标各自的视觉特征，确定所述第一目标与所述第二目标的组合视觉特征，包括：拼接所述第一目标和所述第二目标各自的视觉特征以及所述外接框区域视觉特征，得
到所述的第一目标和所述第二目标的组合视觉特征。7.根据权利要求3所述的方法，其中，所述交互关系检测模型，还用于：根据所述空间特征，对所述第一目标和所述第二目标进行交互关系检测，得到第三交互关系检测结果；根据所述第一交互关系检测结果以及所述第二交互关系检测结果，确定目标交互关系检测结果，包括：根据所述第一交互关系检测结果、所述第二交互关系检测结果以及第三交互关系检测结果，确定目标交互关系检测结果。8.根据权利要求1或2所述的方法，其中，还包括：获取带有交互关系标签的样本图像；利用所述交互关系检测模型对所述样本待检测图像进行交互关系检测，得到目标样本交互关系检测结果；根据所述目标样本交互关系检测结果...

【专利技术属性】
技术研发人员：王丹，林旸，陶明渊，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人