基于知识的动作工具对象智能交互检测方法技术

技术编号:43392166 阅读:15 留言:0更新日期:2024-11-19 18:06
本申请提供了基于知识的动作工具对象智能交互检测方法,涉及图像识别技术领域,该方法包括:通过骨干网络获取输入图像的视觉特征;激活交互检测器,所述交互检测器中内嵌有交互预测策略,对所述视觉特征进行分析,得到预测HTOL实例;通过实例匹配器得到预测匹配度;当所述预测匹配度达到匹配门限值时,将所述预测HTOL实例作为所述输入图像的交互检测结果。现有的二元检测算法仅表达动作类别,无法描述工具的多义性,无法细分出不同工具作用于一个操作的执行动作,实现更精确地检测和理解人的动作、工具和对象之间的交互,评估工具使用的正确性,为多种应用场景提供有价值的功能性评估和分析。

【技术实现步骤摘要】

本申请涉及图像识别,尤其涉及基于知识的动作工具对象智能交互检测方法


技术介绍

1、在人物交互检测领域,尤其是涉及到工具操作的场景,传统的方法往往局限于二元检测算法,即主要关注人类动作与动作或物体的关系,而忽视了操作工具与操作对象之间复杂且精细的空间关系。这种局限性使得现有技术在面对多义性工具和不同操作动作时显得力不从心,无法准确细分和描述不同工具在执行同一操作时的具体行为。示范性的如现有的二元检测算法通常只能输出动作类别,而无法详细描述工具与物体之间的交互细节,如工具的使用方式、工具的功能属性以及这些属性如何影响操作的执行。此外,由于缺乏对工具功能性的深入理解,现有技术往往无法准确评估工具使用的正确性,这在需要精确操作和高安全性的场景中尤为重要。

2、综上所述,现有的二元检测算法,在人操作工具执行的场景无法表达出操作工具与操作对象之间的空间关系,仅表达动作类别,无法描述工具的多义性,无法细分出不同工具作用于一个操作的执行动作。

3、因此,如何将人物二元检测算法扩展到人的动作、工具、对象三元检测,并考虑工具的功能属性,给出动作类别和本文档来自技高网...

【技术保护点】

1.基于知识的动作工具对象智能交互检测方法,其特征在于,包括:

2.根据权利要求1所述基于知识的动作工具对象智能交互检测方法,其特征在于,包括:

3.根据权利要求2所述基于知识的动作工具对象智能交互检测方法,其特征在于,所述目标HTOL实例是指根据所述输入图像的真实交互信息建立的HTOL实例。

4.根据权利要求2所述基于知识的动作工具对象智能交互检测方法,其特征在于,还包括:

5.根据权利要求3所述基于知识的动作工具对象智能交互检测方法,其特征在于,还包括:

6.根据权利要求1所述基于知识的动作工具对象智能交互检测方法,其特征在...

【技术特征摘要】

1.基于知识的动作工具对象智能交互检测方法,其特征在于,包括:

2.根据权利要求1所述基于知识的动作工具对象智能交互检测方法,其特征在于,包括:

3.根据权利要求2所述基于知识的动作工具对象智能交互检测方法,其特征在于,所述目标htol实例是指根据所述输入图像的真实交互信息建立的htol实例。

4.根据权利要求2所述基...

【专利技术属性】
技术研发人员:缪家冬张鹏夏阳黄超秦虓王涛
申请(专利权)人:无锡广盈集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1