一种基于动态锚点的人物交互检测方法技术

技术编号：37774208 阅读：17 留言：0更新日期：2023-06-06 13:41

本发明专利技术提出一种基于动态锚点的人物交互检测算法,利用动态锚点引导模型提取实例的多尺度特征，利用动态锚点位置分布来匹配动态锚点和查询嵌入，将从多尺度特征中提取的语义信息添加到查询嵌入中，生成人物交互检测嵌入，并对所有元素进行预测。并对所有元素进行预测。并对所有元素进行预测。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于动态锚点的人物交互检测方法

[0001]本专利技术属于人工智能的图像处理领域，特别是一种基于动态锚点的人物交互检测方法。

技术介绍

[0002]人物交互检测主要是由人
‑
物体检测和人物交互动作识别两个部分，现有的方法主要分为两大类，两阶段方法和单阶段方法。两阶段方法首先通过现成的检测框架识别和定位图片中的实例(人和物)，然后使用从定位区域提取的视觉特征识别动作类。单阶段方法是结合Transformer检测出人
‑
物对，利用人
‑
物对之间的交互点同时预测人
‑
物的偏移量和动作类别。
[0003]但是，当图像中的人和物体距离较远时，这些方法会受到模糊语义特征的干扰。另外，现有的方法在图片存在噪声背景的时候往往无法提取到需要的特征，影响检测的准确率。

技术实现思路
：
[0004]本专利技术要解决的技术问题是现有人物交互检测方法存在噪声背景过大、模糊语义特征干扰，导致检测准确率低。
[0005]本专利技术提出一种基于动态锚点的人物交互检测方法。
[0006]一种基于动态锚点的人物交互检测方法，包括：
[0007]步骤1，将获取的图像切分成图像块；
[0008]步骤2，计算全局注意力，构建由层归一化、全局注意力、多层神经网络组成的交互模块，将交互模块应用到图像块上，提取锚点和多尺度特征；
[0009]步骤3，根据步骤2提取出的所有锚点计算出中心锚点，根据与中心锚点的距离重新排列所有锚点...

【技术保护点】

【技术特征摘要】
1.一种基于动态锚点的人物交互检测方法，其特征在于，包括：步骤1，将获取的图像切分成图像块；步骤2，计算全局注意力，构建由层归一化、全局注意力、多层神经网络组成的交互模块，将交互模块应用到图像块上，提取锚点和多尺度特征；步骤3，根据步骤2提取出的锚点计算出中心锚点，根据与中心锚点的距离重新排列锚点并按照距离划分区间，根据区间内的锚点数量得到分布频率，根据分布频率对每个距离区间内的锚点进行采样，得到采样锚点，按照采样的顺序对采样锚点和查询嵌入进行匹配；步骤4，利用匹配后的采样锚点将获取的图像和查询嵌入进行结合，将多尺度特征添加到查询嵌入中，生成人物交互检测器。2.根据权利要求1所述的基于动态锚点的人物交互检测方法，其特征在于，所述步骤1中，将图像切分成不重叠的图像块。3.根据权利要求1所述的基于动态锚点的人物交互检测方法，其特征在于，所述步骤2中，计算全局注意力的步骤为:利用分块函数对图像块分块，分成尺寸为的特征块，每个特征块映射到查询池化后拼接，再映射到键和值根据公式计算全局注意力，其中，B代表由深度卷积层预测的偏差，d是常数，Softmax()代表归一化指数函数，i代表第i个特征块，H和W分别代表token的高度和宽度，k
h
和k
w
分别代表特征块的高度和宽度。4.根据权利要求1所述的基于动态锚点的人物交互检测方法，其特征在于，所述中心锚点的算式为：其中，num
D
代表总锚点数量。代表所有锚点中第i个锚点的坐标，x
Centre
,y
Centre
代表中心锚点的坐标。5.根据权利要求1所述的基于动态锚点的人物交互检测方法，其特征在于，所述划分区间的算式为：其中，M
i
代表第i个区间，L<...

【专利技术属性】
技术研发人员：王越峰，马帅磊，魏颖，
申请(专利权)人：绍兴市北大信息技术科创中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人