【技术实现步骤摘要】
一种基于自适应上下文区域选取的动作识别方法
本专利技术涉及计算机视觉、动作识别
,尤其是涉及一种基于自适应上下文区域选取的动作识别方法。
技术介绍
数十年来,动作识别一直是计算机视觉领域的一个重要研究分支,其研究范围涵盖图像、视频数据等诸多方面,相关技术也在人机交互、信息检索、安全监控等领域广泛应用。传统的动作识别多采用基于手工特征的方法。近年来,得益于深度学习的快速发展,采用基于深层神经网络学习和提取特征的动作识别方法也层出不穷。依据其提取和利用的特征,这些方法可以分为三类:基于整体特征的方法、基于局部特征的方法和基于上下文特征的方法。对于基于整体特征的方法,从人的边界框(boundingbox)区域提取的特征与全局的图像特征一起用于识别动作。对于基于局部特征的方法,通常是将从人物各个关节位置的特征连接(concatenate)起来一并送入分类器,对动作进行分类。基于上下文特征的方法则是依赖于方法所提取到的动作上下文来进行动作识别,如图片里的物体、背景信息、其它的人物等。最近几年,基于上下文特征的动作 ...
【技术保护点】
1.一种基于自适应上下文区域选取的动作识别方法,用于识别图像中的人物动作,其特征在于,包括以下步骤:/nS1)利用ResNet模型的前四个卷积块,提取待识别图像整体的特征图和待识别图像中待识别动作人物的人物边界框n;/nS2)根据特征图和人物边界框n的相关信息,自适应选取待识别图像中每个人物的上下文区域边界框;/nS3)对人物边界框n和上下文区域边界框进行特征提取,并计算得到人物对应各动作类别的得分和上下文区域对应各动作类别的得分;/nS4)根据人物和上下文区域对应动作类别的得分,判断图像中人物的动作类别,完成人物动作的识别。/n
【技术特征摘要】
1.一种基于自适应上下文区域选取的动作识别方法,用于识别图像中的人物动作,其特征在于,包括以下步骤:
S1)利用ResNet模型的前四个卷积块,提取待识别图像整体的特征图和待识别图像中待识别动作人物的人物边界框n;
S2)根据特征图和人物边界框n的相关信息,自适应选取待识别图像中每个人物的上下文区域边界框;
S3)对人物边界框n和上下文区域边界框进行特征提取,并计算得到人物对应各动作类别的得分和上下文区域对应各动作类别的得分;
S4)根据人物和上下文区域对应动作类别的得分,判断图像中人物的动作类别,完成人物动作的识别。
2.根据权利要求1所述的一种基于自适应上下文区域选取的动作识别方法,其特征在于,所述的步骤S2)具体包括:
S201)以特征图的每一个点为中心,在每一个点上分别预设9个大小不同的锚点框;
S202)通过两个卷积层,分别计算得到所有锚点框对应的预测参数,所述的预测参数包括锚点框与人物空间位置相关性的预测值s和锚点框的坐标变换参数;
S203)锚点框根据坐标变换参数进行坐标变换,得到变换后的锚点框;
S204)以预测值s和各锚点框相交区域面积为依据,去除重复锚点框,得到候选上下文集合B;
S205)根据候选上下文集合B中各锚点框m与人物边界框n之间的相交区域比例overlap(m,n),对锚点框进行筛选,得到筛选后的上下文集合R(m′),其中m′为上下文集合R(m′)中的锚点框;
S206)选取筛选后的上下文集合R(c)中预测值s最大的前N个锚点框,作为最终自适应选取的上下文区域边界框。
3.根据权利要求2所述的一种基于自适应上下文区域选取的动作识别方法,其特征在于,所述的步骤S203)中,进行坐标变换的公式为:
xt=w*tx+x
yt=h*ty+y,
其中,x为锚点框的中心点横坐标,y为锚点框的中心点纵坐标,w为锚点框的宽,h为锚点框的高,tx为锚点框中心点横坐标的变换参数,ty为锚点框中心点纵坐标的变换参数,tw为锚点框宽的变换参数,th为锚点框高的变换参数,xt为变换后锚点框的中心点横坐标,yt为变换后锚点框的中心点纵坐标,wt为变换后锚点框的长,ht为变换后锚点框的宽。
4.根据权利要求3所述的一种基于自适应上下文区域选取的动作识别方法,其特征在于,所述的相交区域比例overlap(m,n)的计算公式为:
其中,area(m)为候选上下文集合B中锚点框m的面积,area(n)为人物边界框n的面积;
所述的上下文集合R(m′)的表达式为:
R(m')={m∈B:over...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。