The invention discloses an action recognition method based on global spatiotemporal attention model, which belongs to the field of action recognition. Firstly, a global spatiotemporal attention model is constructed. The global spatiotemporal attention model includes the sequentially connected global spatial attention model, the accumulative curve model ALC and the classification layer, and then human action is utilized. The global spatiotemporal attention model is trained, validated and tested sequentially. When the accuracy of the model with the best test effect reaches the set threshold, the training is completed and the model with the best test effect is taken as the final model, otherwise the training is continued. Finally, the human action sequence to be detected is input into the final model. Action recognition is carried out to get the recognition results. The global spatial attention model, global temporal attention model and backbone network are integrated, which makes the structure simpler, training easier and convergence faster. The end-to-end training method can be directly adopted without any additional steps.
【技术实现步骤摘要】
一种基于全局时空注意力模型的动作识别方法
本专利技术涉及动作识别领域,具体涉及一种基于全局时空注意力模型的动作识别方法。
技术介绍
随着人工智能的快速发展,基于深度学习的动作识别获得了越来越多研究群体的关注。其中,注意力模型能有效提升动作识别的精度,获得了广泛的应用。目前,在动作识别领域,主要有两类注意力模型:一类是时间注意力模型,它的主要作用是标识出动作序列中哪些帧在识别中具有更重要的作用,哪些帧的作用相对较小;另一类是空间注意力模型,它主要是标识出人体哪些关节点在识别动作中具有更加重要的作用,哪些关节点具有的作用相对较小。同时,按采用信息的不同,注意力模型还可分为:局部注意力模型和全局注意力模型。所谓局部注意力模型是指以局部的两帧或多帧序列来构建注意力。与之相对的是全局注意力模型,以整个动作序列为基础来构建注意力。目前在动作识别领域中,常用的是局部注意力模型,该类模型主要存在以下问题:其本质上是利用动作序列的前后两帧或多帧之间的差异来实现注意力,对动作序列来说,只有全部看完整个序列后才能准确的给出每帧动作的重要性、每个关节点的重要性,局部注意力模型无法给出准确的注意力权重;用于动作识别的局部时空注意力模型(包括局部空间注意力模型和局部时间注意力模型)由主干网、空间注意力和时间注意力3部分构成,结构复杂,训练过程繁琐,导致识别效果一般较差。
技术实现思路
本专利技术的目的在于:提供一种基于全局时空注意力模型的动作识别方法,解决了目前利用局部时空注意力模型进行动作识别,模型结构复杂、训练过程繁琐、识别效果差的技术问题。本专利技术采用的技术方案如下:一种基于全局 ...
【技术保护点】
1.一种基于全局时空注意力模型的动作识别方法,其特征在于:包括以下步骤:步骤1:构建全局时空注意力模型,所述全局时空注意力模型包括依次连接的全局空间注意力模型、累加式曲线模型ALC和分类层;步骤2:利用人体动作序列对所述全局时空注意力模型依次进行训练、验证和测试;步骤3:当测试效果最佳的模型精度达到设定的阈值,则完成训练并将测试效果最佳的模型作为最终模型,否则继续进行训练;步骤4:将待检测人体动作序列输入所述最终模型进行动作识别,得出动作序列的识别结果。
【技术特征摘要】
1.一种基于全局时空注意力模型的动作识别方法,其特征在于:包括以下步骤:步骤1:构建全局时空注意力模型,所述全局时空注意力模型包括依次连接的全局空间注意力模型、累加式曲线模型ALC和分类层;步骤2:利用人体动作序列对所述全局时空注意力模型依次进行训练、验证和测试;步骤3:当测试效果最佳的模型精度达到设定的阈值,则完成训练并将测试效果最佳的模型作为最终模型,否则继续进行训练;步骤4:将待检测人体动作序列输入所述最终模型进行动作识别,得出动作序列的识别结果。2.根据权利要求1所述的一种基于全局时空注意力模型的动作识别方法,其特征在于:所述步骤1中全局时空注意力模型的构建方法如下:步骤11:构建全局空间注意力模型,用于输入人体动作序列X,输出人体动作序列X的空间注意力权重a,a=(a1,...,ai,...,aK)=f(X),人体动作序列X表示为:X={Xt=(Xt,1,...,Xt,i...,Xt,K)|t=1,...,n},其中,t表示人体动作序列中动作的时刻,n表示人体动作序列的长度,K表示人体关节点的个数,i表示人体关节点的序号;步骤12:构建累加式曲线模型ALC,用于输入利用空间注意力权重a进行权重分配后的人体动作序列X′,输出人体动作序列具有时间注意力权重βt的特征ot,步骤13:构建分类层,用于输入特征ot,输出人体动作序列X的分类结果。3.根据权利要求2所述的一种基于全局时空注意力模型的动作识别方法,其特征在于:所述步骤11中,全局空间注意力模型包括依次连接的LSTM层、全连接层、ReLU层和Normalize层;LSTM层:用于提取所述人体动作序列X中每一动作的特征;全连接层:用于对输入该层的特征进行降维;ReLU层:用于增强全局空间注意力模型的非...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。