目标体的动作行为识别方法及装置制造方法及图纸

技术编号：19122658 阅读：45 留言：0更新日期：2018-10-10 05:29

本发明专利技术属于计算机视觉技术领域，具体涉及一种目标体的动作行为识别方法及装置，旨在解决如何准确识别具有相似背景的视频中动作行为的技术问题。为此目的，本发明专利技术中目标体的动作行为识别方法包括：基于预先构建的行为识别模型，获取目标体的时序视频特征，并根据所获取的时序视频特征，预测每个预设的所述目标体的动作行为类别对应的类属概率；根据预测结果，确定目标体的动作行为类别。基于本发明专利技术的方法，可以很好地捕捉视频整体的特征，以此能够很好的识别出具有相似背景及易混淆的视频中动作行为。

全部详细技术资料下载

【技术实现步骤摘要】
目标体的动作行为识别方法及装置
本专利技术涉及计算机视觉
，具体涉及一种目标体的动作行为识别方法及装置。
技术介绍
人体动作行为识别技术广泛应用于人机智能交互、虚拟实现和视频监控等领域，其能够对人在不同场景下面的动作行为进行区分和判断。传统的动作行为识别方法，如基于双流卷积神经网络的动作行为识别方法，主要是通过提取并分析视频特征来识别动作行为的。基于双流卷积神经网络的动作行为识别方法主要包括如下步骤：首先，将视频拆分成空域和时域两种模态，并对这两种模态的数据分别进行处理。其次，对处理后的两种模态数据进行特征融合。最后，根据特征融合结果判断当前视频所对应的动作行为类别标签。这种动作行为识别方法虽然能够准确识别出视频所对应的动作行为类别，但是其往往利用视频的单帧信息对双流卷积神经网络进行网络训练(即只能学习视频的局部信息)，因此在提取视频特征时也只能提取视频的局部特征。当对具有相似背景(如打球和灌篮)的视频进行动作识别时，将不能准确识别出动作行为类别。
技术实现思路
为了解决现有技术中的上述问题，即为了解决如何准确识别具有相似背景的视频中动作行为的技术问题。为此目的，本专利技术的第一方面，提供了一种目标体的动作行为识别方法，所述动作行为识别方法包括：基于预先构建的行为识别模型，获取所述目标体的时序视频特征，并根据所获取的时序视频特征，预测每个预设的所述目标体的动作行为类别对应的类属概率；根据预测结果，确定所述目标体的动作行为类别；其中，所述行为识别模型为基于预设的目标体视频样本，并利用机器学习算法所构建的双流卷积神经网络模型。进一步地，本专利技术提供的一个优...
目标体的动作行为识别方法及装置

【技术保护点】
1.一种目标体的动作行为识别方法，其特征在于，所述动作行为识别方法包括：基于预先构建的行为识别模型，获取所述目标体的时序视频特征，并根据所获取的时序视频特征，预测每个预设的所述目标体的动作行为类别对应的类属概率；根据预测结果，确定所述目标体的动作行为类别；其中，所述行为识别模型为基于预设的目标体视频样本，并利用机器学习算法所构建的双流卷积神经网络模型。

【技术特征摘要】
1.一种目标体的动作行为识别方法，其特征在于，所述动作行为识别方法包括：基于预先构建的行为识别模型，获取所述目标体的时序视频特征，并根据所获取的时序视频特征，预测每个预设的所述目标体的动作行为类别对应的类属概率；根据预测结果，确定所述目标体的动作行为类别；其中，所述行为识别模型为基于预设的目标体视频样本，并利用机器学习算法所构建的双流卷积神经网络模型。2.根据权利要求1所述的目标体的动作行为识别方法，其特征在于，“获取所述目标体的时序视频特征”的步骤包括：获取所述目标体视频的空域视频信息和时域视频信息；基于预设的特征获取方法，并根据所述空域视频信息，获取所述目标体视频在空域模态下的时序视频特征；基于所述特征获取方法，并根据所述时域视频信息，获取所述目标体视频在时域模态下的时序视频特征。3.根据权利要求2所述的目标体的动作行为识别方法，其特征在于，所述特征获取方法包括：对特定视频信息进行抽帧处理，得到多个视频段信息；所述特定视频信息是空域视频信息或时域视频信息；对多个所述视频段信息分别进行编码，得到每个所述视频段信息对应的特征编码，并将所有视频段信息的特征编码合并，得到第一全局视频特征；对所述特定视频信息进行编码，得到该特定视频信息对应的第二全局视频特征；将所述第一全局视频特征和第二全局视频特征合并，得到所述特定视频信息对应的时序视频特征。4.根据权利要求2所述的目标体的动作行为识别方法，其特征在于，“根据所获取的时序视频特征，预测所述目标体的每个预设的动作行为类别对应的类属概率”的步骤包括：根据所述目标体视频在空域模态下的时序视频特征，预测每个所述动作类别对应的第一概率值；根据所述目标体视频在时域模态下的时序视频特征，预测每个所述动作类别对应的第二概率值；对所述第一概率值和第二概率值进行融合，得到每个所述动作类别对应的类属概率。5.根据权利要求4所述的目标体的动作行为识别方法，其特征在于，“对所述第一概率值和第二概率值进行融合，得到每个所述动作类别对应的类属概率”的步骤包括：对所述第一概率值和第二概率值进行加权求...

【专利技术属性】
技术研发人员：王亮，张兆翔，黄岩，李林，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人