当前位置: 首页 > 专利查询>广东顺德中山大学卡内基梅隆大学国际联合研究院专利>正文

一种基于两层时空邻域特征的动作识别方法技术

技术编号：13747525 阅读：89 留言：0更新日期：2016-09-24 04:16

本发明专利技术公开一种基于两层时空邻域特征的动作识别方法，包括：对输入的视频，根据视频中连续帧的运动方向变化信息，提取运动变化模式特征作为视频的第一层原始特征。对第一层特征采用改进的词袋模型进行特征建模，得到第一层特征的向量表示。根据第一层中的每个局部兴趣点和最近邻若干兴趣点之间的时空关系，计算出第二层时空特征。对第二层特征采用改进的词袋模型进行特征建模，得到第二层特征的向量表示。将第一、二层的向量表示级联，形成视频最终的中层特征表达。采用支持向量机进行特征分类，得到识别准确率。本发明专利技术能有效地获取最近邻兴趣点的相对位置信息和类别信息，并结合了改进的词袋模型方法进行特征建模，显著提高了动作识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉领域，更具体地，涉及一种基于两层时空邻域特征的动作识别方法。
技术介绍
科技的发展使得摄像设备得到了普及，数量巨大的视频数据也随之产生。同时，针对视频的应用也应运而生：智能视频监控、视频数据分类、高级人机交互等。在这些应用中，针对人的动作进行理解是最核心的关注点，也是人们研究的核心内容。由于人体动作识别有很大的潜在价值，所以此课题作为一个研究热点已经持续了至少十年时间，很多种方法都被提出，例如：基于状态空间的方法、基于全局的方法、基于时空兴趣点的方法以及基于卷积神经网络的方法等。其中，基于时空兴趣点的方法和基于CNN的方法研究的人数众多，这两种方法能够取得目前最好的结果。然而，深层CNN网络由于有大量的参数需要通过学习获得，而目前绝大部分数据集并不能满足深层CNN网络学习所需的规模，因此限制了深层CNN网络在动作识别领域的应用。此外，深层CNN网络的训练过程所耗费的时间相当多，对参数进行优化是一个长期的过程，这个条件进一步限制了CNN方法在基于视频的动作识别领域的延伸。所以，我们的动作识别研究将针对基于时空兴趣点的方法。基于时空兴趣点的方法的主要步骤是：首先，对视频进行时空兴趣点检测，然后对兴趣点进行描述；接下来对这些特征点描述子采用词袋模型进行编码，生成最终的视频层表达特征；这些特征会被放入分类器中进行分类，以完成最终的识别过程。很多学者在这个基础上进行了探索和改进。Laptev等人二维图像的兴趣点扩展到三维时空领域，首次提出时空兴趣点的概念。Dollar等人提出了一种时空窗的方法来检测时空兴趣点。在特征表示方面，多种兴趣点特征...

【技术保护点】
一种基于两层时空邻域特征的动作识别方法，其特征在于，包括以下步骤：(1)输入待识别的视频，根据视频中连续帧的运动方向变化信息，提取运动变化模式特征作为视频的第一层原始特征；(2)对第一层原始特征采用包含k‑means++聚类方法的改进词袋模型进行特征建模，得到第一层原始特征的向量表示；(3)根据第一层原始特征中的每个局部兴趣点和最近邻若干兴趣点之间的时空关系，计算出第二层时空特征；(4)对第二层时空特征同样采用改进的词袋模型进行特征建模，得到第二层时空特征的向量表示；(5)将第一层原始特征和第二层时空特征的向量表示级联起来，形成该视频最终的中层特征表达；(6)采用支持向量机(SVM)进行特征分类，最终输出动作视频的识别准确率；所述改进的词袋模型的具体实现包括数据聚类和计算统计频率直方图这两个步骤，其聚类是采用k‑means++方法k‑means++方法的描述如下：(3‑1)从输入的数据点集合中随机选择一个点作为第一个聚类中心；(3‑2)对于数据集中的每一个点x，计算它与已选择的聚类中心中最近的聚类中心的距离D(x)；(3‑3)选择一个新的数据点作为新的聚类中心，其选择的原则是：D(x)...

【技术特征摘要】
1.一种基于两层时空邻域特征的动作识别方法，其特征在于，包括以下步骤：(1)输入待识别的视频，根据视频中连续帧的运动方向变化信息，提取运动变化模式特征作为视频的第一层原始特征；(2)对第一层原始特征采用包含k-means++聚类方法的改进词袋模型进行特征建模，得到第一层原始特征的向量表示；(3)根据第一层原始特征中的每个局部兴趣点和最近邻若干兴趣点之间的时空关系，计算出第二层时空特征；(4)对第二层时空特征同样采用改进的词袋模型进行特征建模，得到第二层时空特征的向量表示；(5)将第一层原始特征和第二层时空特征的向量表示级联起来，形成该视频最终的中层特征表达；(6)采用支持向量机(SVM)进行特征分类，最终输出动作视频的识别准确率；所述改进的词袋模型的具体实现包括数据聚类和计算统计频率直方图这两个步骤，其聚类是采用k-means++方法k-means++方法的描述如下：(3-1)从输入的数据点集合中随机选择一个点作为第一个聚类中心；(3-2)对于数据集中的每一个点x，计算它与已选择的聚类中心中最近的聚类中心的距离D(x)；(3-3)选择一个新的数据点作为新的聚类...

【专利技术属性】
技术研发人员：胡海峰，肖翔，张伟，顾建权，
申请(专利权)人：广东顺德中山大学卡内基梅隆大学国际联合研究院，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人