基于自上而下学习的行为分类方法技术

技术编号:13863695 阅读:54 留言:0更新日期:2016-10-19 15:27
本发明专利技术公开了一种基于自上而下学习的行为分类方法,解决现有方法中没有考虑底层特征与分类任务相关性而导致分类精度不高的问题。其实现步骤是:(1)提取数据的底层特征,并对其进行预处理;(2)对底层特征进行稀疏表达,将得到的稀疏编码作为隐变量输入多元逻辑回归模型;(3)以交替迭代训练得到稀疏编码的字典和多元逻辑回归模型的回归系数;(4)利用学得的字典和多元逻辑回归模型,对底层特征进行稀疏编码和最终的分类,统计实验结果,得到分类精度。本发明专利技术充分利用了底层特征与高层分类任务的联系,克服了底层数据繁多难以处理的问题,提高了行为分类的准确度,可用于公共安全管理、动漫设计、影视创作等方面。

【技术实现步骤摘要】

本专利技术属于信息处理
,特别涉及一种行为识别技术,可用于公共安全管理、动漫设计、影视创作等方面。
技术介绍
随着图像感知、大数据存储和计算机性能提升等各个方面的快速发展,视频数据已经成为一种无处不在的媒体存储形式。来自监控设备、网络摄像头、电影等各个途径的视频数据充斥着整个网络。各种小型且廉价消费设备例如笔记本电脑、智能手机以及高分辨率摄像机的流行让人们更容易用视频记录生活的细节而不是使用简单的静态图像。如何在这些海量的视频数据中针对人们感兴趣的人类行为进行分析已经成为一个热点问题。基于视频的行为分类的目的是利用计算机和特定的算法提取视频中富有语义的部分,在大多数场景中,人都是主要的语义元素,因为日常行为大都是由人主导的。因此,针对人体简单行为的分类对最终的行为分析具有重要意义。目前,对于视频中行为的分类方法主要分3类:基于特征提取的方法,这种方法致力于提取紧致有表达能力的特征。J.K.Aggarwal等人在文献“J.Aggarwal,and S.Michael,Human activity analysis:A review.\ACM Computing Surveys(CSUR)43.3(2011):16.”中提出了一些常见的特征提取方法,这些方法往往利用训练数据的底层线索如灰度、光照变换等,对其进行处理得到底层特征。比如HOG特征,就是先将图像分成不同的块,并计算图像中像素梯度分布,再统计块中各像素点在不同方向上的梯度分布情况,最终得到一个特征向量。将这个特征向量输入分类器进行分类。基于中层表达的方法。底层特征数据繁多,对计算能力的要求高,为了减小数据量,同时提高特征的表达能力,一些中层表达的方法被提出,BoW(词袋模型)就是典型的例子。在这种方法中,通过统计一幅图像或者一段视频中某些视觉词汇出现的频次,构建分布直方图,并以其作为最终的特征向量。这种方法在文献“D.Filliat,A visual bag of words method for interactive qualitative localization and mapping,IEEE Conf.In Robotics and Automation,2007,pp.3921-3926.”中有详细介绍。基于分类模型的方法,这种方法的重点在于在已有底层特征的基础上,如何通过优化模型得到最接近真实情况的分类结果,常见的有SVM,MLR等。在文献“C.Schuldt,I.Laptev,B.Caputo,Recognizing human actions:a local SVM approach,in Proc.IEEE Conf.Proceedings of the 17th International Conference on,2004,pp.32-36.”中就介绍了一种基于SVM的行为分类方法。
技术实现思路
本专利技术的目的在于针对上述现有方法的不足,提出一种基于自上而下学习的行为分类方法。实现本专利技术目的的技术方案是:一种基于自上而下学习的行为分类方法,其特别之处在于:包括以下步骤:(1)将原始数据划分为训练样本集和测试样本集;(2)利用尺度不变特征转移算法提取训练样本集和测试样本集视频片段的底层特征,然后用词包模型预处理得到每段视频对应的特征向量;(3)将步骤(2)得到的训练样本集的特征向量进行稀疏编码;将得到的稀疏编码作为隐变量输入初始化得到的多元逻辑回归模型,得到训练样本的预测标签;结合预测标签和实际的标签对稀疏编码所需的字典和多元逻辑回归模型的回归系数进行迭代训练优化,得到稳定的字典和回归模型;(4)利用步骤(3)得到的最终的字典和回归模型,对步骤(2)得到的测试样本集上的特征向量进行稀疏编码,再带入回归模型,得到分类结果即测试样本的预测标签。优选的,在上述步骤之后还包括步骤(5),分类结束后将测试样本的预测标签和实际标签比较,统计测试样本预测标签的每一类中分类正确的数目,除以这一类的总数得到分类正确率。所述步骤(1)中原始数据的划分采用随机抽取的方法,训练样本集占原始数据的三分之二,测试样本集占原始数据的三分之一。所述步骤(3)的优化过程具体包括:步骤(3a),构建优化目标表达式,将字典D和回归系数w结合在一个目标表达式中,所述的目标表达式如下: ( W , D ) = arg max w , D l ( w , D ) , ]]>其中 l ( w , D ) ≡ log P ( Y l | X l , w , D ) = log Π i = 1 l P ( y i | x i , w , D ) ≡ Σ i = 1 l ( s i T w 本文档来自技高网
...

【技术保护点】
一种基于自上而下学习的行为分类方法,其特征在于:包括以下步骤:(1)将原始数据划分为训练样本集和测试样本集;(2)利用尺度不变特征转移算法提取训练样本集和测试样本集视频片段的底层特征,然后用词包模型预处理得到每段视频对应的特征向量;(3)将步骤(2)得到的训练样本集的特征向量进行稀疏编码;将得到的稀疏编码作为隐变量输入初始化得到的多元逻辑回归模型,得到训练样本的预测标签;结合预测标签和实际的标签对稀疏编码所需的字典和多元逻辑回归模型的回归系数进行迭代训练优化,得到稳定的字典和回归模型;(4)利用步骤(3)得到的最终的字典和回归模型,对步骤(2)得到的测试样本集上的特征向量进行稀疏编码,再带入回归模型,得到分类结果即测试样本的预测标签。

【技术特征摘要】
1.一种基于自上而下学习的行为分类方法,其特征在于:包括以下步骤:(1)将原始数据划分为训练样本集和测试样本集;(2)利用尺度不变特征转移算法提取训练样本集和测试样本集视频片段的底层特征,然后用词包模型预处理得到每段视频对应的特征向量;(3)将步骤(2)得到的训练样本集的特征向量进行稀疏编码;将得到的稀疏编码作为隐变量输入初始化得到的多元逻辑回归模型,得到训练样本的预测标签;结合预测标签和实际的标签对稀疏编码所需的字典和多元逻辑回归模型的回归系数进行迭代训练优化,得到稳定的字典和回归模型;(4)利用步骤(3)得到的最终的字典和回归模型,对步骤(2)得到的测试样本集上的特征向量进行稀疏编码,再带入回归模型,得到分类结果即测试样本的预测标签。2.根据权利要求1所述的基于自上而下学习的行为分类方法,其特征在于:还包括步骤(5),分类结束后将测试样本的预测标签和实际标签比较,统计测试样本预测标签的每一类中分类正确的数目,除以这一类的总数得到分类正确率。3.根据权利要求1所述的基于自上而下学习的行为分类方法,其特征在于:所述步骤(1)中原始数据的划分采用随机抽取的方法,训练样本集占原始数据的三分之二,测试样本集占原始数据的三分之一。4.根据权利要求1所述的基于自上而下学习的行为分类方法,其特征在于:所述步骤(3)的优化过程具体包括:步骤(3a),构建优化目标表达式,将字典D和回归系数w结合在一个目标表达式中,所述的目标表达式如下: ( W , D ) = arg max w , D l ( w , D ) , ]]>其中 l ( w , D ) ≡ log P ( Y l | X l , w , D ) ≡ log Π i = 1 l P ( ...

【专利技术属性】
技术研发人员:李学龙卢孝强祁雷
申请(专利权)人:中国科学院西安光学精密机械研究所
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1