【技术实现步骤摘要】
本专利技术属于信息处理
,特别涉及一种行为识别技术,可用于公共安全管理、动漫设计、影视创作等方面。
技术介绍
随着图像感知、大数据存储和计算机性能提升等各个方面的快速发展,视频数据已经成为一种无处不在的媒体存储形式。来自监控设备、网络摄像头、电影等各个途径的视频数据充斥着整个网络。各种小型且廉价消费设备例如笔记本电脑、智能手机以及高分辨率摄像机的流行让人们更容易用视频记录生活的细节而不是使用简单的静态图像。如何在这些海量的视频数据中针对人们感兴趣的人类行为进行分析已经成为一个热点问题。基于视频的行为分类的目的是利用计算机和特定的算法提取视频中富有语义的部分,在大多数场景中,人都是主要的语义元素,因为日常行为大都是由人主导的。因此,针对人体简单行为的分类对最终的行为分析具有重要意义。目前,对于视频中行为的分类方法主要分3类:基于特征提取的方法,这种方法致力于提取紧致有表达能力的特征。J.K.Aggarwal等人在文献“J.Aggarwal,and S.Michael,Human activity analysis:A review.\ACM Computing Surveys(CSUR)43.3(2011):16.”中提出了一些常见的特征提取方法,这些方法往往利用训练数据的底层线索如灰度、光照变换等,对其进行处理得到底层特征。比如HOG特征,就是先将图像分成不同的块,并计算图像中像素梯度分布,再统计块中各像素点在不同方向上的梯度分布情况,最终得到一个特征向量。将这个特征向量输入分类器进行分类。基于中层表达的方法。底层特征数据繁多,对计算能力的要求高, ...
【技术保护点】
一种基于自上而下学习的行为分类方法,其特征在于:包括以下步骤:(1)将原始数据划分为训练样本集和测试样本集;(2)利用尺度不变特征转移算法提取训练样本集和测试样本集视频片段的底层特征,然后用词包模型预处理得到每段视频对应的特征向量;(3)将步骤(2)得到的训练样本集的特征向量进行稀疏编码;将得到的稀疏编码作为隐变量输入初始化得到的多元逻辑回归模型,得到训练样本的预测标签;结合预测标签和实际的标签对稀疏编码所需的字典和多元逻辑回归模型的回归系数进行迭代训练优化,得到稳定的字典和回归模型;(4)利用步骤(3)得到的最终的字典和回归模型,对步骤(2)得到的测试样本集上的特征向量进行稀疏编码,再带入回归模型,得到分类结果即测试样本的预测标签。
【技术特征摘要】
1.一种基于自上而下学习的行为分类方法,其特征在于:包括以下步骤:(1)将原始数据划分为训练样本集和测试样本集;(2)利用尺度不变特征转移算法提取训练样本集和测试样本集视频片段的底层特征,然后用词包模型预处理得到每段视频对应的特征向量;(3)将步骤(2)得到的训练样本集的特征向量进行稀疏编码;将得到的稀疏编码作为隐变量输入初始化得到的多元逻辑回归模型,得到训练样本的预测标签;结合预测标签和实际的标签对稀疏编码所需的字典和多元逻辑回归模型的回归系数进行迭代训练优化,得到稳定的字典和回归模型;(4)利用步骤(3)得到的最终的字典和回归模型,对步骤(2)得到的测试样本集上的特征向量进行稀疏编码,再带入回归模型,得到分类结果即测试样本的预测标签。2.根据权利要求1所述的基于自上而下学习的行为分类方法,其特征在于:还包括步骤(5),分类结束后将测试样本的预测标签和实际标签比较,统计测试样本预测标签的每一类中分类正确的数目,除以这一类的总数得到分类正确率。3.根据权利要求1所述的基于自上而下学习的行为分类方法,其特征在于:所述步骤(1)中原始数据的划分采用随机抽取的方法,训练样本集占原始数据的三分之二,测试样本集占原始数据的三分之一。4.根据权利要求1所述的基于自上而下学习的行为分类方法,其特征在于:所述步骤(3)的优化过程具体包括:步骤(3a),构建优化目标表达式,将字典D和回归系数w结合在一个目标表达式中,所述的目标表达式如下: ( W , D ) = arg max w , D l ( w , D ) , ]]>其中 l ( w , D ) ≡ log P ( Y l | X l , w , D ) ≡ log Π i = 1 l P ( ...
【专利技术属性】
技术研发人员:李学龙,卢孝强,祁雷,
申请(专利权)人:中国科学院西安光学精密机械研究所,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。