The invention discloses a multitask action recognition method based on the mining of common features among multiple perspectives, and realizes the mining of internal common features and features among different perspectives based on the multi perspective action recognition. Specifically, it includes the following steps: (1) video preprocessing, feature extraction and fusion, (2) data construction and similarity matrix construction between perspectives, (3) regular item formulation and model construction of multi task learning based on common feature mining between perspectives, (4) multi task action recognition model construction based on common feature mining between perspectives, (5) multi task action recognition based on feature projection. The invention has the advantages of fully mining the internal common features and unique features between tasks (Perspectives) by regarding the perspective as a task, making the information learned from one task be used by other tasks, and realizing the efficient recognition of human actions.
【技术实现步骤摘要】
基于多视角间共性特性挖掘的多任务动作识别方法
本专利技术属于计算机视觉和模式识别
,涉及一种基于多视角间共性特性挖掘的多任务动作识别方法,将视角看作任务,用于挖掘不同视角间潜在的共性和特性关联,在人体动作识别领域,验证了视角共性特性学习以及线性多任务学习的有效性。
技术介绍
人体动作识别是计算机视觉和模式识别领域的一个极具挑战性的研究热点,并因其在智能监控、便捷的人机交互等领域的广泛应用受到学术界和工业界的密切关注。近些年来,许多人体动作识别方法也被广泛的讨论,早期的很多研究提出了许多不同的算法,它们大体可以分为两类:1)特征层,早期的研究通常认为获得一个好的人体动作特征再表示是有效的提高人体动作识别性能的关键,因此,许多人体动作描述方法被提出,例如,运动历史直方图、运动能量图像、STIP特征、MoSIFT、DSTIP、3D-SIFT和GIST等不同特征;2)分类器层,早期有许多研究者针对动作本身所具有的特性,设计出了许多不同的分类器,例如,支持向量机,条件随机场,稀疏化分类器和深度神经网络等。尽管许多令人满意的动作描述符和分类器被相继提出,由于在当前真实系统应用中往往存在严重的遮挡、被关注对象位置变化、视角变化等多种外因带来的影响,单视角动作识别仍然是一个具有挑战性的研究课题。因此,近些年来,多视角人体动作识别方法被广泛的提出,在多视角问题中,通过从多个视角观察人体动作,可以有效的解决单视角自遮挡问题,且每个视角将会提供其余视角没有的互补信息,因此,来自于多个视角的信息可以用于更加准确的描述人体动作,从而提高 ...
【技术保护点】
1.一种基于多视角间共性特性挖掘的多任务动作识别方法,用于充分挖掘多视角间的内在共性和特性关联,以实现高效率的动作识别,其特征在于该方法具体包含以下步骤:/n第1步、视频预处理及特征提取和融合/n第1.1步、由于从设备中采集的深度数据包括许多空洞,所以需要使用修补算法修补空洞;且连续的数据需要手动的标记单个动作的开始点与结束点来分割数据,消除了不相关的插入帧后,完整的动作实例将会被提取出来;/n第1.2步、为彩色图像和深度图像分别提取HOGHOF特征和CCD特征,对两种特征进行融合并保存对应的结果;/n第2步、数据的构建和视角间相似度矩阵的构建/n第2.1步、定义和概念/n考虑一组用以描述动作的R个相关视角,将每个视角看作一个任务,每一个任务都是一个具有C个动作类别的多类别分类问题,对于每一个任务t=1,2,...,R,给定一个训练集
【技术特征摘要】
1.一种基于多视角间共性特性挖掘的多任务动作识别方法,用于充分挖掘多视角间的内在共性和特性关联,以实现高效率的动作识别,其特征在于该方法具体包含以下步骤:
第1步、视频预处理及特征提取和融合
第1.1步、由于从设备中采集的深度数据包括许多空洞,所以需要使用修补算法修补空洞;且连续的数据需要手动的标记单个动作的开始点与结束点来分割数据,消除了不相关的插入帧后,完整的动作实例将会被提取出来;
第1.2步、为彩色图像和深度图像分别提取HOGHOF特征和CCD特征,对两种特征进行融合并保存对应的结果;
第2步、数据的构建和视角间相似度矩阵的构建
第2.1步、定义和概念
考虑一组用以描述动作的R个相关视角,将每个视角看作一个任务,每一个任务都是一个具有C个动作类别的多类别分类问题,对于每一个任务t=1,2,...,R,给定一个训练集其中,Nt表示第t个任务的总样本数,是一个表示第t个任务中第n个动作样本的d维特征向量,是指示第t个任务中第n个动作样本的类别成员的标签,对于每一个任务t,定义一个特征矩阵xt∈IRNt×d,以及标签矩阵yt定义如下:
连接所有R个任务的特征矩阵xt和标签矩阵yt得到特征矩阵X=[x1′,...,xR′]′,X∈IRN×d和标签矩阵Y=[y1′,...yR′]′,Y∈IRN×CR,其中表示R个任务的总样本数;以上各式中,x1′表示矩阵x1的转置,[x1′,...,xR′]′表示矩阵[x1′,...,xR′]的转置,其它含义类似;
第2.2步、视角间相似度
由于从相邻视角间观察到的动作的相似度要高于相隔较远的视角间动作的相似度,且为了保证从一个任务中学习到的知识能被其余任务所利用,因此,通过指定一个矩阵来定义一个模拟不同视角即任务间动作相似度的图形结构即相似度矩阵,其具体的定义公式如下:
其中
其中,v、w和h指代的是视角即任务,c指代的是第c个动作类别,p、q分别表示的是在第v和第w个视角...
【专利技术属性】
技术研发人员:高赞,轩海珍,张桦,王志岗,薛彦兵,徐光平,
申请(专利权)人:天津理工大学,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。