当前位置: 首页 > 专利查询>马平专利>正文

一种基于视觉词袋的人体动作识别方法技术

技术编号:14348098 阅读:170 留言:0更新日期:2017-01-04 18:42
本发明专利技术属于计算机视觉领域,尤其涉及其中的人体动作视频图像处理和识别。本发明专利技术公开了一种基于视觉词袋的人体动作识别方法,其特征在于:(1)对原始视频图像进行预处理,检测运动目标。(2)对运动目标进行图像特征提取和分类建模。(3)利用基于视觉词袋建立的标准动作图像库对人体动作进行分类识别,并根据正常行为模型和异常行为模型对异常行为进行识别和判定。本发明专利技术的基于视觉词袋的人体动作识别方法利用视觉词典进行预先分类,针对不同的样本具有较好的识别率,并且计算速度快,可以快速进行大量的人体动作的分类和识别,可用于复杂的人体动作识别系统。

【技术实现步骤摘要】
1.
本专利技术属于计算机视觉领域,尤其涉及其中的人体动作视频图像处理和识别。2.
技术介绍
人体动作识别是指计算机基于视频图像采集设备采集的数据,分析识别人体姿态和运动模式的过程。它涉及到机器学习、人工智能、图像处理等诸多学科,是计算机视觉领域重要的研究方向,在日常生活中也有着广泛和重要的应用。银行安全监控系统,老人看护系统,智能家居等新需求新应用不断产生,人体动作识别技术逐渐融入社会生活的各个角落,成为动作识别领域的研究热点。近年来监控系统广泛应用在各个单位和公共场所,但是绝大多数监控系统仅仅是将图像采集设备采集到的实时图像通过网络传输到后台,事件发生时通过肉眼才能发现,事后也仅仅提供视频倒查的功能。这种传统的方法导致其实时监控的的难度越来越大,且工作量日益增大。如何解决这个问题,引入人工智能技术和视频图像处理和识别技术,取代人工来完成上述工作是未来的发展趋势。本专利技术提出自己的研究思路,以期提供一种新的方法。尤其是提出了基于视觉词袋的人体动作识别方法,根据实时监控视频提取人体动作行为特征,分析监控区域内人体的姿态和运动模式,与模型数据库中的特征进行比对,识别异常行为并发出报警。本方法可以降低监控系统对人工的依赖性,使得监控系统变得更加智能和高效。3.
技术实现思路
本专利技术是根据上述思路设计的一种基于视觉词袋的人体动作自动识别方法。本专利技术的技术方案是提供一种基于视觉词袋的人体动作识别方法,其特征在于:其包括以下几个步骤:(1)对原始视频图像进行预处理,检测运动目标。(2)对运动目标进行图像特征提取和分类建模。(3)利用标准动作图像库对人体动作进行分类识别,并根据正常行为模型和异常行为模型对异常行为进行识别和判定。在上述步骤(1)之前还包括以下步骤:(a)采集人体标准动作视频,包括正常行为和异常行为,正常行为包括站立、行走、慢跑、坐下等,异常行为包括快速奔跑、抱打、群聚,摔倒等。(b)提取人体动作特征,构建视觉词袋模型,建立标准动作图像库。本专利技术提出了基于视觉词袋模型的人体动作特征提取方法,包括以下几个部分:(1)人体动作特征分析视频提取出的图像表现出极大的不确定性,无论是光照变化,角度变化,还是人体动作幅度变化,都很难捕捉到稳定的特征。基于全局图像特征的提取和计算并不可取,本方法对图像中运动目标所在区域进行局部分析,研究人体动作特征和关键点变化,保证提取特征的有效性。(2)根据视觉词袋模型进行图像特征提取图像可以类比为文档,即若干个“视觉词汇”的集合,图像中的词汇可以定义为一个图像块的特征向量,视觉词汇相互之间没有顺序,视觉词袋模型即是“图像中所有图像块的特征向量得到的直方图”。本专利技术利用SIFT变换提取出视觉词袋的特征矩阵。计算关键点周围的16*16的窗口中每一个像素的梯度,而且使用高斯下降函数降低远离中心的权重。这样就可以对每个特征形成一个4*4*8=128维的描述子。(3)生成图像特征金字塔进行标准动作图像分类用K-means算法对上一步骤获取的特征矩阵进行聚类,将图像词袋特征聚类生成视觉词典,使用视觉词典生成特征金字塔。使用词典表的中词汇表示图像,生成直方图。本专利技术的基于视觉词袋的人体动作识别方法利用视觉词典进行预先分类,针对不同的样本具有较好的识别率,并且计算速度快,可以快速进行大量的人体动作的分类和识别,可用于复杂的人体动作识别系统。4.附图说明图1是应用本专利技术的系统的结构框图。5.具体实施方式下面对本专利技术的具体实施方式作进一步详细的描述。如图1所示,本专利技术的一种基于视觉词袋的人体动作识别方法对应的系统包括:图像预处理,图像特征提取,视觉词袋模型构建,标准动作图像库建立、动作分类和识别。图像预处理是把视频文件进行分帧处理,保留含有关键动作的图像,提取分类器训练和最终识别判断的重要指标。图像特征提取采用SIFT变换对预处理过的图像进行变换,计算出每个点上的特征向量,结合图像中的多个关键点,得到图像的局部不变特征。视觉词袋模型构建是利用图像中所有图像块的特征向量的直方图得到的。标准动作图像库建立是根据不同图像之间特征矩阵的欧氏距离,把距离最相近的图像归为一类,识别的动作有几类就生成几个聚类中心,得到几个标准动作模型。每个动作模型中,包含该动作分类的所有角度的运动图像。动作分类和识别包括检测运动目标、支持向量机建模分类和动作识别。利用提取HOG特征的方法和差分法获得视频中是否有人存在并确定人体所在位置,获得包含目标人体的连续图像。支持向量机将提取出的人体姿态特征映射到高维空间中,支持向量机属于线性分类器,特点是能够同时最小化经验误差与最大化几何边缘区。最终识别结果是在以上检测出关键动作序列和标准动作图像库基础上,基于KNN分类算法实现的。以上实施例仅为本专利技术其中的一种实施方式,其描述较为具体,但并不能因此而理解为对本专利技术专利范围的限制。对于本领域的技术人员,在不脱离本专利技术构思的前提下,还可以做出若干变形和改进,这些都属于本专利技术的保护范围。因此,本专利技术专利的保护范围应以所附权利要求为准。本文档来自技高网...
一种基于视觉词袋的人体动作识别方法

【技术保护点】
本专利技术的技术方案是提供一种基于视觉词袋的人体动作识别方法,其特征在于:其包括以下几个步骤:(1)对原始视频图像进行预处理,检测运动目标;(2)对运动目标进行图像特征提取和分类建模;(3)利用标准动作图像库对人体动作进行分类识别,并根据正常行为模型和异常行为模型对异常行为进行识别和判定。

【技术特征摘要】
1.本发明的技术方案是提供一种基于视觉词袋的人体动作识别方法,其特征在于:其包括以下几个步骤:(1)对原始视频图像进行预处理,检测运动目标;(2)对运动目标进行图像特征提取和分类建模;(3)利用标准动作图像库对人体动作进行分类识别,并根据正常行为模型和异常行为模型对异常行为进行识别和判定。2.根据权利要求1所述的基于视觉词袋的人体动作识别方法,其特征在于:在上述步骤(1)之前还包括以下步骤:(a)采集人体标准动作视频,包括正常行为和异常行为,正常行为包括站立、行走、慢跑、坐下等,异常行为包括快速奔跑、抱打、群聚,摔倒等;(b)提取...

【专利技术属性】
技术研发人员:马平穆宇黄曦
申请(专利权)人:马平穆宇黄曦
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1