一种基于多元特征融合的行为识别方法技术

技术编号：38256970 阅读：12 留言：0更新日期：2023-07-27 10:19

本发明专利技术提出一种基于多元时序特征、空间融合的行为识别方法，通过熵信息流来提取时序特征，建立人体行为时序特征的表达方法和数据来源。建立人体行为空间特征的表达方法和数据来源，建立视频帧的前景模板和背景模板，从而将目标从图像中分离出来，便于后续步骤中基于时序的特征修正。最终在复杂场景下，建立多元时序特征、空间特征融合模型，准确识别复杂场景下人体行为。下人体行为。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多元特征融合的行为识别方法

[0001]本
技术实现思路
属于计算机视觉、图像识别技术、图像分析技术、机器学习技术应用领域，特别地，涉及一种基于多元特征融合的行为识别方法。

技术介绍

[0002]行为识别是人工智能、计算机视觉等领域的热点与重点研究问题，旨在动态、实时地对图像、视频数据中的人体行为进行分析和识别。作为监控视频的主体，人体及其行为理解在人机交互、公共安全、智能家居、医疗健康多个行业具有广阔的应用前景。
[0003]现阶段，针对简单场景行为识别算法，如基于卷积网络的深度神经网络模型学习方法，在识别率上已经达到较高水平，如在UCF101数据集上已经达到了98.6％。然而由于视频数据本身的复杂性、行为场景的多样性，在十字路口等密集开放人流环境真实应用中行为识别算法需要面对高密度人群或存在大量干扰(比如，遮挡，光照不足，视频分辨率低等)的复杂场景，当前主流行为识别方法在实际应用中的效果并不理想，与人眼能够在自然场景中快速准确识别任意人体行为的能力还有较大差距，相关理论及方法研究仍存在较大探索空间。
[0004]复杂场景下针对人体行为识别的深度学习模型目前存在的主要问题是：学习数据量不足、多特征提取及融合所带来的内存和计算量开销过大、复杂场景下人体遮挡以及动作语义的模糊性强等问题。针对上述难题，本专利技术面向自然、复杂场景视频研究人体行为2D空间特征、3D运动特征以及骨骼点等多特征提取以及融合方法，重点关注真实场景中人体存在遮挡问题以及动作语义的模糊性问题。
[0005]本专利技术提出...

【技术保护点】

【技术特征摘要】
1.一种基于多元特征融合的行为识别方法，其特征在于：采集获得原始视频数据；(1)从原始视频数据中提取人体行为时序特征：定义熵信息流为：其中:式中j表示时序的图像帧数，E(j)表示第j帧图像的熵，F(j)表示熵信息流在第j帧的值。w＝
‑
2,
‑
1,0,1,2时，分别为1,4,6,4,1。w是向量元素位置下标；熵信息流作为人体行为时序特征。(2)从原始视频数据中提取人体行为空间特征：将原视频中的任一帧分解为目标前景f和背景b两幅子图像；将中除去f以外的部分像素填充为奇异值，并将该除外部分与f合并成与原图像大小相等的前景图像，记为f
′
；将中除去b以外的部分像素填充为奇异值，并将该除外部分与b合并成与原图像大小相等的背景图像，记为b
′
；表示原视频一帧图像；根据前述获得前景图像f
′
、背景图像b
′
，生成前景模板和背景模板作为空间特征数据。(3)建立多元特征融合模型，识别复杂场景下人体行为：时序特征数据映射层，定义如下。时序特征数据映射层，定义如下。为线性斜率参数，x,j分别对应于输入的数据F(j)和输出数据HA(x)，β1是线性截距参数,σ为非线性激活函数；将步骤2获得的前景模板通过卷积网络模组，获得卷积特征{CF
l
}；将步骤2获得的背景模板通过卷积网络模组，获得卷积特征{CB
l
}；空间特征映射层定义，如下：其中，其中，u,v是二维矩阵中元素的空间坐标，t是与视频帧对应的时序坐标，是背景模板获得的卷积特...

【专利技术属性】
技术研发人员：王凤琴，陈宏阳，马侠，陈燕，杨永双，
申请(专利权)人：河南博物院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人