【技术实现步骤摘要】
行为识别方法、装置及计算机可读存储介质
本专利技术涉及人工智能,具体地说,涉及一种行为识别方法、装置及计算机可读存储介质。
技术介绍
目前在安防领域中,对于视频中的人体的行为判定是一个常常遇到的问题。通过摄像头检测当前区域内的事件,例如:检测当前区域内的活动的人体,并识别人体的行为活动。在传统的行为识别领域当中,通常是抽取视频帧中的人体轮廓,针对人体轮廓的姿态变化等来进行识别判断属于哪种行为类别然而在背景更为复杂场景下,或者背景中有更多的他人干扰时,单纯的以人体姿态变化作为一种行为识别的分类问题处理就会有较大的误判率。另外,两个人体之间的行为,两人之间的背景对于行为是否发生具有非常有价值的判断依据,而两人之间区域以外的背景,对于行为是否发生的判断则基本没有什么价值,并且,对于监控视频来说,通常人体较小,背景较大,将这种视频中的一帧的图像直接输入到神经网络模型中计算,势必造成巨大的计算量。
技术实现思路
为解决以上技术问题,本专利技术提供一种行为识别方法,应用于电子装置,包括以下步骤:S1, ...
【技术保护点】
1.一种行为识别方法,应用于电子装置,其特征在于,包括以下步骤:/nS1,获取视频流,将视频流分割为由多帧图像组成的图像帧序列;/nS2,检测每一帧图像中的人体轮廓,并用第一矩形框将每个人体标记出来;/nS3,计算每一帧图像中任意两个第一矩形框之间的距离;/nS4,若某一帧图像中两个第一矩形框之间的距离小于设定的距离阈值,则采用二人组合框将所述两个第一矩形框包围,其中,二人组合框是包围所述两个第一矩形框的最小矩形框;/nS5,查找所述某一帧图像的前后多帧图像,将与所述二人组合框中相同的两个人都形成二人组合框,并将所述某一帧图像以及前后多帧图像中的二人组合框组成二人组合框序列 ...
【技术特征摘要】
1.一种行为识别方法,应用于电子装置,其特征在于,包括以下步骤:
S1,获取视频流,将视频流分割为由多帧图像组成的图像帧序列;
S2,检测每一帧图像中的人体轮廓,并用第一矩形框将每个人体标记出来;
S3,计算每一帧图像中任意两个第一矩形框之间的距离;
S4,若某一帧图像中两个第一矩形框之间的距离小于设定的距离阈值,则采用二人组合框将所述两个第一矩形框包围,其中,二人组合框是包围所述两个第一矩形框的最小矩形框;
S5,查找所述某一帧图像的前后多帧图像,将与所述二人组合框中相同的两个人都形成二人组合框,并将所述某一帧图像以及前后多帧图像中的二人组合框组成二人组合框序列;
S6,将所述二人组合框序列输入到神经网络模型中,通过神经网络模型进行人体行为识别,得到识别结果,确认是否属于预设行为类别。
2.根据权利要求1所述的行为识别方法,其特征在于,检测每一帧图像中的人体轮廓,并用第一矩形框将每个人体标记出来的步骤包括:
通过滑动窗口在图像上按照预设轨迹滑动,并通过CNN模型对滑动窗口中的物体提取空间特征,利用SVM分类器对提取到的所述空间特征分类,从而确定滑动窗口中是否有人体,并且,还输出滑动窗口的四个角点的坐标,以四个角点的坐标形成第一矩形框标记人体轮廓。
3.根据权利要求2所述的行为识别方法,其特征在于,步骤S5还包括:
识别前后多帧图像中是否存在与所述二人组合框中相同的两个人;其中,提取所述前后多帧图像中的各第一矩形框的光流图特征,并结合第一矩形框的所述空间特征输入到RNN模型中提取时序特征,从而判断是否存在与所述二人组合框中相同的两个人。
4.根据权利要求1所述的行为识别方法,其特征在于,所述神经网络模型包括依次连接的多个并列的第一2D卷积子网络W2D和并列的一个3D卷积子网络W3D、一个第二2D卷积子网络V2D,对于每帧图像,采用第一2D卷积子网络W2D来得到多个特征图谱,将图像帧序列的所有帧图像得到的特征图谱组成特征集合,所述特征集合分别输入到一个3D卷积子网络W3D和一个第二2D卷积子网络V2D进行处理,将第二2D卷积子网络的输出与3D卷积子网络的输出结果融合,得到识别结果,确认是否属于预设行为类别。
5.根据权利要求1所述的行为识别方法,其特征在于,步骤S6中,神经网络模型对输入的图像进行行为识别的方法是:
通过结合面部表情识别、裸露部位皮肤颜色识别、语音识别、接触部位识别中的至少一种方式来判定人体行为,对应每种方式获取一个判定结果,并对各判定结果进行加权平均,作为最终的判定结果。
6.根据权利要求5所述的行为识别方法,其特征在于,所述通过结合面部表情识别...
【专利技术属性】
技术研发人员:罗郑楠,周俊琨,肖玉宾,许扬,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。