一种基于RGB图像的行为识别方法、装置、介质及设备制造方法及图纸

技术编号:24709104 阅读:32 留言:0更新日期:2020-07-01 00:08
本发明专利技术公开了一种基于RGB图像的行为识别方法、装置、介质及设备,属于行为识别技术领域,用于解决目前服务场合无行为规范智能识别分析的技术问题,方法包括步骤:1)对RGB图像进行预处理,将工作人员的区域分割出来,对目标进行捕捉或跟踪;2)提取图像特征参数,送入循环神经网络中,得到图像特征参数与高维向量的映射;3)在得到视频帧的高维向量的基础上,建立分类器模型,建立从高维向量到最终不规范行为类别的映射,并对分类器模型进行训练;4)获取监测视频信息中的RGB图像,基于训练好的分类器模型,对供电营业厅服务人员的行为进行识别。本发明专利技术具有对服务人员行为智能识别分析、识别精度高、提高工作效率和服务水平等优点。

【技术实现步骤摘要】
一种基于RGB图像的行为识别方法、装置、介质及设备
本专利技术主要涉及行为识别
,特指一种基于RGB图像的行为识别方法、装置、介质及设备。
技术介绍
供电营业厅是供电企业最重要的服务窗口,具有沟通、展示和传播企业形象的重要社会功能。供电营业厅是供电企业的窗口前沿,代表了供电企业的形象。客户到供电营业厅办理各项用电业务,首先接触到的就是供电营业厅的服务人员。因此,供电营业厅工作人员的服务技巧、待人接物的态度,往往决定了客户对供电企业服务水平的认知程度。一些工作人员的散漫、懈怠行为,如工作时间玩手机、睡觉、态度恶劣等都会给客户留下极其不好的印象。加之如今是个信息化的时代,微博等自媒体使用广泛,若被不满的客户发布信息至网上,容易造成企业的形象以及大量经济损失。目前供电营业厅服务具有完善的规范制度,但往往存在执行不到位,难于监管的情况,如果仅仅依赖主管部门的现场稽查,很难起到很好的监督和管控作用。开展对营业厅行为规范智能识别、分析与预警研究,探索建立示范工程显得十分必要。
技术实现思路
本专利技术要解决的技术问题就在于:针对现本文档来自技高网...

【技术保护点】
1.一种基于RGB图像的行为识别方法,其特征在于,包括步骤:/n1)对视频帧中的RGB图像进行预处理,将工作人员的区域分割出来,对目标进行捕捉或跟踪;/n2)提取预处理后的RGB图像中的图像特征参数,送入循环神经网络中,得到图像特征参数与高维向量的映射;/n3)在得到视频帧的高维向量的基础上,建立分类器模型,建立从高维向量到最终不规范行为类别的映射,并对分类器模型进行训练;/n4)获取监测视频信息中的RGB图像,基于训练好的分类器模型,对供电营业厅服务人员的行为进行识别。/n

【技术特征摘要】
1.一种基于RGB图像的行为识别方法,其特征在于,包括步骤:
1)对视频帧中的RGB图像进行预处理,将工作人员的区域分割出来,对目标进行捕捉或跟踪;
2)提取预处理后的RGB图像中的图像特征参数,送入循环神经网络中,得到图像特征参数与高维向量的映射;
3)在得到视频帧的高维向量的基础上,建立分类器模型,建立从高维向量到最终不规范行为类别的映射,并对分类器模型进行训练;
4)获取监测视频信息中的RGB图像,基于训练好的分类器模型,对供电营业厅服务人员的行为进行识别。


2.根据权利要求1所述的基于RGB图像的行为识别方法,其特征在于,所述步骤3)具体为:
3.1)将步骤2)中的每个用作特征提取的视频帧单元称为一个片段,而将每次输出的高维向量记作片段动作分数,最终对于一个包含T帧图像的视频,得到等长的SAS特征序列;
3.2)在获得长度为T的特征序列后,将其用作SSAD模型的输入;其中SSAD模型为全部由时序卷积构成的网络,包括三种卷积层:基层、锚框层以及预测层,其中基层的作用为缩短特征序列的长度,并增大特征序列中每个位置的感受野;
3.3)接下来SSAD模型中继续使用来缩小特征序列的长度,锚框层输出的特征序列中的每个位置都被关联了多个尺度的锚框实例;
3.4)之后,再通过预测层,来获取每个锚框实例所对应的坐标偏移量,重叠置信度,以及类别分类结果;
3.5)通过多层时间尺度不断缩小的特征序列,SSAD模型获得由小到大各个时间尺度的动作实例预测,建立最终的分类器模型。


3.根据权利要求2所述的基于RGB图像的行为识别方法,其特征在于,在步骤3)中,还包括分类器模型的训练:
将获得的锚框用坐标偏移量进行修正,再与标签实例进行匹配,来确定锚框实例是正样本还是负样本;其中SSAD模型使用如下的损失函数进行模型训练,包括分类损失Lclass、重叠置信度回归损失Lover、边界回归损失Lloc以及正则化项L2;
L=Lclass+α·Lover+β·Lloc+λ·L2(Θ)
式中α、β、λ均为系数;
测试时,同样先将获得的锚框实例用坐标偏移量进行修正,再获得每个锚框实例的最终分类结果。


4.根据权利要求3所述的基于RGB图像的行为识别方法,其特征在于,在步骤4)中,在获得了一段视频所有的预测动作实例后,采用非极大化抑制算法对重叠的预测进行去重,从而获得最终的时序动作检测的结果。


5.根据权利要求1~4中任意一项所述的基于RGB图像的行为识别方法,其特征在于,在步骤2...

【专利技术属性】
技术研发人员:熊德智陈向群胡军华柳青刘小平杨茂涛黄瑞温和欧阳黎陈浩曾文伟
申请(专利权)人:国网湖南省电力有限公司国网湖南省电力有限公司供电服务中心计量中心国家电网有限公司
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1