【技术实现步骤摘要】
一种基于深度强化学习的危险行为识别方法
[0001]本专利技术属于目标检测和图像识别领域,具体的说是一种基于深度强化学习的危险行为识别方法。
技术介绍
[0002]近年来,随着经济取得的巨大发展,人民的生活水平发生了翻天覆地的变化,人们在享受经济带来的现代化生活之外,也追求着自己的兴趣爱好。其中,钓鱼就是比较受欢迎的运动之一。最早的钓鱼是狩猎的一种形式,骨钓鱼据历史考证距今有六千多年的历史,而现今成为一项活动。但是,在许多池塘等钓鱼环境中往往伴随着高压电线,因此钓鱼活动也就伴随着一定的危险性。所以,如何提醒钓鱼者身处危险具有重要意义。针对危险提醒,首先就需要判断有人在高压附近钓鱼,因此需要一种方法能够检测钓鱼行为这种具有潜在危险的行为动作,即主要是对鱼竿进行目标检测和人体姿态行为检测。
[0003]目标检测领域的研究最早可以追溯到1991年提出的人脸检测算法。随着近些年硬件算力的提高、深度学习的发展和高质量数据集的公开,研究者们提出越来越多的目标检测算法。目标检测算法大致分为两个阶段:传统的目标检测算法和基于深度学习 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度强化学习的危险行为识别方法,其特征在于,包括如下步骤:步骤1、获取危险行为视频并进行预处理,得到危险行为图像数据集,按预设的比例将所述危险行为图像数据集划分为用于鱼竿检测的图像数据集和用于鱼竿定位的图像数据集;对所述用于鱼竿检测的图像数据集进行人工标注后,按一定比例划分为鱼竿检测训练集和鱼竿检测验证集;步骤2、建立用于检测鱼竿的鱼竿检测器、用于鱼竿定位的鱼竿定位器、用于检测人体姿态的姿态检测器;所述鱼竿检测器的组成包括:Resnet
‑
101主干网络、多尺度可形变自注意力模块、编码器、解码器;所述鱼竿定位器的组成包括:一个actor网络、两个critic网络、一个目标actor网络、两个目标critic网络、空间卷积神经网络;所述空间卷积神经网络包括:卷积层、空间信息传递模块和全连接层;所述空间信息传递模块包括:从上到下的特征提取层SCNN_D、从下到上的特征提取层SCNN_U、从左到右的特征提取层SCNN_R和从右到左的特征提取层SCNN_L;所述姿态检测器是由尺度感知的高分辨网络构成,并包括:ResNet主干网络和高分辨率网络;所述高分辨网络是由并行连接的若干个多分辨子网构成,且若干个多分辨子网的分辨率由高到低排序;步骤3、将所述鱼竿检测训练集送入所述鱼竿检测器中进行训练,并通过鱼竿检测验证集进行验证,从而得到训练好的鱼竿检测器;步骤4、将所述用于鱼竿定位的图像数据集送入所述训练好的鱼竿检测器中进行鱼竿目标检测,得到每个图像的鱼竿预测包围框并构成定位数据集,再对所述定位数据集进行人工标注后,按照一定比例划分为定位训练集和定位验证集;步骤5、将所述定位训练集送入鱼竿定位器中进行训练,并通过定位验证集进行验证,从而得到训练好的鱼竿定位器;步骤6、鱼竿检测和人体动作识别;步骤6.1、定义危险行为动作种类,包括:无危险行为、潜在危险行为、收杆动作和甩杆动作;定义缓存队列QUEUE,并用于存放连续t帧的姿态信息;步骤6.2、将待检测的危险行为视频中的一帧图像送入训练好的鱼竿检测器进行检测,得到当前帧图像的鱼竿目标包围框;步骤6.3、将当前帧图像的鱼竿目标包围框送入训练好的鱼竿定位器进行定位,得到定位后的鱼竿参数,并作为鱼竿目标;步骤6.5、将当前帧图像送入姿态检测器中进行姿态检测,得到人体姿态关键点:所述当前帧图像经过ResNet主干网络进行特征提取,得到高分辨率特征图;所述高分辨率特征图输入所述高分辨率网络中,并经过并行连接的若干个多分辨率子网络的多尺度特征融合处理,得到高分辨率表示的估计关键点信息,并作为人体姿态关键点;步骤6.6、获取人体姿态关键点中手臂上的关键点信息,从而利用式(1)计算得到当前帧图像的手臂的状态cosθ,并作为姿态信息保存在缓存队列QUEUE中:
式(1)中,θ表示手臂中小臂与大臂之间的夹角,d1、d2小臂与大臂的长度,d3表示对边长度;步骤6.7、按照步骤6.2
‑
步骤6.5的过程获取缓存队列QUEUE中连续t帧的姿态信息,并通过反余弦函数求出危险行为者的手臂夹角θ的变化范围,从而利用式(2)计算危险行为者手臂的动作A:式(2)中,当A=0表示无明显动作,当A=1表示有明显动作,且θ的变化从大到小表示抬手动作,否则表示甩手动作;步骤6.8、若检测到所述鱼竿目标且伴随抬手动作或者甩手动作,则判定为抬杆动作或者甩杆动作,发出高压危险警报;否则,判定为潜在危险行为;若未检测所述鱼竿目标,则判定为未无危险行为。2.根据权利要求1所述的一种基于深度强化学习的危险行为识别方法,其特征在于,所述步骤3包括:步骤3.1、所述鱼竿检测训练集送入鱼竿检测器中,先经过Resnet
‑
101主干网络进行多尺度特征提取,得到多尺度特征图;步骤3.2、所述多尺度特征图输入所述多尺度可形变自注意力模块中进行聚合处理,得到聚合多尺度特征图;对所述多尺度特征图进行位置编码后,再与聚合多尺度特征图相加并输入所述编码器中进行编码处理,得到编码后的候选特征向量;步骤3.3、所述候选特征向量输入所述解码器中进行解码处理,得到鱼竿预测目标的包围框;步骤3.4、采用焦点损失函数计算损失,并通过匈牙利匹配算法对所述焦点损失函数进行监督求解,从而得到训练后的鱼竿检测器;步骤3.5、将所述鱼竿检测验证集输入所述训练后的鱼竿检测器中进行预测,得到预测结果,并计算其准确率后与预设的正确率阈值进行对比,若达到正确率阈值或者达到训练迭代次数,则表示得到训练好的鱼竿检测器,并保存模型参数;否则,返回步骤3.1继续对训练后的鱼竿检测器进行训练。3.根据权利要求1所述的一种基于深度强化学习的危险行为识别方法,其特征在于,所述步骤5包括:步骤5.1、定义动作空间...
【专利技术属性】
技术研发人员:李帷韬,杨盛世,丁美双,丁立健,孙伟,李奇越,刘鑫,王旗,常文婧,侯建平,胡平路,管树志,张雪松,
申请(专利权)人:国网安徽省电力有限公司超高压分公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。