一种计算机视觉识别玩手机的优化改进方法技术

技术编号:31713019 阅读:17 留言:0更新日期:2022-01-01 11:17
本发明专利技术公开了一种计算机视觉识别玩手机的优化改进方法,所述方法包括如下步骤:S1:通过Anchor

【技术实现步骤摘要】
一种计算机视觉识别玩手机的优化改进方法


[0001]本专利技术涉及视觉识别领域,更具体的是涉及机视觉识别玩手机的优化改进


技术介绍

[0002]现有计算机视觉算法识别玩手机是通过单帧的行为识别或者单帧的物体识别来判断是否在玩手机。当在应用场景中动作被遮挡时,单帧的玩手机动作识别容易出现误识别;或者依靠单帧的物体识别也很容易出现误识别的情况。
[0003]现有计算机视觉中对是否玩手机只依赖图像识别算法模型的准确率,因为实际应用中摄像机拍摄的呈现的效果受相机拍摄角度、活动情况的影响。只进行单帧判断的话,效果极不准确,存在大量的误报情况,影响使用。
[0004]本专利技术是要通过对应用场景的研究,以及对场景误检测结果研究,通过行为识别加物体识别的双重判定,从而提高玩手机的行为检测准确率;规定玩手机检测算法包含行为识别算法,物体检测算法及结果综合判定算法相结合判定得出。

技术实现思路

[0005]本专利技术的目的在于:为了解决上述技术问题,本专利技术提供一种计算机视觉识别玩手机的优化改进方法。
[0006]一种计算机视觉识别玩手机的优化改进方法,所述方法包括如下步骤:
[0007]S1:通过Anchor

Free的CenterNet方法,对中心助手点热图进行优化,通过三个不同扩张率的扩张卷积,得到三种中心点热图;
[0008]S2:将三种不同的中心点热图分别与高斯半径自适应的高斯概率模型相结合,并对中心点热图做加性融合构建多尺度感受野高斯加权结构的检测算法;
[0009]S3:对一帧画面进行人体检测、人脸检测和行为检测,然后对行为的动作做检测匹配,通过帧画面人体检测和行为检测数据代入步骤S2中构建的检测算法中;将人脸检测数据代入retina face的检测算法中,捕捉人脸信息;
[0010]S4:对代入数据行为的动作做检测匹配,若检测为使用手机动作,则进入步骤 S5处理,若检测为未使用手机动作,则结束判定;
[0011]S5:获取连续画面,并通过匈牙利算法加卡尔曼滤波共同组成的人体追踪算法实现对人体的追踪,对行为人动作进行持续判定,若判定结果为使用手机,则输出结果,若判定结果为未使用手机,则发出误报指令,结束判定。
[0012]本申请文件中行为检测和物体检测均采用的是基于Anchor

Free的 CenterNet方法,并改进其中心助手点热图,通过三个不同扩张率的扩张卷积,得到三种感受野的中心点热图,再与高斯半径自适应的高斯概率模型相结合,最后对上述四种不同感受野的中心点热图做加性融合构建多尺度感受野高斯加权结构(Gaussian weighted multiscale Receptive field structure,GMRS) 的检测算法。人脸检测采用基于retina face的检测
算法。对一帧画面依次进行人体检测、人脸检测和行为检测,然后对行为的动作做检测匹配,如果某个人体的匹配结果不符合玩手机的动作行为,则认为这个人可能不是在玩手机。如果这时上报的话,极易因为人员活动,被遮挡等等情况,造成误报的情况,所以我们会利用基于匈牙利算法加卡尔曼滤波共同组成的人体追踪算法实现对人体的追踪,因为考虑到对同一个人体的情况一直判断,当连续判断这个人的动作符合玩手机时,认为他是玩手机的动作,再加上物体识别的检测,多重判定时增加识别的准确率。
[0013]进一步地,所述步骤S5利用匈牙利算法加卡尔曼滤波,对画面检测的结果进行分配,判断出哪些检测结果是属于正在被跟踪的目标。
[0014]进一步地,所述步骤S3中RetinaFace采用的mnet本质是基于RetinaNet 的结构,采用了特征金字塔的技术。
[0015]进一步地,采用的RetinaNet保留了在feature pyramid net的3层特征图每一层检测框分别proposal,生成3个不同尺度上的检测框,每个尺度上又引入了不同尺寸的anchor大小,保证可以检测到不同大小的物体。
[0016]本专利技术的有益效果如下:本专利技术是要通过对应用场景的研究,以及对场景误检测结果研究,通过行为识别加物体识别的双重判定,从而提高玩手机的行为检测准确率;规定玩手机检测算法包含行为识别算法,物体检测算法及结果综合判定算法相结合判定得出。
[0017]当连续判断这个人的动作符合玩手机时,认为他是玩手机的动作,再加上物体识别的检测,多重判定时增加识别的准确率。单帧的物体识别和动作识别极容易受到干扰,造成检测误判;通过多帧的连续动作识别增加动作识别的准确率(一段时间内连续帧图片),减少误报;通过这种多种算法联合的方法,以达到算法效果优化的目的。
附图说明
[0018]图1是本专利技术方法流程图;
具体实施方式
[0019]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。
[0020]因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0021]如图1所示,本实施例提供一种计算机视觉识别玩手机的优化改进方法,所述方法包括如下步骤:
[0022]S1:通过Anchor

Free的CenterNet方法,对中心助手点热图进行优化,通过三个不同扩张率的扩张卷积,得到三种中心点热图;
[0023]S2:将三种不同的中心点热图分别与高斯半径自适应的高斯概率模型相结合,并对中心点热图做加性融合构建多尺度感受野高斯加权结构的检测算法;
[0024]S3:对一帧画面进行人体检测、人脸检测和行为检测,然后对行为的动作做检测匹配,通过帧画面人体检测和行为检测数据代入步骤S2中构建的检测算法中;将人脸检测数据代入retina face的检测算法中,捕捉人脸信息;
[0025]S4:对代入数据行为的动作做检测匹配,若检测为使用手机动作,则进入步骤 S5处理,若检测为未使用手机动作,则结束判定;
[0026]S5:获取连续画面,并通过匈牙利算法加卡尔曼滤波共同组成的人体追踪算法实现对人体的追踪,对行为人动作进行持续判定,若判定结果为使用手机,则输出结果,若判定结果为未使用手机,则发出误报指令,结束判定。
[0027]所述步骤S5利用匈牙利算法加卡尔曼滤波,对画面检测的结果进行分配,判断出哪些检测结果是属于正在被跟踪的目标。所述步骤S3中RetinaFace采用的mnet本质是基于RetinaNet的结构,采用了特征金字塔的技术。采用的 RetinaNet保留了在feature p本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算机视觉识别玩手机的优化改进方法,其特征在于,所述方法包括如下步骤:S1:通过Anchor

Free的CenterNet方法,对中心助手点热图进行优化,通过三个不同扩张率的扩张卷积,得到三种中心点热图;S2:将三种不同的中心点热图分别与高斯半径自适应的高斯概率模型相结合,并对中心点热图做加性融合构建多尺度感受野高斯加权结构的检测算法;S3:对一帧画面进行人体检测、人脸检测和行为检测,然后对行为的动作做检测匹配,通过帧画面人体检测和行为检测数据代入步骤S2中构建的检测算法中;将人脸检测数据代入retina face的检测算法中,捕捉人脸信息;S4:对代入数据行为的动作做检测匹配,若检测为使用手机动作,则进入步骤S5处理,若检测为未使用手机动作,则结束判定;S5:获取连续画面,并通过匈牙利算法加卡尔曼滤波共同组成的人体追踪算法实现对人体的追踪,...

【专利技术属性】
技术研发人员:龚艺洋何忠杰范旭阳
申请(专利权)人:成都考拉悠然科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1