【技术实现步骤摘要】
一种改进YOLO
‑
PAI的实时接打电话行为检测方法
[0001]本专利技术涉及深度学习、图像处理技术及辅助驾驶
,具体涉及一种改进YOLO
‑
PAI的实时接打电话行为检测方法。
技术介绍
[0002]在网络高速发展的时代背景下,随着智能手机的普遍应用,例如微信电话等免费语音通话方式得到了很大的关注,语音通话虽给人生活带来了便利,是生活中必不缺少的环节,但在一些特殊场所手持通话却带来了重大安全隐患。例如:机车乘务员接打电话会导致注意力分散而造成安全事故的发生;在加油站加油时,要遵守加油站内不打手机等规定,尤其是在离加油枪、储油罐较近的区域,更应提高安全意识,否则会引发爆炸;开车时接打电话属于一种危险驾驶行为,开车接打电话导致事故的风险比通常情况下高出4倍,开车接打手机时的反应比其他危险驾驶行为酒驾、毒驾还要慢得多,很容易发生交通事故。
[0003]针对人手持通话会导致的重大安全隐患问题,这些特定场景中都安装了监控摄像头,例如加油站、公交车、货车、出租车,这对人的行为起到了一定的约束和规范作用,然而,人由于疏忽、怠慢等心理原因仍可能不自觉的做出危险行为,从而发生安全事故。人员在特定场景手持通话等危险行为检测算法与嵌入式应用,得到了大量的研究。传统的方法使用机器学习算法,需要手工提取特征,然后使用一个分类器进行分类,如Haar特征+Adaboost算法,Hog特征+SVM算法,DPM算法等。这些方法一般有以下缺点:特征需要人工提取,工作量大,时间成本高,检测效果一般。随着 ...
【技术保护点】
【技术特征摘要】
1.一种改进YOLO
‑
PAI的实时接打电话行为检测方法,其特征在于:包括以下步骤:步骤S1、通过监控平台获取的人员接打电话视频,建立并标注Phonehand_Imgs数据集,并划分训练集、验证集和测试集;步骤S2、使用目标检测模块和注意力机制模块搭建卷积神经网络,网络最终输出为人的手部、手机和检测框位置信息;步骤S3、利用搭建的卷积神经网络对数据集图像进行训练,对于步骤S1中的数据集图像进行特征提取,图像通过SRblock_body结构,在对图像进行卷积的过程中不断融合浅层的图像特征;步骤S4、在卷积的过程中,使用SE通道注意力机制和CBAM空间注意力机制,为不同的特征分配不同的权重,使网络能够更有效地提取关键特征;步骤S5、增加第四个尺度的特征映射分支,扩大检测范围,丰富用于预测多尺度的特征图。步骤S6、将接打电话检测模型转换为可以嵌入式部署的模型。步骤S7、将步骤S6中转换后的模型部署到监控终端设备中,将终端设备摄像头拍摄的视频流输入接打电话检测模型,并输出检测结果。2.如权利要求1所述的基于边缘对称填充和大感受野的路面病害检测方法,其特征在于:步骤S1包括:步骤S11、Phonehand_Imgs数据集由视频监控设备采集,提取数据集中人员手部和手机两种标注信息;步骤S12、将Phonehand_Imgs数据集按照8:2的比例划分训练集和验证集;步骤S13、在训练阶段加载数据集时,使用Mosaic数据增强方法提高数据鲁棒性、利用Label Smoothing平滑、CIOU、学习率余弦退火衰减提高实验效果,以及水平和垂直翻转、随机旋转、随机裁剪、变形和缩放数据增强方式增加数据量较少的类型的样本量,提高模型的泛化能力。3.如权利要求1所述的基于边缘对称填充和大感受野的路面病害检测方法,其特征在于:步骤S2中所述卷积神经网络包括目标检测模块和注意力机制模块,其中,目标检测模块用于检测人的手部信息及手机位置信息,注意力机制模块用于为不同的特征分配不同的权重,使网络能够更有效地提取关键特征。4.如权利要求1所述的基于边缘对称填充和大感受野的路面病害检测方法,其特征在于:步骤2所述YOLO
‑<...
【专利技术属性】
技术研发人员:赵作鹏,郑天赐,郝凯,赵广明,徐俊杰,刘笑枫,崔舒娅,周杰,贺晨,
申请(专利权)人:中国矿业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。