一种基于yolo和多任务卷积神经网络的导购消极行为监控方法技术

技术编号：20242948 阅读：35 留言：0更新日期：2019-01-29 23:30

基于yolo和多任务卷积神经网络的导购消极行为监控方法，首先训练一个基于yolo的行人检测模型，用ImageNet和voc2007数据集预训练模型，再用监控场景图像微调模型；然后构建一个基于ResNet50的多任务卷积神经网络，用手工标注过的多标签图像数据训练该网络；接着用rtsp协议读取商场监控画面，用行人检测模型检测画面中的行人，而后将行人图像输入到多任务卷积神经网络，识别行人是否为导购，是否闲坐，是否在玩手机，以此判断导购是否存在消极行为，并将“严重消极”和“一般消极”的导购画面保存在本地。最终实现用基于yolo的行人检测网络和多任务卷积神经网络对导购消极行为进行有效的监控和记录。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于yolo和多任务卷积神经网络的导购消极行为监控方法
本专利技术涉及在新零售领域的导购消极行为监控方法。
技术介绍
随着人工成本的提高，在商场里，招聘更多的导购意味着成本的提升。然而有部分导购存在着消极工作的行为，比如“玩手机”、“附近有顾客时坐着”等消极行为，造成人力资源的浪费。为避免不必要的支出，商场对导购进行有效的考勤管理显得尤为重要。普通的考勤系统只能记录导购的上下班时间，不能自动分析导购在上班时间是否存在消极工作的情况，也不能记录下导购消极工作时的画面。针对这一需求，本专利技术利用计算机视觉技术对商场内普遍存在的监控所采集的图像进行图像识别、分析。针对行人检测，已有的方法中，有利用方向梯度直方图作为行人检测的描述子，再用SVM进行分类，这种方法精度不是很高，容易误检。近年来深度卷积神经网络应用在行人检测方面，对行人检测的精度有很大提升，然而由于迁移学习中跨数据集的拟合问题，这种方法在监控视角下缺乏鲁棒性。针对属性识别，卷积神经网络在属性分类的精度上取得传统方法不能比拟的效果。近年来，VGG、ResNet、DenseNet等CNN模型框架已经得到广泛的应用。然而一个原始的ResNet只能对一个属性进行分类，多个属性则需要训练多个模型，这极大地增加了计算的负担。由此可见，对于识别、记录导购消极行为的监控系统，目前还没有完善的解决方案。
技术实现思路
本专利技术要克服现有技术的上述缺点，提供一种基于yolo和多任务卷积神经网络的导购消极行为监控方法。为实现上述专利技术目的，本专利技术设计一种基于yolo和多任务卷积神经网络的导购消极行为监控系统。首先...

【技术保护点】
1.一种基于yolo和多任务卷积神经网络的导购消极行为监控方法，含有以下步骤：(1)训练基于yolo的行人检测模型；步骤11：构建基于yolo的行人检测模型；使用跳层融合的方式，特征提取阶段一使用13个卷积层和4个最大池化层，阶段二使用7个卷积层，在阶段一和阶段二中间有1个最大池化层，调整阶段一的输出的特征图大小与阶段二输出的特征图大小一致；然后将这两个调整过大小的特征图通过叠加的方式融合在一起，成为阶段三的输入；阶段三有两种模式，模式一是分类网络，该模式在预训练模型的时候用到，具体而言就是一层3×3的卷积层，再加一层全连接层，全连接层神经元个数等于分类个数；模式二是检测网络，该模式是在加载模式一的预训练参数之后，训练检测网络时用的，具体而言就是一层3×3的卷积层，再加一层1×1的卷积层，卷积核的个数与检测类别相关，具体数值为：anchors个数×(5+检测类别个数)；步骤12：用ImageNet数据集预训练分类模型；良好的初始化参数是模型收敛的重要一环，而检测数据集由于标注步骤繁琐，导致其每种类别的数据量不多；因此用ImageNet数据集去训练一个分类模型，使训练好的分类模型参数作为...

【技术特征摘要】
1.一种基于yolo和多任务卷积神经网络的导购消极行为监控方法，含有以下步骤：(1)训练基于yolo的行人检测模型；步骤11：构建基于yolo的行人检测模型；使用跳层融合的方式，特征提取阶段一使用13个卷积层和4个最大池化层，阶段二使用7个卷积层，在阶段一和阶段二中间有1个最大池化层，调整阶段一的输出的特征图大小与阶段二输出的特征图大小一致；然后将这两个调整过大小的特征图通过叠加的方式融合在一起，成为阶段三的输入；阶段三有两种模式，模式一是分类网络，该模式在预训练模型的时候用到，具体而言就是一层3×3的卷积层，再加一层全连接层，全连接层神经元个数等于分类个数；模式二是检测网络，该模式是在加载模式一的预训练参数之后，训练检测网络时用的，具体而言就是一层3×3的卷积层，再加一层1×1的卷积层，卷积核的个数与检测类别相关，具体数值为：anchors个数×(5+检测类别个数)；步骤12：用ImageNet数据集预训练分类模型；良好的初始化参数是模型收敛的重要一环，而检测数据集由于标注步骤繁琐，导致其每种类别的数据量不多；因此用ImageNet数据集去训练一个分类模型，使训练好的分类模型参数作为检测模型中共有结构的初始化参数；步骤13：用voc2007数据集预训练检测模型；由于检测模型的前几层结构与分类网络一致，将步骤12中训练好的分类网络的参数作为检测网络中共有结构的初始化参数；voc2007数据集是常用的检测数据集，共有20类的标注好的检测物体，其中包括行人图像数据；只取其中的行人图像数据进行训练，对行人数据进行数据增强的操作，调整图像大小为448×448，用SGD优化器训练160个epoch，初始学习率设置为0.0001；步骤14：用监控视角数据集微调模型；由于voc2007中的行人数据大部分都不是监控视角下的行人图像，因此将步骤13训练好的模型去检测商场监控画面中的行人，会有一些困难；因此选取BOT2018新零售技术挑战赛中的数据集进行微调，该数据集的行人图像采集自真实商场场景下的监控摄像头；对该数据集的图像进行水平旋转、中心随机裁剪、HSV空间微调等数据增强的操作，并将尺寸大小调整为448×448；加载步骤13训练好的模型，用SGD优化器训练160个epoch，初始学习率设置为0.001，学习率随着训练次数的增多而减小，0-5个epoch时学习率设置为0.001，5-80个epoch时学习率设置为0.0001，80-160个epoch时学习率设置为0.00001；(2)训练基于ResNet50的多任务卷积神经网络；步骤21：构建基于ResNet50的多任务卷积神经网络；对步骤(1)中检测到的行人，需要去识别行人的属性，以此判断导购是否存在消极工作的行为，数据集中标注的属性有：“顾客”或“导购”、“男性”或“女性”、“站立”或“坐着”、“玩手机”或“不玩手机”；这些属性彼此之间无关联性，视为不相关属性；ResNet50是一个在分类性能表现优异的网络结构，然而一个原始的ResNet50直接去识别多个不相关属性的时候效果往往不佳，而针对每个属性都训练一个模型会导致占用额外...

【专利技术属性】
技术研发人员：赵云波，林建武，李灏，宣琦，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人