一种基于融合信息的外卖人员身份识别方法技术

技术编号：25757274 阅读：16 留言：0更新日期：2020-09-25 21:06

本发明专利技术公开了一种基于融合信息的外卖人员身份识别方法。本发明专利技术提出了一种基于多级特征和空间注意力机制的多目标检测网络MFCNet。该网络结构包括四部分，即特征提取主干网络模块、特征融合模块、多尺度信息提取模块以及空间注意力机制模块。针对MFCNet网络的训练，首先先使用PASCAL VOC数据集进行预训练，得到含有基础目标识别能力的预训练模型。然后通过收集外卖人员的多个属性特征，进行标记，做成数据集。最后在预训练模型的基础上，进行进一步的训练得到最终MFCNet识别模型，从而进行测试检测。本发明专利技术方法不但具有更好的鲁棒性和自适应能力。本发明专利技术不但采集了目标整体特征，而且通过多个附加目标信息的识别，能够较为准确的给出目标身份，适用性较强。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于融合信息的外卖人员身份识别方法
本文专利技术涉及外卖人员身份识别的方法，具体来讲是一种基于融合信息的外卖人员身份识别方法，属于目标识别

技术介绍
使用深度学习进行目标识别，已经得到了广泛的应用。建立在目标识别技术基础上的人员身份的识别，通常通过提取目标整体特征进行判断。这种做法仍存在数据集缺失，判断准确度不高，鲁棒性差等问题。使用多个目标信息综合判断人员身份的方法，具有一定合理性，它不但采集了目标整体特征，而且通过多个附加目标信息的识别，能够较为准确的给出目标身份，适用性较强。外卖人员身份识别过程中，存在外卖车辆，外卖箱，外卖公司logo等属性信息。可以通过对这些信息的提取判断，综合给出外卖人员身份。这些属性信息没有特定的数据集需要进一步收集。另外，多个目标信息存在尺度变化较大的问题，需要进一步设计相关机制进行提取。
技术实现思路
本专利技术的目的是针对现有技术的不足，提供一种基于融合信息的外卖人员身份识别方法，进行多家外卖人员身份识别任务。针对外卖人员目标尺度变化较大、姿态多样、logo等易与周围物体混淆等问题，提出了一种基于多级特征和空间注意力机制的多目标检测网络MFCNet。该网络结构包括四部分，即特征提取主干网络模块、特征融合模块、多尺度信息提取模块以及空间注意力机制模块。首先，通过将网络浅层特征和中间层特征信息融合，形成包含上下文信息的融合特征，用于解决浅层特征图中小目标语义信息不丰富、分类能力弱的问题；然后，利用空洞卷积增大感受野、不增加参数的特性，对融合特征...

【技术保护点】
1.一种基于融合信息的外卖人员身份识别方法，其特征在于包括如下步骤：/n步骤(1)使用特征提取主干网络模块、特征融合模块、多尺度信息提取模块和空间注意力机制模块，构建深度学习网络MFCNet；/n步骤(2)在PASCALVOC数据集上对深度学习网络MFCNet进行预训练，得到预训练识别模型；/n步骤(3)对外卖人员身份特征信息图片进行收集并标识；收集的身份特征信息图片包括：外卖电动车、外卖logo、外卖箱和外卖服装；使用收集的数据集对步骤(2)中的预训练识别模型进行进一步训练，得到最终的检测模型；/n步骤(4)将测试图片输入最终的MFCNet识别模型，检测出外卖电动车、外卖logo、外卖箱和外卖服装所属类别，对检测结果进行综合判断，以得出外卖人员身份类别。/n

【技术特征摘要】
1.一种基于融合信息的外卖人员身份识别方法，其特征在于包括如下步骤：
步骤(1)使用特征提取主干网络模块、特征融合模块、多尺度信息提取模块和空间注意力机制模块，构建深度学习网络MFCNet；
步骤(2)在PASCALVOC数据集上对深度学习网络MFCNet进行预训练，得到预训练识别模型；
步骤(3)对外卖人员身份特征信息图片进行收集并标识；收集的身份特征信息图片包括：外卖电动车、外卖logo、外卖箱和外卖服装；使用收集的数据集对步骤(2)中的预训练识别模型进行进一步训练，得到最终的检测模型；
步骤(4)将测试图片输入最终的MFCNet识别模型，检测出外卖电动车、外卖logo、外卖箱和外卖服装所属类别，对检测结果进行综合判断，以得出外卖人员身份类别。

2.根据权利要求1所述的一种基于融合信息的外卖人员身份识别方法，其特征在于步骤(1)所述构建深度学习网络MFCNet，具体实现过程如下：
1.1使用VGG16作为主干网络用于得到主干网络特征图，称之为特征提取主干网络模块；
1.2构建特征融合模块，首先利用1*1的卷积层，来降维浅层特征图和深层特征图的通道，使得浅层特征图和深层特征图的通道数一致；然后对将经过降维的深层特征图通过上采样放大到和浅层特征图相同的尺寸；最后利用concate操作将所有相同尺寸的浅层特征图和深层特征图连接，形成主干网络融合特征图，从而能够保证不同特征图检测的同一个目标所包含的特征区域被激活；具体过程如图2所示：
1.3将步骤1.2中获取的主干网络融合特征图和步骤1.1中获取主干网络特征图进一步融合，即将主干网络融合特征图和主干网络特征图相加形成新的特征图；
1.4将进一步融合特征图送入多尺度信息提取模块，多尺度信息提取模块使用并行的空洞卷积操作；
1.5将多尺度融合特征图送入空间注意力机制模块，提取不同空间信息，得到包含关键信息的特征图。

3.根据权利要求2所述的一种基于融合信息的外卖人员身份识别方法，其特征在于步骤1.3具体实现如下：
1.3.1对主干网络特征图进行反卷积操作，使得主干网络特征图与特征融合模块输出的主干网络融合特征图具有相同的长宽，确保尺度完全一样；
1.3.2对主干网络融合特征图卷积操作，使得卷积后的主干网络融合特征图的通道数与步骤1.3.1反卷积后的主干网络特征图通道数相同；
1.3.3将经过卷积后的主干网络融合特征图与经过反卷积后的主干网络特征图进行像素级相加操作，得到新的进一步融合特征图。

4.根据权利要求3所述的一种基于融合信息的外卖人员身份识别方法，其特征在于步骤1.4具体实现如下：
1.4.1利用1*1的卷积层，减少特征图的通道数以降低计算量,并加入ReLU激活函数；
1.4.2利用大小为3...

【专利技术属性】
技术研发人员：姜明，李鹏飞，张旻，汤景凡，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人