一种基于深度学习和颜色空间的工装识别方法和装置制造方法及图纸

技术编号:39009345 阅读:13 留言:0更新日期:2023-10-07 10:40
本发明专利技术涉及信息处理领域,公开了一种基于深度学习和颜色空间的工装识别方法及装置,通过改进的HSV色彩空间,针对室外工装独有的光照特点,调整了亮度V值的轨迹,将其由固定值变为动态取值,更能表达数据原有特征,保证了特征提取的准确性;同时通过使用resnet50网络,避免了算法过拟合,结合深度学习目标检测人形检测,保证了工装识别的精确性。保证了工装识别的精确性。保证了工装识别的精确性。

【技术实现步骤摘要】
一种基于深度学习和颜色空间的工装识别方法和装置


[0001]本专利技术涉及信息处理领域,特别是一种基于深度学习和颜色空间的工装识别方法和装置。

技术介绍

[0002]目前,随着人工智能技术的不断发展,催生了越来越多新的业务需求,人工智能在安防行业的应用也越来越来普及,以往单纯靠人工和视频监控来提供安防的形式也带来了变革。如工厂、商场、工作园区等场景的工作人员都有要求穿着统一着装以方便管理,单靠安装摄像头,人为监视监控视频,在场景复杂人员较多的园区实现时刻监控人员着装,需要更多的监控,投入更多的人力等资源,耗费时间、耗费人力、耗费钱财。对于普通商家而言,大幅度的放置摄像头需要大量的布线和能源消耗,这已经成为工厂、园区、商店等场所令人头疼的问题。如何提高识别准确度,提升图像处理的效能,成为安防领域中需要关注的问题。

技术实现思路

[0003]为解决上述问题之一,本专利技术提供了一种基于深度学习和颜色空间的识别方法及装置,应用于工装识别。所述方法包括:
[0004]步骤101:获取工装监控图像数据集;
[0005]步骤102:对工装图像数据集中图像进行数据预处理,将工装图像数据集中图像筛选之后,进行分辨率统一化处理;
[0006]步骤103:对数据预处理后的工装图像数据集中工装图像进行数据增强,对数据中的色彩空间做增强包括:当光照不同造成的视觉感知不同的场景下,采用Value这个通道进行计算,通过计算梯度,提取物体边缘;当处于前景饱和度高时,背景采用饱和度低的颜色来衬托前景,提取Saturation通道的信息;当处于在室内场景下且风格较为单一时,增大Hue通道权重值;将亮度V的值由静态转为动态;
[0007]步骤104:构建工装识别网络,基于工装之间除颜色外差距小的特征,使用残差网络来避免过拟合;将采用数据增强后的工装图像数据集送入目标检测人形网络模型进行检测,提取到工装图像人形数据集;
[0008]步骤105:采用数据增强后的工装图像数据集训练工装分类网络,获得工装识别模型;
[0009]步骤106:采用工装识别模型对待检测工装监控图像进行工装分类检测。
[0010]优选的,所述步骤102中的数据预处理还包括:对数据集做整理,将总数据集分为测试集和训练集;训练集用于训练工装分类网络的模型参数。
[0011]优选的,所述步骤103中将亮度V的值由静态转为动态包括:选择sigmoid函数作为V值的动态变化轨迹的描述;sigmoid函数
[0012][0013]sigmoid函数取值范围为(0,1),将实数V值映射到(0,1)的区间。
[0014]优选的,所述步骤105具体包括:
[0015]采用所述数据增强后的工装图像数据集,以在工装图像中人形位置信息训练人形检测模型,使用所述人形检测模型提取图像中的人形数据制作成数据集,设置数据增强图片最大限度numbers=50000。
[0016]优选的,步骤104中使用残差网络来避免过拟合具体包括:设置工装识别网络包括resnet50。
[0017]优选的,其中工装图像数据集中的图像为通过监控摄像头拍摄视频图像。
[0018]优选的,步骤105中具体还包括:采用所述人形数据集训练所述工装图像分类网络,获得工装图像分类模型;使用训练集训练工装图像分类网络,学习率采用余弦算法,初始学习率r=0.00001,梯度模型使用小批量梯度下降;训练300个epochs时会进行一次评判,判断误差和精度是否能够达到要求;达到要求则终止训练,否则继续训练至达到要求。
[0019]优选的,步骤104中的采用数据增强后的工装图像数据集送入目标检测人形网络模型进行检测,提取到工装图像人形数据集,其中目标检测算法为yolov 3或yolov 5

s算法。
[0020]优选的,所述方法应用于加油站的员工的工装识别。
[0021]本专利技术还提供一种基于深度学习和颜色空间的工装识别装置,所述装置用于实现上述方法,所述装置包括:数据集获取模块,用于获取工装图像数据集;
[0022]数据预处理模块,用于对工装图像数据集中图像进行数据预处理;数据增强模块,用于对数据预处理后的工装图像数据集中工装图像进行数据增强;
[0023]工装图像分类网络构建模块,用于构建工装识别网络,工装识别网络包括ResNet50网络;
[0024]工装图像分类网络训练模块,用于采用数据增强后的工装图像数据集训练工装识别网络,获得工装识别模型;
[0025]工装识别模块,用于采用工装识别模型对待检测工装图像工装识别。
[0026]本专利技术改变了以往单纯靠人工进行工装识别的模式,使用人工智能算法代替人工进行工装识别,减少了人工的投入,节省了资金。同时,本专利技术使用改进HSV色彩空间数据增强方法,解决了以往工装识别中算法过拟合,识别精度低的问题。优选的还提供一种装置,所述装置包括处理器和存储器,所述存储器上存储有计算机程序,所述处理器用于执行存储器上的计算机程序用于实现上述方法。
[0027]本专利技术通过使用resnet50网络,避免了算法过拟合,更加有利于工程落地;改进的HSV色彩空间,针对室外工装独有的光照特点,调整了明度V值的轨迹,将其由固定值变为动态取值,更能表达数据原有特征,保证了特征提取的准确性;结合了深度学习目标检测人形检测,保证了工装识别的精确性。
附图说明
[0028]通过参考附图会更加清楚的理解本专利技术的特征和优点,附图是示意性的而不应理
解为对本专利技术进行任何限制。
[0029]图1是本专利技术提供识别方法的流程示意图。
[0030]图2是本专利技术提供识别方法优化的流程示意图。
[0031]图3是本专利技术中V值的动态变化轨迹示意图。
[0032]图4是本专利技术的装置的结构示意图。
具体实施方式
[0033]参看下面的说明以及附图,本专利技术的这些或其他特征和特点、操作方法、结构的相关元素的功能、部分的结合以及制造的经济性可以被更好地理解,其中说明和附图形成了说明书的一部分。然而,可以清楚地理解,附图仅用作说明和描述的目的,并不意在限定本专利技术的保护范围。可以理解的是,附图并非按比例绘制。本专利技术中使用了多种结构图用来说明根据本专利技术的实施例的各种变形。
[0034]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0035]需要说明的是,本文中的“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
[0036]需要说明的是,为了便于清楚描述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习和颜色空间的工装识别方法,其特征在于,所述方法包括:步骤101:获取工装监控图像数据集;步骤102:对工装图像数据集中图像进行数据预处理,将工装图像数据集中图像筛选之后,进行分辨率统一化处理;步骤103:对数据预处理后的工装图像数据集中工装图像进行数据增强,对数据中的HSV色彩空间做增强包括:当光照不同造成的视觉感知不同的场景下,采用Value这个通道进行计算,通过计算梯度,提取物体边缘;当处于前景饱和度高时,背景采用饱和度低的颜色来衬托前景,提取Saturation通道的信息;当处于在室内场景下且风格较为单一时,增大Hue通道权重值;将亮度V的值由静态转为动态;步骤104:构建工装识别网络,基于工装之间除颜色外差距小的特征,使用残差网络来避免过拟合;将采用数据增强后的工装图像数据集送入目标检测人形网络模型进行检测,提取到工装图像人形数据集;步骤105:采用数据增强后的工装图像数据集训练工装分类网络,获得工装识别模型;步骤106:采用工装识别模型对待检测工装监控图像进行工装分类检测。2.如权利要求1所述方法,所述步骤102中的数据预处理还包括:对数据集做整理,将总数据集分为测试集和训练集;训练集用于训练工装分类网络的模型参数。3.如权利要求2所述的方法,所述步骤103中将亮度V的值由静态转为动态包括:选择sigmoid函数作为V值的动态变化轨迹的描述;sigmoid函数sigmoid函数取值范围为(0,1),将实数V值映射到(0,1)的区间。4.如权利要求3所述的方法,其特征在于:所述步骤105具体包括:采用所述数据增强后的工装图像数据集,以在工装图像中人形位置信息训练人形检测模型,使用所述人形检测模型提取图像中的人形数据制作成数据集,设置数据增强...

【专利技术属性】
技术研发人员:陆彬孟思宏李琳姜德田范以云龙如兵
申请(专利权)人:行为科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1