一种视频下实时的行人衣着颜色识别方法技术

技术编号：34393417 阅读：14 留言：0更新日期：2022-08-03 21:24

本发明专利技术提供一种视频下实时的行人衣着颜色识别方法，属于计算机视觉领域和图像处理技术领域，本发明专利技术通过Yolo目标检测算法可以对行人及行人衣着进行快速提取。通过对图片进行随机序列化，将图片转化为元素序列，将图片中的结构信息及空间信息屏蔽，保留图片的色彩信息。根据RGB

全部详细技术资料下载

【技术实现步骤摘要】
一种视频下实时的行人衣着颜色识别方法

[0001]本专利技术涉及计算机视觉领域和图像处理
，尤其涉及一种视频下实时的行人衣着颜色识别方法。

技术介绍

[0002]在计算机视觉涉及到的各个领域中，监控视频下的行人的精准识别尤为重要，而衣着颜色作为行人的一个重要的属性，是对行人进行精准化分析的一个关键要素。
[0003]而目前对行人衣着颜色识别的方法有以下问题：
[0004](1)一般通过目标检测算法或语义分割算法将行人及衣着从整体图片中截取出来。但语义分割算法是对图片中每个像素点进行分类因此运行速度极慢、在大部分机器上很难达到视频监控中实时截取的速度要求，而目标检测算法大部分使用传统的双阶段目标检测算法，如FAST
‑
RCNN,FASTER
‑
RCNN，这类算法虽然相较于语义分割算法速度上得到了提升，但在部分机器上仍然无法达到视频监控中实时截取的速度要求。
[0005](2)在将行人从图片中截取出来后，通常使用聚类算法进行主颜色提取，但聚类算法大部分只能部署运行在CPU，无法应用GPU算力进行运算，因此速度较慢。
[0006](3)在将行人的图片截取出来后，通常使用卷积神经网络进行颜色识别，但由于卷积神经网络对于图片的结构信息和空间信息较为敏感；随着网络加深，图片底层颜色信息损失较大，对于图片底层的颜色信息的学习理解能力较弱，故对于干扰项较多的衣着颜色识别的效果较差。

技术实现思路

[0007]为了解决以上技术问题，本专利技术提供...

【技术保护点】

【技术特征摘要】
1.一种视频下实时的行人衣着颜色识别方法，其特征在于，截取图片再截取；通过RGB与HSV色彩空间转换构建颜色词典，以该词典为基础，使用随机函数叠加算法生成数据集；图片序列化；设计构建Seq2One模型，使用随机函数叠加算法生成数据集进行训练，使用该模型对序列化图片进行颜色识别。2.根据权利要求1所述的方法，其特征在于，通过Yolo目标检测算法对行人及行人衣着进行提取；通过对图片进行随机序列化，将图片转化为元素序列，将图片中的结构信息及空间信息屏蔽，保留图片的色彩信息。3.根据权利要求2所述的方法，其特征在于，根据RGB
‑
HSV色彩空间的转换，对16777216种RGB的值进行编码，形成颜色词典；根据颜色词典的映射关系，使用随机函数叠加算法生成训练图片；构建Seq2One模型，去除Seq2Seq模型中的注意力机制，降低解码器输出层神经元数量，减少模型参数量。4.根据权利要求3所述的方法，其特征在于，先对色彩通道V进行判断，后对色彩通道S进行判断，最后对色彩通道H进行判断；通过以上判断顺序及判定逻辑可以准确的对每个RGB值进行编码，构成16777216种K
‑
V键值对形式的颜色词典；该颜色词典的构建为使用随机函数叠加算法生成数据集构建查表指标。5.根据权利要求1所述的方法，...

【专利技术属性】
技术研发人员：梁翔宇，李玉坤，段京峰，卢则兴，
申请(专利权)人：浪潮软件集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人