当前位置: 首页 > 专利查询>淮阴工学院专利>正文

一种基于YOLOV7模型的面向嵌入式硬件的人脸识别方法技术

技术编号:37820255 阅读:16 留言:0更新日期:2023-06-09 09:54
本发明专利技术涉及生物人脸识别技术领域,公开了一种基于YOLOV7模型的面向嵌入式硬件的人脸识别方法,获取数据集信息并将数据集信息进行标注;基于yolov7模型进行改进获取图像识别网络模型,改进后的yolov7模型在backbone与head连接处增加注意力机制及滤波器;采用训练集对构建图像识别网络模型进行训练,得到训练后的图像识别网络模型;采用测试数据集对训练后的图像识别网络模型进行测试,获取测试结果;采用训练测试后的图像识别网络模型进行人脸识别。与现有技术相比,本发明专利技术引入F

【技术实现步骤摘要】
一种基于YOLOV7模型的面向嵌入式硬件的人脸识别方法


[0001]本专利技术涉及生物人脸识别
,具体涉及一种基于YOLOV7模型的面向嵌入式硬件的人脸识别方法。

技术介绍

[0002]随着计算机网络技术的不短发展,嵌入式系统的成熟应用,为人脸识别系统的开发研究奠定了坚实的基础。然而,嵌入式系统和通用PC除了操作系统本身的区别,在硬件方面也有非堂大的差异。目前常用的PC机,特别是一些大型服务器,其运行的内存可以达到几个G至几十个G,数据存储空间高达几百G;对于嵌入式系统,可用的存储器空间是相当有限的,最好的系统存储器只有几百兆(M),并且这些存储空间还包括操作系统本身需要的存储器空间,所以供用户真正使用的内存较少。嵌入式人脸识别系统对影像设备、核心算法、构建人脸训练样本集和系统工作环境的选择比较严格。
[0003]人脸识别是以计算机为基础,达到识别人脸的目的,识别的图像可以是静止的图像,也可以是动态的图像。问题一般可描述如下:给定一个静止视频图像或者是场景,采用人脸数据库,确认一个或多个场景中的人。人脸识别的研究一般分为四个部分:从复杂的背景中先实现人脸定位检测,提取人脸识别特征;特征降维;最后通过匹配来识别。从20世纪60年代开始研究人脸识别技术,经过50多年的研究发展,人脸识别技术已经取得了相当大的进展。在光照恒定、无遮挡正面照等比较理想的情况下,人脸识别的识别率较高,所以,人脸识别技术在公共安全(如身份鉴定和视频监控等)和政府管理部门的应用十分广泛。
[0004]目前面向嵌入式硬件的人脸识别方法,由于现场环境和硬件设备的影响,采集的人脸图像往往经过预处理转换为灰度图像,在彩色图像和灰度图像之间的转化会丢失部分原始人脸图像的信息,进而导致识别不准确。如果直接采集彩色图像进行人脸识别,占用时间较长、训练模型大,不能实时显示人脸信息,而且需占用较大的计算空间,但嵌入式硬件多数体积小、存储空间有限,不能搭载大型训练模型。

技术实现思路

[0005]专利技术目的:针对现有技术中存在的问题,本专利技术提供一种基于YOLOV7模型的面向嵌入式硬件的人脸识别方法,对YOLOV7模型改进,引入F

SRA注意力机制、轻量级卷积滤波器,对于人脸识别检测的效果识别度更高并具有更高的鲁棒性。
[0006]技术方案:本专利技术提供了一种基于YOLOV7模型的面向嵌入式硬件的人脸识别方法,包括如下步骤:
[0007]S1:获取数据集信息,先对数据集信息进行标注,然后采用数据增强等操作扩充数据集;
[0008]S2:基于yolov7模型对图像识别网络模型进行改进,改进后的yolov7模型包括input、backbone、head三层网络,在backbone与head连接处增加注意力机制及滤波器;
[0009]S3:输入图像识别网络模型的各个参数指标,采用训练集对所构建的图像识别网
络模型进行训练,得到训练后的图像识别网络模型;
[0010]S4:采用测试数据集对训练后的图像识别网络模型进行测试,获取测试结果并分析得到最佳训练模型;
[0011]S5:采用训练测试后的图像识别网络模型进行人脸识别。
[0012]进一步地,所述yolov7模型共106层深度,backbone共有51层深度;
[0013]从第0层开始,其中第24、37、50层为输出层;
[0014]Head共55层深度,其中第75,88,101为三层不同大小的感受野对应的输出层;
[0015]对75,88,101层进行一次repconv操作得出结果。
[0016]进一步地,所述改进后的yolov7模型具体结构如下:
[0017]包括input、backbone、head,共109层深度;在backbone与head连接处增加3层注意力机制及滤波器,即在原yolov7网络深度为24、37、50层处添加,修改后的backbone共有54层深度,其中第25、39、53层为输出层;head不变,仍为55层深度,其中第78,91,104为三层不同大小的感受野对应的输出层,对78,91,104层进行一次repconv操作得出结果。
[0018]进一步地,所述注意力机制为Face Spatial ReductionAttention注意力机制,即F

SRA注意力机制,所述F

SRA注意力机制包括三个输入query(q),key(k)和value(v);
[0019]第i个通道的头部输出h
i
通过公式1与线性投影矩阵w
o
级联得到q,k,v的关系式SRA:
[0020]SRA(q,k,v)=[h0,h1,h2,...,h
j
,...h
i
]w
o
ꢀꢀꢀꢀ
(1)
[0021]在注意力操作之前在输入特征上使用输出大小为7的自适应最大池化层来减少参数的使用,通过公式2由F

SRA函数所示拼接h0到h
i
将其线性映射为最终输出Y:
[0022]Y=F

SRA(AdaptiveMaxPool(SRA(q,k,v)))
ꢀꢀꢀꢀ
(2)
[0023]其中,AdaptiveMaxPool为自适应池化层。
[0024]进一步地,所述F

SRA注意力机制具体为:
[0025]注意力函数Att如公式3所示:
[0026][0027]其中,softmax为归一化指数函数,T为向量的转置,d
k
为模型维度,除以是为了归一化减小维度,提高训练过程中的梯度;
[0028]第j个通道的头部输出hhi如公式4所示:
[0029][0030]其中,w
j
为属于q,k,v的一个线性投影矩阵;
[0031]在注意力机制之前,利用公式5来降低输入序列k和v的空间维度:
[0032]S
r
(x
i
,r
i
,w
s
)=Norm(Reshape(x
i
,r
i
)w
s
)
ꢀꢀ
(5)
[0033]其中,Reshape函数是在不改变矩阵的数值的前提下修改矩阵的形状,Norm表示范数,x
i
为输入序列,r
i
为第i阶段注意力缩减比。
[0034]进一步地,所述滤波器为轻量级卷积滤波器Convolutional Feed Forward,所述轻量级卷积滤波器高度为3,宽度为1的滤波器,其基数为n
i
,输入通道数和填充为1,然后,采用一组1
×
1深度卷积和基数n0进行跨信道卷积;1
×
1卷积层相当于跨信道参数池化层,
卷本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于YOLOV7模型的面向嵌入式硬件的人脸识别方法,其特征在于,包括如下步骤:S1:获取数据集信息,先对数据集信息进行标注,然后采用数据增强等操作扩充数据集;S2:基于yolov7模型对图像识别网络模型进行改进,改进后的yolov7模型包括input、backbone、head三层网络,在backbone与head连接处增加注意力机制及滤波器;S3:输入图像识别网络模型的各个参数指标,采用训练集对所构建的图像识别网络模型进行训练,得到训练后的图像识别网络模型;S4:采用测试数据集对训练后的图像识别网络模型进行测试,获取测试结果并分析得到最佳训练模型;S5:采用训练测试后的图像识别网络模型进行人脸识别。2.根据权利要求1所述的基于YOLOV7模型的面向嵌入式硬件的人脸识别方法,其特征在于,所述yolov7模型共106层深度,backbone共有51层深度;从第0层开始,其中第24、37、50层为输出层;head共55层深度,其中第75,88,101为三层不同大小的感受野对应的输出层;对75,88,101层进行一次repconv操作得出结果。3.根据权利要求2所述的基于YOLOV7模型的面向嵌入式硬件的人脸识别方法,其特征在于,所述改进后的yolov7模型具体结构如下:包括input、backbone、head,共109层深度;在backbone与head连接处增加3层注意力机制及滤波器,即在原yolov7网络深度为24、37、50层处添加,修改后的backbone共有54层深度,其中第25、39、53层为输出层;head不变,仍为55层深度,其中第78,91,104为三个感受野对应的输出层,对78,91,104层进行repconv操作得出结果。4.根据权利要求3所述的基于YOLOV7模型的面向嵌入式硬件的人脸识别方法,其特征在于,所述注意力机制为FaceSpatialReductionAttention注意力机制,即F

SRA注意力机制,所述F

SRA注意力机制包括三个输入query(q)、key(k)和value(v);第i个通道的头部输出h
i
,通过公式(1)与线性投影矩阵w
o
级联得到q,k,v的关系式SRA:SRA(q,k,v)=[h0,h1,h2,...,h
j
,...h
i
]w
o
ꢀꢀꢀꢀ
(1)在注意力操作之前,在输入特征上使用输出大小为7的自适应最大池化层来减少参数的使用,通过公式(2)由F

SRA函数拼接h0到h
i
将其线性映射为最终输出Y:Y=F

SRA(AdaptiveMaxPool(SRA(q,k,v)))
ꢀꢀꢀꢀ
(2)其中,AdaptiveMaxPool为自适应池化层。5.根据权利要求4所述的基于YOLOV7模型的面向嵌入式硬件的人脸识别方法,其特征在于,所述F

SRA注意力机制具体为:注意力函数Att如公式(3)所示:其中,softmax为归一化指数函数,T为向量的转置,d
k
为模型维度,除以是为了归一化减小维度,提高训练过程中的梯度;
第j个通道的头部输出h
j
...

【专利技术属性】
技术研发人员:张粤相福康倪伟孙靖康张何顺
申请(专利权)人:淮阴工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1