一种基于变分级联信息瓶颈的置乱人脸识别方法技术

技术编号:21185275 阅读:69 留言:0更新日期:2019-05-22 15:53
本发明专利技术公开了一种基于变分级联信息瓶颈的置乱人脸识别方法,包括步骤:1)训练数据集预处理;2)模型定义与初始化;3)数据分批次前向传播;4)损失函数计算;5)反向传播计算梯度,更新权重;6)迭代训练,将步骤3)到5)重复执行直到整个模型收敛;7)测试模型结果,输入测试集中的人脸图像,通过整个模型得到最终的分类结果。本发明专利技术在ORL、CMUPIE以及PUBFIG三个数据集下进行训练并在测试集上测试,结果显示在不同的置乱操作下,本发明专利技术方法均能达到最高的识别准确率。

A Scrambled Face Recognition Method Based on Variable Hierarchical Joint Information Bottleneck

The invention discloses a scrambled face recognition method based on variable hierarchical joint information bottleneck, including steps: 1) training data set preprocessing; 2) model definition and initialization; 3) data batch forward propagation; 4) loss function calculation; 5) back propagation calculation gradient, update weight; 6) iterative training, repeating steps 3) to 5) until the whole model converges; 7) testing model results; Input the face image in the test set and get the final classification result through the whole model. The method is trained under three data sets of ORL, CMUPIE and PUBFIG and tested on the test set. The results show that the method can achieve the highest recognition accuracy under different scrambling operations.

【技术实现步骤摘要】
一种基于变分级联信息瓶颈的置乱人脸识别方法
本专利技术涉及图像处理的
,尤其是指一种基于变分级联信息瓶颈的置乱人脸识别方法。
技术介绍
伴随着近年来互联网、计算机视觉与摄像设备的快速发展,智能化视频监控技术在很多现实场景中具有越来越广泛的应用。在很多公共场所,智能化视频监控起到实时安保和可视化管理的职能更是难以取代。然而科技是把双刃剑,视频监控给我们的生活带来便利的同时也带来了隐私的泄露问题。在很多现有的应用中,特别是在警方进行犯罪调查的时候,往往需要获得大量包含隐私信息的视频内容,类似的应用还有商场的实时监控系统等。这些应用造成了隐私保护与系统可用性之间的矛盾,一方面我们希望系统能保护无辜用户的隐私,另一方面我们又希望能遍历所有用户的隐私内容以便找出我们希望的目标。在人类的众多生物特征信息中,脸部作为个人最关键的信息,我们认为对个人的隐私保护可以归结为对人脸的信息保护。那么视频监控中的隐私保护做法就可以通过对人脸信息的隐藏达到保护用户隐私。在这个前提下进行目标人物检索可以满足隐私与可用性的矛盾。因此为了实现这一目的,我们首先需要找到一个能保护隐私的方法,传统的加密技术对信息会造成不可避免的失真并且大部分加密算法复杂度较大,而视频监控对于信息传输实时性与安全性有较高要求,因此在现实应用的场景上,图像加密技术由于其耗时耗能往往只能用于系统后端离线的处理中。不过在加密技术之中有一种朴素的图像置乱,其通过将像素进行打乱达到信息加密,于此同时,置乱操作一般都是可逆的,因此理论上是可以恢复原始图像信息,是一种理想的图像加密技术的替换手段。为此我们采用直接对置乱图像进行识别的方法。这样一方面能保护隐私,另一方面又能达到我们的目的。目前为止,对于置乱人脸的识别方法有三种现有的做法,第一种是通过将人脸构建为图,从而通过图嵌入的方法对人脸进行模型的分类,进而获得可识别的不同子图,最后实现分类。第二种方法是通过流形的划分,将不同的人脸当成不同的多流形下划分的结果,进而在多流形假设下,应用判别分析法得到可划分的结果。第三种方法是通过卷积神经网络,构建不同人脸的多种拓扑图,每个人脸作为图上的一个节点,不同的人脸可以构造出不同的结果,最后通过神经网络进行判别。这三类方法在一定程度上具有适用性,但是却缺少对置乱人脸识别方法的统一建模,于此同时,也没有说明对多种不同的置乱是否均有效。
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足,提出了一种变分级联信息瓶颈的置乱人脸识别方法,构建出一套全新的解决置乱人脸识别的方法,在满足利用置乱实现隐私保护的前提下,实现对所有置乱人脸的识别,进而满足可用性。为实现上述目的,本专利技术所提供的技术方案为:一种基于变分级联信息瓶颈的置乱人脸识别方法,包括以下步骤:1)训练数据集预处理对训练数据集中的图像进行归一化操作以及置乱操作;2)模型定义与初始化定义级联信息瓶颈的变分人工神经网络,该人工神经网络结构包括变分自编码器与感知机分类器,从而构成级联信息瓶颈;对变分自编码器和感知机分类器进行权值初始化;3)数据分批次前向传播将训练数据集按分层采样分成多个子集,每个子集先进入变分自编码器进行编码得到流形同胚下的低维流形特征,再将流形特征输入到感知机分类器进行训练;4)损失函数计算计算变分自编码器的损失函数值;将低维压缩特征传入感知机分类器,将特征映射至标签空间;利用标签和感知机分类器计算交叉熵损失函数值,与变分损失加权求和得到损失函数值;5)反向传播计算梯度和更新权值利用得到的损失函数值,对变分自编码器和感知机分类器进行反向传播得到对应模型中权值的梯度,再通过梯度下降更新模型的权值;6)迭代训练,将步骤3)到步骤5)重复执行直到整个模型收敛;7)测试模型结果,输入测试集中的人脸图像,通过整个模型得到最终的分类结果。在步骤1)中,所述训练数据集预处理包括以下步骤:2.1)对图像的RBG三个通道进行规范化映射至[-1,1]范围;2.2)原始图片上的像素位置记为二维坐标图像进行置乱操作后的像素位置记为图像大小为M×M,进行三种置乱操作,第一种Anorld置乱为第二种Fabonacci置乱第三种为Hilbert置乱为在步骤2)中,对于模型定义与初始化,定义级联信息瓶颈的变分人工神经网络,包括变分自编码器f(·|Wf,bf)与感知机分类器g(·|Wg),变分自编码器有L层对应L个权值矩阵其中Wfl表示第l层的权值矩阵,WfL表示最后一层的权值矩阵,偏置项表示第l层偏置项,表示最后一层偏置项;对变分自编码器的每一层权值和感知机分类器权值Wg进行初始化,如公式(1)所示:其中,ω是维度与每层的权重大小一致的矩阵,对于第i行j列元素ωij,有ωij采样自标准正态分布,Din为每层网络的输入维度,第l层偏置项服从均值为0标准差为0.01的正态分布。在步骤3)中,所述数据分批次前向传播,包括以下步骤:3.1)将原始数据集按类别进行分层采样分成每份64个样本大小的子集x=(x1,x2,...,xi,...,xN),其中N为子集的个数,xi表示第i个数据子集;3.2)将每个子集放入变分自编码器前向传播,得到:αi=f(xi|Wf,bf)(2)其中,f(xi|Wf,bf)表示在权值为Wf和偏置为bf的时候的变分自编码器,将数据集xi转化为编码参数αi,αi数据有2m维的输出,其中前m维表示每一维度上的均值参数后m维表示每一维度上的标准差参数所有的子集批量传播一次之后得到的结果:其中,每个上的方差在每个子集上的记为:均值在每个子集上记为:3.3)将得到的进行重参数化得到等效映射后的低维流形特征z,均值为方差为其中,λ为数据的比例参数;接着将低维流形特征输入到感知机分类器中,得到输出c=g(z|Wg),其中c为计算得到数据的分类,Wg为感知机分类器的权值矩阵。在步骤4)中,所述计算损失函数包括以下步骤:4.1)计算变分自编码器的损失函数值,将得到的编码均值参数和方差参数代入下列公式计算:其中,表示在均值和方差下的变分自编码器损失函数值,N为子集个数,β∈[0,1]为拉格朗日调节参数,i为数据集下标,xi表示第i个数据子集,μi和σi分别表示第i个数据集下的均值和方差;4.2)将低维压缩特征传入感知机分类器,将特征映射至标签空间,利用标签信息进行损失函数计算:计算交叉熵损失函数值L2:其中,c={cik|i=1,2,...N;k=1,2,...,K}表示在训练过程中第i个样本分类为第k类的预测结果,对应的预测标签为数据集类别数为K,Wg为感知机分类器的权值矩阵,e为自然对数,zi∈z表示第i个低维流形特征,yi为第i个样本对应的目标标签,最终计算出感知分类器的损失函数L2;4.3)利用标签和感知机分类器计算交叉熵损失函数值,与变分损失求和得到总的损失函数值L=L1+L2,接着最小化这个损失函数就完成一次前向传播。在步骤5)中,反向传播计算梯度和更新权值,包括如下步骤:通过前向传播后得到总的损失值L,再通过反向传播求得对应模型权值和偏置项的偏导,并通过随机梯度下降对模型参数进行更新如式(9)、(10)、(11):其中,t表示迭代次数,ηt表示学习率,和分别代表第t次迭代时变分自编码器的权值和偏置,表示第t次迭代时感知机分类本文档来自技高网
...

【技术保护点】
1.一种基于变分级联信息瓶颈的置乱人脸识别方法,其特征在于,包括以下步骤:1)训练数据集预处理对训练数据集中的图像进行归一化操作以及置乱操作;2)模型定义与初始化定义级联信息瓶颈的变分人工神经网络,该人工神经网络结构包括变分自编码器与感知机分类器,从而构成级联信息瓶颈;对变分自编码器和感知机分类器进行权值初始化;3)数据分批次前向传播将训练数据集按分层采样分成多个子集,每个子集先进入变分自编码器进行编码得到流形同胚下的低维流形特征,再将流形特征输入到感知机分类器进行训练;4)损失函数计算计算变分自编码器的损失函数值;将低维压缩特征传入感知机分类器,将特征映射至标签空间;利用标签和感知机分类器计算交叉熵损失函数值,与变分损失加权求和得到损失函数值;5)反向传播计算梯度和更新权值利用得到的损失函数值,对变分自编码器和感知机分类器进行反向传播得到对应模型中权值的梯度,再通过梯度下降更新模型的权值;6)迭代训练,将步骤3)到步骤5)重复执行直到整个模型收敛;7)测试模型结果,输入测试集中的人脸图像,通过整个模型得到最终的分类结果。

【技术特征摘要】
1.一种基于变分级联信息瓶颈的置乱人脸识别方法,其特征在于,包括以下步骤:1)训练数据集预处理对训练数据集中的图像进行归一化操作以及置乱操作;2)模型定义与初始化定义级联信息瓶颈的变分人工神经网络,该人工神经网络结构包括变分自编码器与感知机分类器,从而构成级联信息瓶颈;对变分自编码器和感知机分类器进行权值初始化;3)数据分批次前向传播将训练数据集按分层采样分成多个子集,每个子集先进入变分自编码器进行编码得到流形同胚下的低维流形特征,再将流形特征输入到感知机分类器进行训练;4)损失函数计算计算变分自编码器的损失函数值;将低维压缩特征传入感知机分类器,将特征映射至标签空间;利用标签和感知机分类器计算交叉熵损失函数值,与变分损失加权求和得到损失函数值;5)反向传播计算梯度和更新权值利用得到的损失函数值,对变分自编码器和感知机分类器进行反向传播得到对应模型中权值的梯度,再通过梯度下降更新模型的权值;6)迭代训练,将步骤3)到步骤5)重复执行直到整个模型收敛;7)测试模型结果,输入测试集中的人脸图像,通过整个模型得到最终的分类结果。2.根据权利要求1所述的一种基于变分级联信息瓶颈的置乱人脸识别方法,其特征在于:在步骤1)中,所述训练数据集预处理包括以下步骤:2.1)对图像的RBG三个通道进行规范化映射至[-1,1]范围;2.2)原始图片上的像素位置记为二维坐标图像进行置乱操作后的像素位置记为图像大小为M×M,进行三种置乱操作,第一种Anorld置乱为第二种Fabonacci置乱第三种为Hilbert置乱为3.根据权利要求1所述的一种基于变分级联信息瓶颈的置乱人脸识别方法,其特征在于:在步骤2)中,对于模型定义与初始化,定义级联信息瓶颈的变分人工神经网络,包括变分自编码器f(·|Wf,bf)与感知机分类器g(·|Wg),变分自编码器有L层对应L个权值矩阵其中Wfl表示第l层的权值矩阵,WfL表示最后一层的权值矩阵,偏置项表示第l层偏置项,表示最后一层偏置项;对变分自编码器的每一层权值和感知机分类器权值Wg进行初始化,如公式(1)所示:其中,ω是维度与每层的权重大小一致的矩阵,对于第i行j列元素ωij,有ωij采样自标准正态分布,Din为每层网络的输入维度,第l层偏置项服从均值为0标准差为0.01的正态分布。4.根据权利要求1所述的一种基于变分级联信息瓶颈的置乱人脸识别方法,其特征在于:在步骤3)中,所述数据分批次前向传播,包括以下步骤:3.1)将原始数据集按类别进行分层采样分成每份64个样本大小的子集x=(x1,x2,...,xi,...,xN),其中N为子集的个数,xi表示第i个数据子集;3.2)将每个子集放入变分自编码器前向传播,得到:αi=f(xi|Wf,bf)(2)其中,f(xi|Wf,bf)表示在权值为Wf和偏置为bf的...

【专利技术属性】
技术研发人员:沃焱林志勇韩国强
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1