【技术实现步骤摘要】
一种双模态身份认证方法、装置以及存储介质
[0001]本专利技术主要涉及图像处理
,具体涉及一种双模态身份认证方法、装置以及存储介质。
技术介绍
[0002]虽然现有的人脸识别和语音识别技术已经非常成熟。但这类单模态的身份认证技术还是存在很多限制,比如人脸识别时容易受遮挡、角度、光照、姿态变化等影响,语音识别容易受周围环境噪声以及本人身体条件变化的影响,从而导致这些单模态身份认证技术在一些特定场景下识别效果还不够好。更具挑战性的是,现如今有许多针对人脸识别或声纹识别的欺骗干扰手段,一般的单模态身份认证方法又往往难以抵档住某些特殊攻击,一旦被非法分子攻击或假冒,容易对人们的生命财产安全造成严重损失。
技术实现思路
[0003]本专利技术所要解决的技术问题是针对现有技术的不足,提供一种双模态身份认证方法、装置以及存储介质。
[0004]本专利技术解决上述技术问题的技术方案如下:一种双模态身份认证方法,包括如下步骤:
[0005]S1:导入多个训练数据,各个所述训练数据均包括人脸图像和语音数据;
[0006]S2:分别对各个所述训练数据中的人脸图像进行图片特征分析,得到人脸特征向量;
[0007]S3:分别对各个所述训练数据中语音数据进行语音特征分析,得到声纹特征向量;
[0008]S4:构建训练模型,根据所有的所述人脸特征向量和所有的所述声纹特征向量对所述训练模型进行训练,得到双模态身份认证模型;
[0009]S5:导入待认证数据,所述待认证数据包括待 ...
【技术保护点】
【技术特征摘要】
1.一种双模态身份认证方法,其特征在于,包括如下步骤:S1:导入多个训练数据,各个所述训练数据均包括人脸图像和语音数据;S2:分别对各个所述训练数据中的人脸图像进行图片特征分析,得到人脸特征向量;S3:分别对各个所述训练数据中的语音数据进行语音特征分析,得到声纹特征向量;S4:构建训练模型,根据所有的所述人脸特征向量和所有的所述声纹特征向量对所述训练模型进行训练,得到双模态身份认证模型;S5:导入待认证数据,所述待认证数据包括待测人脸图像和待测语音数据,并通过所述双模态身份认证模型对所述待测人脸图像和所述待测语音数据进行身份认证,得到身份认证结果。2.根据权利要求1所述的双模态身份认证方法,其特征在于,所述步骤S2过程包括:基于MTCNN模型分别对各个所述训练数据中的人脸图像进行人脸检测,得到与各个所述人脸图像对应的检测后人脸图片;基于FaceNet模型分别对各个所述检测后人脸图片进行图片的特征提取,得到与各个所述人脸图像对应的人脸特征向量。3.根据权利要求2所述的双模态身份认证方法,其特征在于,所述步骤S3的过程包括:分别对各个所述训练数据中的语音数据进行预处理,得到与各个所述人脸图像对应的处理后语音数据;基于x
‑
vector模型分别对各个所述处理后语音数据进行语音特征提取,得到与各个所述人脸图像对应的声纹特征向量。4.根据权利要求3所述的双模态身份认证方法,其特征在于,所述步骤S4的过程包括:S41:构建训练模型,分别对各个所述人脸特征向量以及与各个所述人脸图像对应的声纹特征向量进行融合分析,得到与各个所述人脸图像对应的全局特征向量;S42:分别对各个所述全局特征向量进行归一化处理,得到与各个所述人脸图像对应的预测值;S43:导入与各个所述人脸图像对应的图片真实值,并分别计算各个所述预测值以及与各个所述人脸图像对应的图片真实值的损失值,得到与各个所述人脸图像对应的损失值;S44:利用反向传播机制算法、梯度下降算法以及多个所述损失值对所述训练模型进行参数更新,并返回步骤S1,直至达到预设迭代次数,最终得到双模态身份认证模型。5.根据权利要求4所述的双模态身份认证方法,其特征在于,所述S41中,分别对各个所述人脸特征向量以及与各个所述人脸图像对应的声纹特征向量进行融合分析,得到与各个所述人脸图像对应的全局特征向量的过程包括:通过第一式分别对各个所述人脸特征向量进行人脸隐特征向量的计算,得到与各个所述人脸图像对应的人脸隐特征向量,所述第一式为:h
f
=tanh(w
f
e
f
+b
f
),其中,为人脸隐特征向量,tanh为tanh激活函数,为对人脸特征向量e
f
进行变换的可学习的权重矩阵,b
f
为人脸隐特征向量e
f
的偏置项,e
f
为人脸特征向量;通过第二式分别对各个所述声纹特征向量进行声纹隐特征向量的计算,得到与各个所述人脸图像对应的声纹隐特征向量,所述第二式为:
h
v
=tanh(w
v
e
v
+b
v
),...
【专利技术属性】
技术研发人员:蔡晓东,周青松,
申请(专利权)人:桂林远望智能通信科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。