【技术实现步骤摘要】
一种用于车辆自动滑移门的声纹身份验证方法
[0001]本专利技术属于声纹识别
,特别涉及一种用于车辆自动滑移门的声纹身份验证方法。
技术介绍
[0002]声纹识别是人机交互中身份验证的一种快捷高效的方式,在日常生活中广泛应用于信息安全、金融安全、司法鉴定、电话银行、数据库访问、信息服务、安全控制等领域。使用声纹进行身份认证易用性强,采样简单且接受度广。将声纹识别应用于更复杂和多样化的场景中是当前热门的发展态势。随着汽车电子技术的不断发展,智能化控制场景越来越丰富,为消费者带来了方便快捷的驾乘体验,但更具安全性、便捷性、智能化的解锁控制方式还有待进一步挖掘。目前声纹解锁应用在汽车上面临的最大挑战在于应用场景环境噪音复杂多变,影响模型识别效果。
技术实现思路
[0003]本专利技术提供了一种用于车辆自动滑移门的声纹身份验证方法,用于解决现有声纹验证系统中声纹识别模型特征提取性能不强、噪声鲁棒性差等技术问题。
[0004]本专利技术采取的技术方案包括如下步骤:
[0005]步骤1:搭建基于改进ECAPA
‑
TDNN的声纹识别网络模型。
[0006]步骤2:使用大规模数据集进行训练并测试。
[0007]步骤3:注册阶段。声纹识别模型对车主授权的录入语音进行处理,并保存说话人声纹嵌入码。
[0008]步骤4:验证阶段。在车外拾音系统激活时,录入被测说话人语音并处理,将得到的声纹嵌入码与步骤3中已注册的声纹嵌入码进行相似度匹配,若判定为同一说话人,则 ...
【技术保护点】
【技术特征摘要】
1.一种用于车辆自动滑移门的声纹身份验证方法,其特征在于,包括以下步骤:步骤1:搭建基于改进ECAPA
‑
TDNN的声纹识别网络模型。步骤2:使用大规模数据集进行训练并测试。步骤3:注册阶段。声纹识别模型对车主授权的录入语音进行处理,并保存说话人声纹嵌入码。步骤4:验证阶段。在车外拾音系统激活时,录入被测说话人语音并处理,将得到的声纹嵌入码与步骤3中已注册的声纹嵌入码进行相似度匹配,若判定为同一说话人,则控制门锁有刷电机驱动输出模块执行开锁动作。2.根据权利要求1所述的声纹验证系统设计方法,其特征在于,在步骤1中,还包括:步骤1
‑
1:对于输入网络的语音Fbank特征,其向量维度为M
×
T,其中M为特征维度,T为语音段时长。步骤1
‑
2:使用卷积核分别为3、4、5的TDNN网络对步骤1
‑
1所述Fbank特征进行一维卷积。可选的,生成通道数为512的3个特征向量,对所得特征再分别进行一次卷积核为3的一维卷积,输出特征维度为3
×
512
×
T,对三个特征在通道维度拼接,得到特征维度为1536
×
T。步骤1
‑
3:将前一步所得特征输入SE
‑
Res2Net单元中,输出特征维度为1024
×
T。所述SE
‑
Res2Net单元的主体是由Conv1d+ReLU+BN、Res2Net模块和基于通道注意力机制的挤压激励(SE)模块组成。所述Res2Net模块将输入特征映射按通道维度均匀切分为s个子集,记为x
i
,其中i∈{1,2,
…
,s}。x1不做处理直接映射到y1上,其余每个x
i
分别经过不同的3
×
3卷积核K
i
。从i=3开始,将x
i
与K
i
‑1(x
i
‑1)相加输入K
i
。输出y
i
可以表示为:所述SE模块首先进行压缩操作,为每一个通道生成一个描述符,得到一个帧级特征的均值向量z,表达式为:式中h
t
表示每个特征的embedding向量。然后进行激励操作,使用z中的描述符来计算每个通道的权重,即:s=σ(W2f(W1z+b1)+b2)式中σ(
·
)为softmax激活函数,f(
·
)为ReLU激活函数,W1∈R
R
×
C
,W2∈R
C
×
R
,C为通道数,R为降维数。b1,b2为偏移量。向量s包含介于0和1之间的权值s
c
,这些权重通过乘法作用于之前的特征矩阵h
c
上,可得到通道加权的特征输出为:步骤1
‑
4:再重复步骤1<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。