【技术实现步骤摘要】
基于F
‑
ratio自适应掩蔽的声纹识别系统对抗防御方法及系统
[0001]本专利技术属于生物识别安全
,涉及一种声纹识别系统对抗防御方法及系统,特别涉及一种基于
F
‑
ratio
自适应掩蔽的声纹识别系统对抗防御方法及系统
。
技术背景
[0002]声纹识别系统,即说话人识别系统
(SRS)
,作为一种生物特征认证方法和一种从语音中识别特定说话人的自动化技术,已被商业产品
(
如
Microsoft Azure
和
Amazon Alexa)
采用在银行身份验证
、
取证测试和智能设备个性化服务中
。
然而,对抗性攻击的出现严重威胁着
SRSs
的安全
。
攻击者可以通过在干净的语音中引入难以察觉的扰动来使
SRS
错误分类,从而伪装成
SRS
信任的合法注册人
。
[0003]为了抵御对抗攻击,研究人员为
SRS
开发了各种对抗性防御
。
这些防御可以分为三类:对抗训练
、
随机平滑和输入重构
。
对抗训练以对抗样本作为增强数据重新训练分类器;随机平滑防御应用高斯噪声作为数据增强来微调分类器并使用它来构建软分类器;输入重构防御创建了一个单独的辅助模块,可以净化或破坏对抗性噪声
。
在现实应用需求下 ...
【技术保护点】
【技术特征摘要】
1.
一种基于
F
‑
ratio
自适应掩蔽的声纹识别系统对抗防御方法,其特征在于,包括以下步骤:步骤1:对输入语音进行特征提取,生成一个维度为
[
频带
×
时长
]
的矩阵,记为幅度谱图;步骤2:对幅度谱图进行去噪得到去噪幅度谱图;步骤3:使用
F
‑
ratio
统计去噪幅度谱图中用以区分说话人的高相关频带集合和低相关频带集合;步骤4:分别计算高说话人相关频带和低说话人相关频带的掩蔽阈值;步骤5:对于高说话人相关频带,幅度值小于对应频带掩蔽阈值的点,其值置为0;对于低说话人相关频带,幅度值小于对应频带掩蔽阈值的点,其值置为0,得到最终重构幅度谱图;步骤6:将重构幅度谱图利用
librosa.griffinlim
变换,得到对应波形信号作为重构语音;步骤7:使用批量干净样本进行语音重构,使用重构语音进行
SRS
微调训练,以保证
SRS
的分类性能
。2.
根据权利要求1所述的基于
F
‑
ratio
自适应掩蔽的声纹识别系统对抗防御方法,其特征在于:步骤1中,对输入语音进行短时傅里叶变化,之后求取绝对值,以进行特征提取
。3.
根据权利要求1所述的基于
F
‑
ratio
自适应掩蔽的声纹识别系统对抗防御方法,其特征在于,步骤2的具体实现包括以下子步骤:步骤
2.1
:随机生成一个与输入音频同长的高斯噪声,并将其经过短时傅里叶变化转换成高斯噪声幅度谱图;步骤
2.2
:使用幅度谱图减去高斯噪声幅度谱图得到去噪幅度谱图
。4.
根据权利要求1所述的基于
F
‑
ratio
自适应掩蔽的声纹识别系统对抗防御方法,其特征在于,步骤3的具体实现包括以下子步骤:步骤
3.1
:利用
LibriSpeech
的干净数据集,选取
M
个人,每个人选取
N
句话,计算所有音频的平均长度,将所有音频补长或修剪到统一长度;其中,
M、N
为预设值;步骤
3.2
:定义其中,代表第
i
个说话人的第
j
个幅度谱特征,
j
=
1,2,...,N
且
i
=
1,...,M
;
u
i
和
u
分别代表第
i
个说话人和全部说话人的平均特征,各变量维度
d
=
dim(Fratio)
=
dim(x)
=
dim(u)
=
[
频带
×
时长
]
=
[B
×
F]
;步骤
3.3
【专利技术属性】
技术研发人员:任延珍,孙宗锟,黄逸焕,刘武洋,朱洪承,
申请(专利权)人:武汉大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。