一种嘈杂环境下鲁棒的声纹消杂和识别系统及装置制造方法及图纸

技术编号:41404019 阅读:14 留言:0更新日期:2024-05-20 19:29
本发明专利技术涉及语音信号处理技术领域,具体而言,涉及一种嘈杂环境下鲁棒的声纹消杂系统,包括:d‑vector模块和噪声音频频谱图,所述d‑vector模块输入端连接输入目标说话人语音增强网络,所述噪声音频频谱图输入端输入经第一短时傅里叶变换处理的噪声音频,且所述d‑vector模块和所述噪声音频频谱图输出端连接可训练的语音过滤器,所述可训练的语音过滤器输出的语音通过软掩蔽预模块和逆向短时傅里叶变换处理后得到增强音频。通过设备的整体结构,创造性的提出了先进行语音增强,消除背景的各种噪声和干扰人声,然后再通过基于深度学习的声纹识别系统进行声纹识别,大大提高了声纹识别在背景嘈杂时的系统鲁棒性,且大大提高声纹在嘈杂环境的声纹识别准确率。

【技术实现步骤摘要】

本专利技术涉及语音信号处理,具体而言,涉及一种嘈杂环境下鲁棒的声纹消杂和识别系统及装置


技术介绍

1、在实际生活中,因为人的发声器官实际上存在着大小、形态及功能上的差异。发声控制器官包括声带、软颚、舌头、牙齿、唇等;发声共鸣器包括咽腔、口腔、鼻腔。这些器官的微小差异都会导致发声气流的改变,造成音质、音色的差别,从而导致每个人说话都有自己的特点,同时,一般人成年后,人的说话特点会是长期相对稳定不变,可以说每个人有自己独无二的声纹信息,像指纹一样可以用来代表自己的身份。随着移动互联网的兴起,多数银行与用户的直接接触大大减少,随着大量业务线上化的普及,线上化、智能化、不得接触办理业务也暴露出更多的业务办理风险。身份冒用、盗用也层出不穷,给广大不能前往网点办理相关业务的人民群众带来不少的损失:冒名办理贷款或开通资金往来业务、盗用他人人脸等信息诈骗、小朋友以完成作业名义通过人脸识别转走余额用于购买游戏装备等。因此利用用户自身生物特征来确定其合法身份的方法开始得到主管部门和基层群的广泛关注,声纹识别技术就是生物识别技术中的一种,如何将声纹识别技术高效合理的应用于金融本文档来自技高网...

【技术保护点】

1.一种嘈杂环境下鲁棒的声纹消杂系统,其特征在于,包括:

2.根据权利要求1所述的一种嘈杂环境下鲁棒的声纹消杂系统,其特征在于:所述可训练的语音过滤器包括卷积神经网络、长短期记忆网络和神经网络,所述卷积神经网络、长短期记忆网络和神经网络依次相连。

3.根据权利要求1所述的一种嘈杂环境下鲁棒的声纹消杂系统,其特征在于:所述目标说话人语音增强网络输入参考音频。

4.根据权利要求1所述的一种嘈杂环境下鲁棒的声纹消杂系统,其特征在于:所述训练期间计算模块包括第二短时傅里叶变换、干净音频频谱图和损失函数,所述第二短时傅里叶变换、干净音频频谱图和损失函数依次相互连...

【技术特征摘要】

1.一种嘈杂环境下鲁棒的声纹消杂系统,其特征在于,包括:

2.根据权利要求1所述的一种嘈杂环境下鲁棒的声纹消杂系统,其特征在于:所述可训练的语音过滤器包括卷积神经网络、长短期记忆网络和神经网络,所述卷积神经网络、长短期记忆网络和神经网络依次相连。

3.根据权利要求1所述的一种嘈杂环境下鲁棒的声纹消杂系统,其特征在于:所述目标说话人语音增强网络输入参考音频。

4.根据权利要求1所述的一种嘈杂环境下鲁棒的声纹消杂系统,其特征在于:所述训练期间计算模块包括第二短时傅里叶变换、干净音频频谱图和损失函数,所述第二短时傅里叶变换、干净音频频谱图和损失函数依次相互连接,所述第二短时傅里叶变换输入端输入干...

【专利技术属性】
技术研发人员:蒋世豪
申请(专利权)人:杭州屋屋科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1