声音信号处理的方法技术

技术编号：39770618 阅读：8 留言：0更新日期：2023-12-22 02:21

根据本公开的实施例，提供了声音信号处理的方法

全部详细技术资料下载

【技术实现步骤摘要】
声音信号处理的方法、装置、设备、介质和程序产品

[0001]本公开的实施例主要涉及信息处理领域，并且更具体地，涉及声音信号处理的方法
、
装置
、
设备
、
计算机可读存储介质和程序产品
。

技术介绍

[0002]随着人工智能技术的普及，尤其是语音交互的发展，各种搭载语音技术的设备走进人们的生活
。
其中，能够自动识别说话人身份的声纹识别技术成为智能设备的标配之一
。
声纹识别技术即说话人语音的识别技术，该技术通过声音信号提取代表说话人身份的相关特征，例如反映声门开合频率的基频特征
、
反映口腔大小形状及声道长度的频谱特征等，进而通过语音识别用户的身份
。
[0003]声纹识别包括两个阶段，注册阶段和验证阶段
。
在注册阶段，生成与用户的身份相对应的声纹特征
。
在验证阶段，通过用户语音与声纹特征的匹配，识别出当前用户的身份
。
然而，现有声纹识别方法的识别准确率还不够理想，从而导致不佳的用户体验
。

技术实现思路

[0004]根据本公开的示例实施例，提供了一种声音信号处理的方案
。
[0005]在本公开的第一方面中，提供了一种声音信号处理的方法
。
该方法包括基于至少一个用户的注册语音生成与至少一个用户身份相关联的声纹特征模板，并将声纹特征模板存储在声纹特征库中；将从所接收的用户验证语音中提取的...

【技术保护点】

【技术特征摘要】
1.
一种声音信号处理的方法，包括：基于至少一个用户的注册语音生成与所述至少一个用户身份相关联的声纹特征模板，并将所述声纹特征模板存储在声纹特征库中；将从所接收的用户验证语音中提取的声纹特征与所述声纹特征库中的声纹特征模板进行比较，以生成比较结果，并且响应于所述比较结果为所述提取的验证声纹特征与所述声纹特征库中的某个声纹特征模板相匹配，确定所述用户验证语音所对应的用户身份为所述某个声纹特征模板所关联的用户身份；响应于所述比较结果为所述提取的验证声纹特征与所述声纹特征库中的某个声纹特征模板相匹配，将与所述用户验证语音有关的语音数据与所确定的用户身份相关联地存储；以及基于所存储的所述语音数据更新所述声纹特征库中的声纹特征模板
。2.
根据权利要求1所述的方法，其中，将从所接收的用户验证语音中提取的验证声纹特征与所述声纹特征库中的声纹特征模板进行比较包括：响应于确定所述用户验证语音中包括预定唤醒词，提取所述用户验证语音中的与所述预定唤醒词相对应的验证语音帧；利用预先训练的声纹模型，从所提取的所述验证语音帧确定验证声纹特征；以及将所述验证声纹特征与所述声纹特征库中的声纹特征模板进行比较，以确定所述验证声纹特征与所述声纹特征库中的声纹特征模板之间的匹配度
。3.
根据权利要求1所述的方法，其中，所述语音数据包括所述用户验证语音的验证声纹特征，并且其中基于所存储的所述语音数据更新所述声纹特征库中的声纹特征模板包括：响应于确定与某个用户身份相关联地存储的验证声纹特征的数目大于第一数目，从所述与某个用户身份相关联地存储的验证声纹特征中确定第二数目的验证声纹特征作为目标验证声纹特征，其中所述目标验证声纹特征与所述声纹特征库中的关联于所述用户身份的声纹特征模板之间的匹配度大于第一预定阈值；以及基于所述目标验证声纹特征，更新所述声纹特征库中的关联于所述用户身份的所述声纹特征模板
。4.
根据权利要求3所述的方法，其中，所述语音数据还包括与所述验证声纹特征关联的所述用户验证语音，其中基于所存储的所述语音数据更新所述声纹特征库中的声纹特征模板还包括：从所述语音数据中获取与所述目标验证声纹特征相对应的用户验证语音作为目标验证语音；对所述目标验证语音进行噪声增强，以获得经增强的目标验证语音；以及基于所述经增强的目标验证语音，更新所述声纹特征库中的关联于所述用户身份的所述声纹特征模板
。5.
根据权利要求1所述的方法，其中，基于至少一个用户的注册语音生成与所述至少一个用户身份相关联的声纹特征模板包括：响应于确定所述注册语音中包括预定唤醒词，提取所述注册语音中的
、
与所述预定唤醒词相对应的注册语音帧；
利用预先训练的声纹模型，从所述注册语音帧确定所述至少一个用户的注册声纹特征；从所述注册声纹特征中确定目标注册声纹特征，所述目标注册声纹特征与所述注册声纹中的目标注册声纹特征之外的所有其他注册声纹之间的匹配度之和大于第二预定阈值；以及基于所述目标注册声纹特征生成所述声纹特征库中的声纹特征模板
。6.
根据权利要求5所述的方法，其中，基于至少一个用户的注册语音生成与所述至少一个用户身份相关联的声纹特征模板还包括：将与所述目标注册声纹特征相对应的注册语音作为目标注册语音；对所述目标注册语音进行噪声增强，以获取经增强的目标注册语音；利用预先训练的声纹模型，从所述经增强的目标注册语音确定所述至少一个用户的经增强的目标注册声纹特征；以及基于所述经增强的目标注册声纹特征，生成所述声纹特征库中的声纹特征模板
。7.
根据权利要求5所述的方法，还包括：响应于确定所述目标注册声纹特征的数目小于第三数目，向所述至少一个用户发出与输入用户验证语音相关的提示
。8.
根据权利要求4或6所述的方法，其中所述噪声增强包括利用如下噪声中的至少一项：风声噪声
、
雨声噪声
、
车辆噪声
、
机运转噪声和人声噪声
。9.
根据权利要求1所述的方法，其中所述注册语音和所述用户验证语音由车辆接收，并且所述方法还包括：响应于确定所述用户验证语音所对应的用户身份为所述某个声纹特征模板所关联的用户身份，启动所述车辆的语音交互功能
。10.
一种声音信号处理的装置，包括：声纹注册模块，被配置为基于至少一个用户的注册语音生成与所述至少一个用户身份相关联的声纹特征模板，并将所述声纹特征模板存储在声纹特征库中；声纹验证模块，被配置为将从所接收的用户验证语音中提取的声纹特征与所述声纹特征库中的声纹特征模板进行比较，以生成比较结果，并且响应于所述比较结果为所述提取的验证声纹特征与所述声纹特征库中的某个声纹特征模板相匹配，确定所述用户验证语音所对应的用户身份为所述某个声纹特征模板所关联的用户身份；声纹存储模块，被配置为响应于...

【专利技术属性】
技术研发人员：喻陈毅，李通旭，龚彩霞，高永虎，
申请(专利权)人：北京嘀嘀无限科技发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人