【技术实现步骤摘要】
多层级声纹库的搭建方法、系统、设备及介质
[0001]本专利技术涉及音频处理领域,尤其涉及一种多层级声纹库的搭建方法、系统、设备及介质。
技术介绍
[0002]声纹识别,是生物识别技术的一种,也称为说话人识别,是一种通过声音判别说话人身份的技术。声纹识别技术主要分为两类:说话人辨别和说话人确认。不同的任务和应用会使用不同的声纹识别技术,如缩小刑侦范围时可使用辨认技术,而银行交易时则使用确认技术,无论哪种声纹识别技术都离不开声纹库的支持。
[0003]目前的任务和应用中多涉及1:1声纹库,但对于特定的任务需要1:N声纹库的支持。其中,1:1声纹库的搭建方法主要有两种:第一种是针对任务进行声纹采集,例如APP内的声纹注册,即注册人对手机麦克风在安静的环境下进行录音,这种采集方法需要用户的高度配合;第二种是基于已有的音频数据搭建声纹库,对于每个用户的声纹采用近期质量较高的音频进行处理后落库,用户的声音具有易变性,易受到身体状况、年龄、情绪等影响,因此需要对声纹库定时更新。1:N声纹库中,第一层标签是已知的,第二层标签未知, ...
【技术保护点】
【技术特征摘要】
1.一种多层级声纹库的搭建方法,其特征在于,所述方法包括:提取音频中的声纹数据;输入所述声纹数据至所述多层级声纹库;对所述声纹数据进行声纹匹配,得到声纹数据组;根据每个所述声纹数据组对应生成标签数据,所述标签数据包含用户名数据。2.如权利要求1所述的多层级声纹库的搭建方法,其特征在于,所述对所述声纹数据进行声纹匹配,得到声纹数据组的步骤包括:选取所述声纹数据组中的所述声纹数据组成声纹数据对;获取所述声纹数据对的相似度;对比所述相似度,若所述相似度高于预设阈值,则将所述声纹数据归为同一声纹数据组,若所述相似度低于预设阈值,则重新选取所述声纹数据组中的所述声纹数据组成声纹数据对。3.如权利要求2所述的多层级声纹库的搭建方法,其特征在于,所述对所述声纹数据进行声纹匹配,得到声纹数据组的步骤还包括:若存在所述声纹数据与任意声纹数据组成的所述声纹数据对的相似度均低于预设阈值,则新增标签数据。4.如权利要求1所述的多层级声纹库的搭建方法,其特征在于,所述方法包括:判断所述声纹数据组中的声纹数据的接收时间间隔,若接收时间间隔大于预设时间间隔,则删除所述声纹数据,并替换为第一声纹数据;所述第一声纹数据的接收时间晚于所述声纹数据的接收时间且与所述声纹数据的相似度高于预设阈值。5.一种多层级声纹库的搭建系统,其特征在于,所述系统包括:提取模块,用于提取音频中的声纹数据;输入模块,用于输入所述声纹数据至所述多层级声纹库;匹配模块,用于对所述声纹数据进行声纹匹配,得到声纹数据组;生成模块,用于根据每个所述声纹...
【专利技术属性】
技术研发人员:李亚枫,任君,罗超,邹宇,
申请(专利权)人:携程旅游信息技术上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。