一种跨场景声纹比对方法、装置、设备及存储介质制造方法及图纸

技术编号:25602507 阅读:48 留言:0更新日期:2020-09-11 23:59
本申请提供了一种跨场景声纹对比方法、装置、设备及存储介质,其中,跨场景声纹对比方法方法包括:获取两条语音,其中,两条语音中的其中一条语音属于第一场景,另一条语音属于与第一场景不同的第二场景;将两条语音处理为同一编码格式的语音,获得具有相同编码格式的两条语音;将具有相同编码格式的两条语音中的其中一条语音处理成与另一条语音的信道信息一致的语音,获得信道信息一致的两条语音;分别对信道信息一致的两条语音提取声纹特征,并对提取的声纹特征进行比对。本申请可对不同场景中的两条语音进行声纹比对,且可获得较好的声纹比对效果。

【技术实现步骤摘要】
一种跨场景声纹比对方法、装置、设备及存储介质
本申请涉及声纹
,尤其涉及一种跨场景声纹比对方法、装置、设备及存储介质。
技术介绍
近年来,随着声纹技术的发展,越来越多的场景中用到了声纹比对,比如,金融领域的身份验证场景、家居领域的身份验证场景等。所谓声纹比对,指的是将两条语音的声纹特征进行比对,进一步的,可以根据比对结果确定两条语音的说话人是否为同一说话人。一般而言,应用声纹比对的每个场景都会自建声纹库,声纹库中包括了对应场景的多条注册语音和多条注册语音分别对应的声纹特征。随着各场景声纹库的规模越来越大,不同场景之间的声纹比对将发挥重要的作用,比如,在打击违法犯罪中,在仅有犯罪人在场景A的语音的情况下,可以将该场景A的语音与场景B的声纹库中的注册语音进行声纹比对,以确定犯罪人的身份等信息。目前的声纹比对方案均为针对单一场景的声纹比对方案,即,将场景A的待测语音与场景A的声纹库中的注册语音进行声纹比对,这种针对单一场景的声纹比对方案并不适于跨场景声纹比对,而如何获得效果较好的跨场景声纹比对方案是目前亟需解决的问题。<本文档来自技高网...

【技术保护点】
1.一种跨场景声纹对比方法,其特征在于,包括:/n获取两条语音,其中,所述两条语音中的其中一条语音属于第一场景,另一条语音属于与所述第一场景不同的第二场景;/n将所述两条语音处理为同一编码格式的语音,获得具有相同编码格式的两条语音;/n将所述具有相同编码格式的两条语音中的其中一条语音处理成与另一条语音的信道信息一致的语音,获得信道信息一致的两条语音;/n对所述信道信息一致的两条语音分别提取声纹特征,并对提取的声纹特征进行比对。/n

【技术特征摘要】
1.一种跨场景声纹对比方法,其特征在于,包括:
获取两条语音,其中,所述两条语音中的其中一条语音属于第一场景,另一条语音属于与所述第一场景不同的第二场景;
将所述两条语音处理为同一编码格式的语音,获得具有相同编码格式的两条语音;
将所述具有相同编码格式的两条语音中的其中一条语音处理成与另一条语音的信道信息一致的语音,获得信道信息一致的两条语音;
对所述信道信息一致的两条语音分别提取声纹特征,并对提取的声纹特征进行比对。


2.根据权利要求1所述的跨场景声纹对比方法,其特征在于,所述将所述两条语音处理为同一编码格式的语音,包括:
将所述两条语音处理成具有相同采样率、相同量化比特数、相同编码方式的语音,其中,处理后语音的采样率为所述两条语音的采样率中的最大采样率。


3.根据权利要求1所述的跨场景声纹对比方法,其特征在于,还包括:
检测所述具有相同编码格式的两条语音中的至少一条语音是否满足质量要求;
若满足,则执行所述将所述具有相同编码格式两条语音中的其中一条语音处理成与另一条语音的信道信息一致的语音。


4.根据权利要求3所述的跨场景声纹对比方法,其特征在于,检测一条语音是否满足质量要求,包括:
获取该语音的质量表征指标,其中,所述质量表征指标包括有效时长、信噪比、截幅比、语音归一化平均能量中的一个或多个;
根据所述质量表征指标和所述质量表征指标对应的质量检测阈值,确定该语音是否满足质量要求。


5.根据权利要求4所述的跨场景声纹对比方法,其特征在于,所述信噪比、所述截幅比和所述语音归一化平均能量对应同一质量检测阈值;
确定所述信噪比、所述截幅比和所述语音归一化平均能量对应的质量检测阈值的过程包括:
获取质量检测集合中每条语音的信噪比、截幅比和语音归一化平均能量,其中,所述质量检测集合由该语音所属场景对应的声纹库中的语音组成;
确定所述质量检测集合中所有优质语音的信噪比均值、截幅比均值和语音归一化平均能量均值,并确定所述质量检测集合中所有非优质语音的信噪比均值、截幅比均值和语音归一化平均能量均值;
根据所述质量检测集合中所有优质语音的信噪比均值、截幅比均值和语音归一化平均能量均值确定第一阈值,并根据所述质量检测集合中所有非优质语音的信噪比均值、截幅比均值和语音归一化平均能量均值确定第二阈值;
根据所述第一阈值和所述第二阈值,确定所述信噪比、所述截幅比和所述语音归一化平均能量对应的质量检测阈值。


6.根据权利要求1所述的跨场景声纹对比方法,其特征在于,所述将所述具有相同编码格式的两条语音中的其中一条语音处理成与另一条语音的信道信息一致的语音,包括:
获取所述具有相同编码格式的两条语音中第一语音的信道信息,并根据所述第一语音的信道信息生成所述第一语音对应的信道模型;
利用所述第一语音对应的信道模型,将所述具有相同编码格式的两条语音中的第二语音处理成与所述第一语音的信道信息一致的语音。


7.根据权利要求6所述的跨场景声纹对比方法,其特征在于,所述获取所述具有相同编码格式的两条语音中第一语音...

【专利技术属性】
技术研发人员:钟奥王建社冯祥
申请(专利权)人:讯飞智元信息科技有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1