一种防干扰声纹识别方法和系统技术方案

技术编号:15865540 阅读:28 留言:0更新日期:2017-07-23 13:16
本发明专利技术公开了一种防干扰声纹识别方法和系统,包括,对获取的语音片段中的语音的声音强度进行分析,将声音强度在一预设阈值下的语音进行丢弃;获取每个未识别声纹中的未识别声纹特征,未识别声纹特征中至少包括未识别声纹的小波元素;至少分别根据每个未识别声纹特征与声纹识别模型中的标准声纹特征处理得到对应于每个未识别声纹的辨别度;分别判断每个辨别度是否大于一预设的标准阈值,并保留辨别度大于标准阈值的未识别声纹;于被保留的未识别声纹中,选择辨别度最大的未识别声纹并识别为被锁定声纹;其技术方案的有益效果在于,提高了声纹识别的精度以及识别的稳定性,克服了现有技术中外界噪声容易对声纹识别造成干扰的缺陷。

【技术实现步骤摘要】
一种防干扰声纹识别方法和系统
本专利技术涉及声纹识别
,具体而言,涉及一种防干扰声纹识别方法和系统。
技术介绍
随着电子智能设备被广泛的使用,较多的智能设备中开始集成语音控制的功能,对于语音控制而言,声纹识别因为具有唯一性并且不易伪造从而被开发者所注意,声纹识别具体其包括两类,分别是:1)说话人辨认(SpeakerIdentification)和2)说话人确认(SpeakerVerification)。前者用以判断某段语音是若干人中的哪一个所说的;而后者用以确认某段语音是否是指定的某个人所说的。在不同的应用环境中可能会使用到不同的声纹识别技术或者不同技术的结合。然而,不可否认的是声纹识别还不够完善,比如同一个人的环境中,存在的外部干扰源太多,如噪音,或者混合着多个人的语音,这样存在着声纹识别收到干扰,无论在识别的精度或者识别的效率上都给使用者带来了不好的使用体验。
技术实现思路
根据现有技术中存在的上述问题,现提供一种防干扰声纹识别方法及系统的技术方案,具体包括:一种防干扰声纹识别方法,其中,包括:对获取的语音片段中的语音的声音强度进行分析,将所述声音强度在一预设阈值下的语音进行丢弃;获取每个未识别声纹中的未识别声纹特征,其中,所述未识别声纹特征中至少包括所述未识别声纹的小波元素;至少分别根据每个所述未识别声纹特征与声纹识别模型中的标准声纹特征处理得到对应于每个所述未识别声纹的辨别度;分别判断每个所述辨别度是否大于一预设的标准阈值,并保留所述辨别度大于所述标准阈值的所述未识别声纹;于被保留的所述未识别声纹中,选择所述辨别度最大的所述未识别声纹并识别为被锁定声纹;所述小波元素包括实小波元素和/或复小波元素,其中,所述获取未识别声纹中的未识别声纹特征包括:检测所述未识别声纹中的浊音区间;在每个所述浊音区间中检测基音区间,并在每个所述基音区间中获取所述声纹特征的所述实小波元素和/或所述复小波元素。优选的,该防干扰声纹识别方法,其中,在所述提取未识别声纹中的未识别声纹特征之前,还包括:在对声音强度在一预设阈值下的语音丢弃之后,在保留的语音中提取所述未识别声纹;至少根据所述未识别声纹特征中的未识别声纹特征向量调整预先构建的标准识别模型中与所述未识别声纹特征向量对应的声纹特征向量参数,优选的,该防干扰声纹识别方法,其中,所述未识别声纹特征中包括多个所述未识别声纹特征向量,所述标准声纹特征中包括多个所述标准声纹特征向量,其中,所述至少根据所述未识别声纹特征与声纹识别模型中的标准声纹特征处理得到所述未识别声纹的辨别度包括:处理得到所述未识别声纹特征中的每个所述未识别声纹特征向量与所述标准声纹特征中每个与所述未识别声纹特征向量相对应的所述标准声纹特征向量的向量距离;根据处理得到的多个所述向量距离处理得到所述未识别声纹特征与所述标准声纹特征的目标距离;至少利用所述未识别声纹特征与所述标准声纹特征的所述目标距离处理得到所述未识别声纹的辨别度。优选的,该防干扰声纹识别方法,其中,在采集所述未识别声纹之前,还包括:采集多个声纹并获取所述多个声纹中每个声纹的背景声纹特征,以构建多个与所述声纹相对应的背景识别模型,其中,所述背景声纹特征中包括多个背景声纹特征向量;根据所述背景识别模型构建所述标准识别模型。优选的,该防干扰声纹识别方法,其中,所述至少利用所述未识别声纹特征与所述标准声纹特征的距离处理得到所述未识别声纹的辨别度包括:处理得到所述未识别声纹特征分别与多个所述背景识别模型对应的每个所述声纹的所述背景声纹特征的背景距离;根据多个所述背景距离处理得到距离平均值及距离标准差;处理得到所述未识别声纹特征与所述标准声纹特征的所述目标距离与所述距离平均值的差值;处理得到所述差值与所述距离标准差的比值,将所述比值作为所述未识别声纹的所述辨别度。优选的,该防干扰声纹识别方法,其中,所述在每个所述基音区间中获取所述声纹特征的所述实小波元素和/或所述复小波元素包括:在每个所述基音区间中获取预定的特征向量,并根据小波滤波器将多个所述基音区间中的所述特征向量划分为预定长度的样本向量,并将所述预定长度的样本向量归一化;对归一化后的所述预定长度的样本向量执行以下至少一种小波变换:对归一化后的所述预定长度的样本向量进行实小波变换,以得到第一预定频带的实部系数,并在所述第一预定频带中选择满足第一预定条件的频带进行采样,以得到所述未识别声纹特征中的所述实小波元素;对归一化后的所述预定长度的样本向量进行双树复小波变换,以得到第二预定频带的实部系数和虚部系数,并在所述第二预定频带中选择满足第二预定条件的频带进行采样,以得到所述未识别声纹特征中的所述复小波元素。优选的,该防干扰声纹识别方法,其中,在检测所述未识别声纹中的浊音区间之后,所述获取未识别声纹中的未识别声纹特征还包括:获取所述未识别声纹中每一帧的梅尔倒谱系数,以得到所述未识别声纹特征中的所述梅尔倒谱系数特征;根据所述梅尔倒谱系数处理得到所述未识别声纹中每一帧的差分梅尔倒谱系数特征,以得到所述未识别声纹特征中的所述差分梅尔倒谱系数特征。一种防干扰声纹识别系统,包括:第一采集单元,用于采集语音片段;分析单元,于所述第一采集单元连接,用于对所述语音片段中的多个语音的的声音强度进行分析,并对应获取每个语音对应的声音强度;第一判断单元,与所述分析单元连接将每个语音的声音强度与一预设阈值进行比较,并输出判断结果;第一处理单元,与所述判断单元连接,用于根据所述判断结果,将声音强度在所述预设阈值下的语音进行丢弃;第一获取单元,与所述第一处理单元连接,用于获取未识别声纹中的未识别声纹特征,其中,所述未识别声纹特征中至少包括所述未识别声纹的小波元素;处理单元,连接所述获取单元,用于至少根据所述未识别声纹特征与声纹识别模型中的标准声纹特征处理所述未识别声纹的辨别度;判断单元,连接所述处理单元,用于判断所述辨别度是否大于一预设的标准阈值,并保留所述辨别度大于所述标准阈值的所述未识别声纹;识别单元,连接所述判断单元,用于在所述被保留的未识别声纹中选择所述辨别度最高的所述未识别声纹,并识别为被锁定声纹;所述小波元素包括实小波元素和/或复小波元素,所述第一获取单元包括:检测模块,用于检测所述未识别声纹中的浊音区间;第一获取模块,连接所述检测模块,用于在每个所述浊音区间中检测基音区间,并在每个所述基音区间中获取所述声纹特征的所述实小波元素和/或所述复小波元素。优选的,该防干扰声纹识别系统,,还包括:第二获取单元,用于在获取所述未识别声纹中的未识别声纹特征之前,采集所述未识别声纹;调整单元,连接所述第二获取单元,用于至少根据所述未识别声纹特征中的未识别声纹特征向量调整预先构建的标准识别模型中与所述未识别声纹特征向量对应的声纹特征向量参数,以构造出与所述未识别声纹相适应的所述声纹识别模型中的所述标准声纹特征中的标准声纹特征向量。优选的,该防干扰声纹识别系统,,所述未识别声纹特征中包括多个所述未识别声纹特征向量,所述标准声纹特征中包括多个所述标准声纹特征向量,所述处理单元包括:第一处理模块,用于处理得到所述未识别声纹特征中的每个所述未识别声纹特征向量与所述标准声纹特征中每个与所述未识别声纹特征向量相对应的所述标准本文档来自技高网...
一种防干扰声纹识别方法和系统

【技术保护点】
一种防干扰声纹识别方法,其特征在于,包括:对获取的语音片段中的语音的声音强度进行分析,将所述声音强度在一预设阈值下的语音进行丢弃;获取每个未识别声纹中的未识别声纹特征,其中,所述未识别声纹特征中至少包括所述未识别声纹的小波元素;至少分别根据每个所述未识别声纹特征与声纹识别模型中的标准声纹特征处理得到对应于每个所述未识别声纹的辨别度;分别判断每个所述辨别度是否大于一预设的标准阈值,并保留所述辨别度大于所述标准阈值的所述未识别声纹;于被保留的所述未识别声纹中,选择所述辨别度最大的所述未识别声纹并识别为被锁定声纹;所述小波元素包括实小波元素和/或复小波元素,其中,所述获取未识别声纹中的未识别声纹特征包括:检测所述未识别声纹中的浊音区间;在每个所述浊音区间中检测基音区间,并在每个所述基音区间中获取所述声纹特征的所述实小波元素和/或所述复小波元素。

【技术特征摘要】
1.一种防干扰声纹识别方法,其特征在于,包括:对获取的语音片段中的语音的声音强度进行分析,将所述声音强度在一预设阈值下的语音进行丢弃;获取每个未识别声纹中的未识别声纹特征,其中,所述未识别声纹特征中至少包括所述未识别声纹的小波元素;至少分别根据每个所述未识别声纹特征与声纹识别模型中的标准声纹特征处理得到对应于每个所述未识别声纹的辨别度;分别判断每个所述辨别度是否大于一预设的标准阈值,并保留所述辨别度大于所述标准阈值的所述未识别声纹;于被保留的所述未识别声纹中,选择所述辨别度最大的所述未识别声纹并识别为被锁定声纹;所述小波元素包括实小波元素和/或复小波元素,其中,所述获取未识别声纹中的未识别声纹特征包括:检测所述未识别声纹中的浊音区间;在每个所述浊音区间中检测基音区间,并在每个所述基音区间中获取所述声纹特征的所述实小波元素和/或所述复小波元素。2.根据权利要求1所述的防干扰声纹识别方法,其特征在于,在所述提取未识别声纹中的未识别声纹特征之前,还包括:在对声音强度在一预设阈值下的语音丢弃之后,在保留的语音中提取所述未识别声纹;至少根据所述未识别声纹特征中的未识别声纹特征向量调整预先构建的标准识别模型中与所述未识别声纹特征向量对应的声纹特征向量参数,以构造出与所述未识别声纹相适应的所述声纹识别模型中的所述标准声纹特征中的标准声纹特征向量。3.根据权利要求2所述的防干扰声纹识别方法,其特征在于,所述未识别声纹特征中包括多个所述未识别声纹特征向量,所述标准声纹特征中包括多个所述标准声纹特征向量,其中,所述至少根据所述未识别声纹特征与声纹识别模型中的标准声纹特征处理得到所述未识别声纹的辨别度包括:处理得到所述未识别声纹特征中的每个所述未识别声纹特征向量与所述标准声纹特征中每个与所述未识别声纹特征向量相对应的所述标准声纹特征向量的向量距离;根据处理得到的多个所述向量距离处理得到所述未识别声纹特征与所述标准声纹特征的目标距离;至少利用所述未识别声纹特征与所述标准声纹特征的所述目标距离处理得到所述未识别声纹的辨别度。4.根据权利要求3所述的防干扰声纹识别方法,其特征在于,在采集所述未识别声纹之前,还包括:采集多个声纹并获取所述多个声纹中每个声纹的背景声纹特征,以构建多个与所述声纹相对应的背景识别模型,其中,所述背景声纹特征中包括多个背景声纹特征向量;根据所述背景识别模型构建所述标准识别模型。5.根据权利要求4所述的防干扰声纹识别方法,其特征在于,所述至少利用所述未识别声纹特征与所述标准声纹特征的距离处理得到所述未识别声纹的辨别度包括:处理得到所述未识别声纹特征分别与多个所述背景识别模型对应的每个所述声纹的所述背景声纹特征的背景距离;根据多个所述背景距离处理得到距离平均值及距离标准差;处理得到所述未识别声纹特征与所述标准声纹特征的所述目标距离与所述距离平均值的差值;处理得到所述差值与所述距离标准差的比值,将所述比值作为所述未识别声纹的所述辨别度。6.根据权利要求1所述的防干扰声纹识别方法,其特征在于,所述在每个所述基音区间中获取所述声纹特征的所述实小波元素和/或所述复小波元素包括:在每个所述基音区间中获取预定的特征向量,并根据小波滤波器将多个所述基音区间中的所述特征向量划分为预定长度的样本向量,并将所述预定长度的样本向量归一化;对归一化后的所述预定长度的样本向量执行以下至少一种小波变换:对归一化后的所述预定长度的样本向量进行实小波变换,以得到第一预定频带的实部系数,并在所述第一预定频带中选择满足第一预定条件的频带进行采样,以得到所述未识别声纹特征中的所述实小波元素;对归一化后的所述预定长度的样本向量进行双树复小波变换,以得到第二预定频带的实部系数和虚部系数,并在所述第二预定频带中选择满足第二预定条件的频带进行采样,以得到所述未识别声纹特征中的所述复小波元素。7.根据权利要求6所述的防干扰声纹识别方法,其特征在于,在检测所述未识别声纹中的浊音区间之后,所述获取未识别声纹中的未识别声纹特征还包括:获取所述未识别声纹中每一帧的梅尔倒谱系数,以得到所述未识别声纹特征中的所述梅尔倒谱系数特征;根据所述梅尔倒谱系数处理得到所述未识别声纹中每一帧的差分梅尔倒谱系数特征,以得到所述未识别声纹特征中的所述差分梅尔倒谱系数特征。8.一种防干扰声纹识别系统,其特征在于,包括:第一采集单元,用于采集语音片段;分析单元,于所述第一采集单元连接,用于对所述语音片段中的多个语音的的声音强度进行分析,并对应获取每个语音对应的声音强度;第一判断单元,与所述分析单元连接将每个语音的声音强度与一预设阈值进行比较,并输出判断结果;第一处理单元,与所述判断单元连接,用于根据所述判断...

【专利技术属性】
技术研发人员:祝铭明
申请(专利权)人:芋头科技杭州有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1