一种声纹识别的认证方法技术

技术编号:15879329 阅读:60 留言:0更新日期:2017-07-25 17:20
本发明专利技术公开了一种声纹识别的认证方法,属于生物识别技术领域;方法包括:预先设置高频段的第一频段,以及低频段的第二频段,随后分别对这两个频段进行如下操作:将语音分割为多个识别区段;对每个识别区段做特征变换后得到识别特征点,并进而形成识别特征空间;将识别特征空间划分为多个子空间;根据训练语句做特征变换后得到时序特征点并分配入各个子空间中,随后根据子空间的序号形成第一序列,并进而形成训练识别特征;将标准识别特征和训练识别特征进行对比,并根据对比结果处理得到认证结果。上述技术方案的有益效果是:声纹识别的计算量较小,节省存储和计算资源,认证准确率高。

Authentication method for speaker recognition

The invention discloses an authentication method of voiceprint recognition, which belongs to the field of biological identification technology; method includes: a first frequency preset frequency, and the frequency of the second bands, two bands were as follows: after the speech recognition is divided into a plurality of segments; feature transformation to each recognition section identification of feature points, and then formed recognition feature space; the feature space is divided into multiple sub space; according to the training characteristic statement after transform sequential feature points and assigned to each sub space, then according to the number of subspaces form a first sequence, and then form the training and recognition characteristics; comparing standard recognition the characteristics of training and recognition characteristics, and according to the comparison results obtained certification results. The beneficial effects of the technical scheme is: voice recognition of the small amount of calculation, save storage and computing resources, authentication accuracy.

【技术实现步骤摘要】
一种声纹识别的认证方法
本专利技术涉及生物识别
,尤其涉及一种声纹识别的认证方法。
技术介绍
声纹识别和指纹,虹膜,人脸识别等一样,属于生物识别的一种,被认为是最自然的生物特征识别身份鉴定方式。依靠声纹识别可以很方便地对说话人的身份进行验证,并且这种验证方式的私密性非常高,因为声纹通常无法被恶意复制和盗取,因此声纹识别在各种领域尤其是智能设备领域具有突出的应用优势。声纹识别的基本过程为语音采集,特征提取,分类模型。常见的语音特征提取方法是利用语音的短时平稳特性,采用美倒谱变换方法将语音转换为识别特征集,之后经过学习过程对说话人语音进行建模得到说话人的分类模型,随后通过各类识别模型获得声纹识别的结果。但是上述过程存在以下几个问题:(1)上述声纹识别的模型需要学习更多的样本才能应用;(2)依据上述识别模型进行的声纹识别的计算的复杂度较高;(3)依据上述的识别模型计算得到的模型数据量较大;(4)由于声源在传输过程中很容易受到噪声的干扰,因此采用声纹识别技术进行认证时,很容易因噪声对识别的结果造成干扰,从而致使认证失败。综上所述,对于资源有限的智能系统而言,上述既存的问题限制了现有技术中的声纹识别算法的应用及声纹技术在认证识别中的应用。
技术实现思路
根据现有技术中存在的上述问题,现提供一种声纹识别的认证方法的技术方案,具体包括:一种声纹识别的认证方法,其中:预设一第一频段以及一第二频段,所述第一频段高于所述第二频段,并提供一预设的标准识别特征,还包括:步骤S1,将分别处于所述第一频段或者所述第二频段下的不同背景、不同人声的语音分割为特定长度的识别区段;步骤S2,对每个所述识别区段做特征变换后得到相应的多个识别特征,并采用关联于所有所述识别区段的所有所述识别特征分别构成对应所述第一频段的识别特征空间,或者对应所述第二频段的所述识别特征空间;步骤S3,将所述识别特征空间划分成复数个子空间,并以描述信息每个被划分的所述子空间,以及分别对每个所述子空间赋予一对应的序号;步骤S4,分别将处于所述第一频段或者处于所述第二频段的关联于训练模型的每条训练语句做特征变换后得到包括相应的时序特征点的时序特征点集,每个所述时序特征点分别被分配入同频段下的各个所述子空间,根据每个所述时序特征点对应的所述子空间的序号分别形成关联于所述第一频段或者所述第二频段的第一序列,并进而形成对应的训练识别特征;步骤S5,将对比关联于所述第一频段的所述训练识别特征与所述标准识别特征进行对比,以获取比较值,判断所述比较值是否大于预设的阈值,若是,则认证成功,并输出认证结果;若否,则认证失败,并输出认证结果,或者将对比关联于所述第二频段的所述训练识别特征与所述标准识别特征进行对比,以获取比较值,判断所述比较值是否大于预设的阈值,若是,则认证成功,并输出认证结果;若否,则认证失败,并输出认证结果。优选的,该声纹识别的认证方法,其中,所述步骤S4中,每个所述时序特征点按照最近邻原则被分配入各个所述子空间内。优选的,该声纹识别的认证方法,其中,所述步骤S4中,将被分配入所述时序特征点的各个所述子空间按照所述序号组成一空间序列,并将所述空间序列作为所述第一序列,以形成所述训练识别特征。优选的,该声纹识别的认证方法,其中,所述步骤S4中,所述空间序列中包括关联于每个所述子空间的数据组,一个所述数据组对应一个所述序号;在形成所述空间序列后,还包括分别对处于所述第一频段或者所述第二频段的所述空间序列进行的数据压缩的过程,具体为:步骤S41,记录每个所述数据组的所述序号,并记录关联于每个所述序号的重复序号数量;步骤S42,判断是否存在所述序号的所述重复序号数量为1,并在存在所述重复序号数量为1的所述数据组时转向步骤S43;步骤S43,删除所述重复序号数量为1的所述序号对应的所述数据组;步骤S44,判断被删除的所述数据组的前一个数据组的所述序号是否与被删除的所述数据组的后一个数据组的所述序号相同:若相同,则将所述前一个数据组和所述后一个数据组合并;若不相同,则保留所述前一个数据组和所述后一个数据组;对所述空间序列中的所有所述数据组均执行所述数据压缩后形成所述第一序列。优选的,该声纹识别的认证方法,其中:所述特征变换为美倒谱变换。优选的,该声纹识别的认证方法,其中:于执行所述美倒谱变换的过程中,分别将每条所述语句分割为20ms一帧,并将10ms的帧移取出关联于所述语句的语句帧;随后,以帧为单位去掉静音,对所述语句帧作美倒谱变换后每帧留12个系数,并以12个所述系数构成所述识别特征。优选的,该声纹识别的认证方法,其中:所述步骤S3中,采用“K-均值”算法将识别特征空间划分成数个子空间,划分后的每个所述子空间分别以“K-均值”的中心点记录为对应所述子空间的所述描述信息。上述技术方案的有益效果是:提供一种声纹识别的认证方法,在进行认证时可将采集到的语音的先进行声纹识别获取训练识别特征,将获取的训练识别特征与预先存储的标准识别特征进行对比,根据对比结果判断采集的语音是否可以通过认证,其中声纹识别的认证的计算量较小,能够节省存储和计算资源,可滤除噪音,认证的准确率高,并且克服了基于概率统计的建模方法存在的问题,适合于系统资源有限的智能系统使用。同时预先设置了表示儿童的说话人的第一频率以及表示成年的说话人的第二频率并分别进行比较,进一步提升了声纹识别的准确度。附图说明图1是本专利技术的较佳的实施例中,一种声纹识别的认证方法的总体流程图;图2是本专利技术的较佳的实施例中,数据压缩的流程示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。下面结合附图和具体实施例对本专利技术作进一步说明,但不作为本专利技术的限定。本专利技术的较佳的实施例中,基于现有技术中存在的上述问题,现提供一种声纹识别的认证方法。该声纹识别的认证方法可以适用于具有语音控制功能的智能设备中,例如应用于私人空间中的智能机器人等。在上述声纹识别的认证方法中,首先预设一第一频段以及一第二频段,第一频段高于第二频段。具体地,对于不同的使用者而言,其语音的频率可能不同,对频率粗略进行划分可以分为对应成年的说话人的较低的频段,以及对应儿童的说话人的较高的频段。更进一步地,对于成年的说话人和儿童的说话人而言,其声纹识别的认证可能并不相同,具体在于其声纹特征的提取以及相应的声纹模型的构建可能会有区别。因此在本专利技术技术方案中,设置两个语音接收的频段,并根据这两个频段将成年人的语音和儿童的语音区分识别,从而进一步提升识别精度。换言之,上文中的第一频段可以用于表示儿童的说话人的语音频段,第二频段可以用于表示成年的说话人的语音频段。因此,本专利技术的较佳的实施例中,上述两个频段可以根据实验数据的不断累加进行相应修改,从而达到一个能够较准确地分别代表成年说话人和儿童说话人的语音频段的目的。则本专利技术的较佳的实施例中,如图1所示,上述声纹识别的认证方法具体包本文档来自技高网...
一种声纹识别的认证方法

【技术保护点】
一种声纹识别的认证方法,其特征在于:预设一第一频段以及一第二频段,所述第一频段高于所述第二频段,并提供一预设的标准识别特征,还包括:步骤S1,将分别处于所述第一频段或者所述第二频段下的不同背景、不同人声的语音分割为特定长度的识别区段;步骤S2,对每个所述识别区段做特征变换后得到相应的多个识别特征,并采用关联于所有所述识别区段的所有所述识别特征分别构成对应所述第一频段的识别特征空间,或者对应所述第二频段的所述识别特征空间;步骤S3,将所述识别特征空间划分成复数个子空间,并以描述信息每个被划分的所述子空间,以及分别对每个所述子空间赋予一对应的序号;步骤S4,分别将处于所述第一频段或者处于所述第二频段的关联于训练模型的每条训练语句做特征变换后得到包括相应的时序特征点的时序特征点集,每个所述时序特征点分别被分配入同频段下的各个所述子空间,根据每个所述时序特征点对应的所述子空间的序号分别形成关联于所述第一频段或者所述第二频段的第一序列,并进而形成对应的训练识别特征;步骤S5,将对比关联于所述第一频段的所述训练识别特征与所述标准识别特征进行对比,以获取比较值,判断所述比较值是否大于预设的阈值,若是,则认证成功,并输出认证结果;若否,则认证失败,并输出认证结果,或者将对比关联于所述第二频段的所述训练识别特征与所述标准识别特征进行对比,以获取比较值,判断所述比较值是否大于预设的阈值,若是,则认证成功,并输出认证结果;若否,则认证失败,并输出认证结果。...

【技术特征摘要】
1.一种声纹识别的认证方法,其特征在于:预设一第一频段以及一第二频段,所述第一频段高于所述第二频段,并提供一预设的标准识别特征,还包括:步骤S1,将分别处于所述第一频段或者所述第二频段下的不同背景、不同人声的语音分割为特定长度的识别区段;步骤S2,对每个所述识别区段做特征变换后得到相应的多个识别特征,并采用关联于所有所述识别区段的所有所述识别特征分别构成对应所述第一频段的识别特征空间,或者对应所述第二频段的所述识别特征空间;步骤S3,将所述识别特征空间划分成复数个子空间,并以描述信息每个被划分的所述子空间,以及分别对每个所述子空间赋予一对应的序号;步骤S4,分别将处于所述第一频段或者处于所述第二频段的关联于训练模型的每条训练语句做特征变换后得到包括相应的时序特征点的时序特征点集,每个所述时序特征点分别被分配入同频段下的各个所述子空间,根据每个所述时序特征点对应的所述子空间的序号分别形成关联于所述第一频段或者所述第二频段的第一序列,并进而形成对应的训练识别特征;步骤S5,将对比关联于所述第一频段的所述训练识别特征与所述标准识别特征进行对比,以获取比较值,判断所述比较值是否大于预设的阈值,若是,则认证成功,并输出认证结果;若否,则认证失败,并输出认证结果,或者将对比关联于所述第二频段的所述训练识别特征与所述标准识别特征进行对比,以获取比较值,判断所述比较值是否大于预设的阈值,若是,则认证成功,并输出认证结果;若否,则认证失败,并输出认证结果。2.如权利要求1所述的声纹识别的认证方法,其特征在于,所述步骤S4中,每个所述时序特征点按照最近邻原则被分配入各个所述子空间内。3.如权利要求1所述的声纹识别的认证方法,其特征在于,所述步骤S4中,将被分配入所述时序特征点的...

【专利技术属性】
技术研发人员:祝铭明
申请(专利权)人:芋头科技杭州有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1