一种人类声纹生物密钥生成方法技术

技术编号:15399601 阅读:361 留言:0更新日期:2017-05-23 13:42
本发明专利技术提出了一种声纹生物密钥生成方法。本发明专利技术将声纹特征序列向高维空间中投影,在高维空间中将特征序列稳定到可接受的波动范围内,再对稳定后的特征序列编码,从编码中提取生物密钥。整个方法在待认证用户端、认证服务器端均无需记录用户声纹模板,用户通过采集自身的语音在本地生成(用户名、密钥)对,通过(用户名、密钥)对衍生的各种认证方法进行网络身份认证。声纹生物密钥不仅可以用于网络身份认证,更可以用于加密各种用户私有数据,安全方便。用户无需记忆冗长的密码,同时又能获得足够长度的密钥序列。本发明专利技术提取正常人类声纹生物密钥的密钥长度可大于256bit。

A biometric key generation method of the human voice

The present invention provides a method for generating key biological voiceprint. The present invention will voiceprints sequence to the high dimensional space projection, in high dimensional space, stable feature sequence to fluctuations within the acceptable range of encoding after stable feature sequence, extracting key from biological encoding. The method to authenticate the user terminal, the authentication server is required to record the user by collecting user voiceprint template, its voice generated locally (user name, key), through (name, key) network identity authentication of various authentication methods derived. The voice biometric key can be used not only for network authentication, it can be used to encrypt all user private data, safe and convenient. The user does not need to memorize lengthy passwords, but also to obtain a key sequence of sufficient length. The method of extracting the key length of normal human voice biometric key may be greater than 256bit.

【技术实现步骤摘要】
一种人类声纹生物密钥生成方法
本专利技术属于信息安全
,具体涉及一种从人类声纹中经由高维空间转换直接提取稳定生物密钥的方法,其能够为网络身份认证提供一种新的认证方法和思路。
技术介绍
声纹识别技术是现今比较成熟的生物特征识别技术,在低噪音环境中声纹识别准确率可达到95%以上。基于声纹的网络身份认证技术,其基本方法为:1)采集用户语音信号,经语音信号处理提取用户声纹特征,生成声纹特征模板,存储在远端网络认证服务器中;2)当某用户需要进行身份认证时,再次采集用户语音信号,提取用户声纹特征;3)将用户声纹特征与认证服务器中的相应用户声纹特征模板进行比对,一致则认证通过,不一致则认证失败。这一经典的网络身份认证模型需要在认证服务器端存储用户语音,或者用户声纹特征模板。采集用户语音存储在认证服务器中,不方便并且会消耗比较大的服务器资源。服务器需要开辟语音通道接收用户的语音流,这增加了整套认证系统的复杂性。也阻碍了声纹认证在网络认证服务中的运用。曾经有科研工作者尝试过直接从声纹中提取生物密钥。如中国专利技术专利ZL201110003202.8基于声纹的文档加密及解密方法,提出了一个从声纹信息中提取稳定密钥序列的方案。但是该方案仅用棋盘法稳定声纹特征值,稳定效果有限。并且棋盘法事实是通过缩小编码空间来稳定特征值,如1024的值空间映射为16的值空间,这使得密钥序列的长度缩短,降低了安全性。
技术实现思路
本专利技术提出了一种声纹生物密钥生成方法。方法将声纹特征序列向高维空间中投影,在高维空间中将特征序列稳定到可接受的波动范围内,再对稳定后的特征序列编码,从编码中提取生物密钥。整个方法在待认证用户端、认证服务器端均无需记录用户声纹模板,用户通过采集自身的语音在本地生成(用户名、密钥)对,通过(用户名、密钥)对衍生的各种认证方法进行网络身份认证。声纹生物密钥不仅可以用于网络身份认证,更可以用于加密各种用户私有数据,安全方便。用户无需记忆冗长的密码,同时又能获得足够长度的密钥序列。本专利技术提取正常人类声纹生物密钥的密钥长度可大于256bit。声纹生物密钥提取分两部分,第一部分为声纹生物密钥训练部分,第二部分为声纹生物密钥提取部分。声纹生物密钥训练部分具体步骤为:第一步,用户录取自身语音,10秒以上。第二步,从录取语音中提取MFCC系数(Mel频率倒谱系数);用MFCC系数训练用户GMM高斯混合模型,取混合数为8~32阶,阶数可由用户根据经验选定,记为N。第三步,混合数为N的高斯混合模型由N个高维高斯分布组成,取每一个高斯分布的均值向量,组成N×20维的矩阵,20为MFCC系数个数。高斯混合模型对应每一个高维高斯分布有一个权值,组合在一起为1×N维的权值向量,记为λ,在用户端存储λ。第四步,将N×20维矩阵扩展为2个矩阵,L×L维的随机误差方阵EX,L×L维的标准值方阵EY,L>NandL>20。第五步,求解EX的广义逆矩阵,记为IEX,将IEX左乘矩阵EY得到高维空间投影矩阵PEX=IEX×EY,在用户端存储投影矩阵PEX。第六步,选取标准值方阵EY的前N×D个分量组成矩阵T,1<D<20。对T的每一个分量进行一次棋盘法运算、正整数转化,得结果矩阵T1。第七步,设定一个n阶的多项式函数,形如f(x)=a0+a1*x+a2*x2+a3*x3+…+an*xn,n为阶数,a0~an∈正整数,其值域范围为0~224,即每个系数有24bit;将矩阵T1的每一个分量代入f(x),计算后得结果矩阵T2,T2为正整数矩阵。在用户端存储T2及n值。声纹生物密钥训练完成。声纹生物密钥提取部分具体步骤为:第一步,用户录取自身语音,3秒左右。第二步,从录取语音中提取MFCC系数(Mel频率倒谱系数);依据声纹生物密钥训练时存储的λ,训练用户GMM高斯混合模型,取混合数阶数与声纹生物密钥训练时一致,记为N。第三步,取每一个高斯分布的均值向量,组成N×20维的矩阵。第四步,将N×20维矩阵扩展为N×L维矩阵,记为EC,扩展方法与声纹生物密钥训练阶段扩展方法保持一致。第五步,将EC左乘PEX,得N×L维矩阵,取矩阵前N×D个分量组成矩阵;对矩阵的每一个分量进行一次棋盘法运算及正整数转化,方法与声纹生物密钥训练时一致,得矩阵ED。第六步,从矩阵ED中选取n+2个分量值,排序;从存储的T2矩阵中选取n+2个分量值,排序。将两组排序结果依次配对,组成(z,f(z))的形式,z为ED中选取的值,f(z)为T2中选取的值。将n+2个(z,f(z))对,代入函数f(z)=a0+a1*z+a2*z2+a3*z3+…+an*zn,生成n+2个线性方程,其中,a0~an为n+1个未知数,a0~an∈正整数。如方程组有唯一解,则解得的(a0,a1,a2,a3,。。。,an)组成的数字序列即为提取的声纹生物密钥;如方程组没有唯一解,则从矩阵ED、T2中重新选取n+2个分量,组成(z,f(z))对,再次尝试解方程组;遍历ED、T2的所有n+2个分量的排列组合,解得声纹生物密钥。密钥序列长度为24×(n+1)bit。本专利技术的有益效果:本专利技术提出了一种声纹生物密钥生成方法。可以改变传统的网络生物特征身份认证模式,认证服务器无需存储用户的任何语音信息,只对用户提供的密钥进行认证,而密钥是由用户声纹信息唯一生成的。该方法可以使网络身份认证更灵活,也可以帮助用户免去记忆冗长密钥的记忆负担。附图说明图1为Mel频率倒谱系数计算流程图。图2为GMM高斯混合模型示意图。图3为矩阵前N×D个分量选取示意图。图4为声纹生物密钥提取流程图。具体实施方式下面结合附图对本专利技术作进一步说明。虽然在低噪音环境中声纹识别准确率可达到95%以上,但是直接从声纹中提取生物密钥依然存在诸多困难。声纹生物特征是依概率进行识别的,从语音信号中提取的声纹特征存在很大的波动性。如果不作处理,直接比较两组声纹特征数字序列,99%的概率没有一个数字是相同的。现有的稳定声纹特征数字序列的方法主要是棋盘法,但其稳定效果有限,提取声纹生物密钥的成功率偏低。本专利技术提出了在高维空间中稳定声纹特征数字序列的技术,并进一步提出了对稳定后的声纹特征数字序列容错提取的技术。两者结合,可使声纹生物密钥提取成功率达到80%以上。本专利技术分二部分,声纹生物密钥训练部分与声纹生物密钥提取部分。声纹生物密钥训练部分的具体实施步骤为:第一步,用户录取自身语音,10秒以上。第二步,从录取语音中提取MFCC系数(Mel频率倒谱系数),如图1所示。具体方法为:1)预增强(Pre-Emphasis)以S1(n)(n:0..N-1)表示语音时域信号,预增强公式为:S(n)=S1(n)–a*S1(n-1)(0.9<a<1.0)2)音框化(Framing)音框化即对语音信号分帧。3)汉明窗(HammingWindowing)处理假设音框化后的信号为S(n),n=0,1,…,N-1。那么乘上汉明窗后为:S’(n)=S(n)*W(n)4)快速傅立叶转换(FFT)对S’(n)实施基2FFT变换,得到线性频谱本文档来自技高网...
一种人类声纹生物密钥生成方法

【技术保护点】
一种人类声纹生物密钥生成方法,其特征在于该方法包括以下步骤:声纹生物密钥训练部分和声纹生物密钥提取部分;声纹生物密钥训练部分具体步骤为:第Ⅰ步,用户录取自身语音,10秒以上;第Ⅱ步,从录取语音中提取MFCC系数;用MFCC系数训练用户GMM高斯混合模型,取混合数为8~32阶,记为N;第Ⅲ步,混合数为N的高斯混合模型由N个高维高斯分布组成,取每一个高维高斯分布的均值向量,组成N×20维的矩阵,20为MFCC系数个数;高斯混合模型对应每一个高维高斯分布有一个权值,组合在一起为1×N维的权值向量,记为λ,在用户端存储λ;第Ⅳ步,将N×20维矩阵记为S,将N×20维矩阵扩展为2个矩阵,L×L维的随机误差方阵EX,L×L维的标准值方阵EY,L>N且L>20;具体方法如下:取矩阵S的N个行向量,求均值,得1×20维的均值向量EB;设定波动范围Er,为EB增加随机误差扰动,计算公式为

【技术特征摘要】
1.一种人类声纹生物密钥生成方法,其特征在于该方法包括以下步骤:声纹生物密钥训练部分和声纹生物密钥提取部分;声纹生物密钥训练部分具体步骤为:第Ⅰ步,用户录取自身语音,10秒以上;第Ⅱ步,从录取语音中提取MFCC系数;用MFCC系数训练用户GMM高斯混合模型,取混合数为8~32阶,记为N;第Ⅲ步,混合数为N的高斯混合模型由N个高维高斯分布组成,取每一个高维高斯分布的均值向量,组成N×20维的矩阵,20为MFCC系数个数;高斯混合模型对应每一个高维高斯分布有一个权值,组合在一起为1×N维的权值向量,记为λ,在用户端存储λ;第Ⅳ步,将N×20维矩阵记为S,将N×20维矩阵扩展为2个矩阵,L×L维的随机误差方阵EX,L×L维的标准值方阵EY,L>N且L>20;具体方法如下:取矩阵S的N个行向量,求均值,得1×20维的均值向量EB;设定波动范围Er,为EB增加随机误差扰动,计算公式为Sj代表S矩阵中的第j行,EXj代表一个行向量;rand(-1,1)函数返回(-1,1)之间的随机数;将EXj以行为单位装配为L×20维的矩阵;构造L-20个非线性函数,输入变量是一维行向量,x1,x2,…,x20,输出为一维行向量(x1,x2,…,x20,…,xL),L个元素;取如下非线性函数:Z(t)=(x1-x2)×sin(t)+(t^2)×(x3%10),t为整数,0<t<L-20;sin(t)为三角函数,(t^2)表示t的平方,(x3%10)表示x3模10运算;用构造的Z(t)对EXj进行运算,j遍历1~L,得L×L维矩阵,即随机误差方阵EX;EY构造方法为:将均值向量EB重复L行,得L×20维矩阵,记为EYt;用Z(t)对EYtj进行运算,j遍历1~L,得L×L维矩阵,即标准值方阵EY;第Ⅴ步,求解EX的广义逆矩阵,记为IEX,将IEX左乘矩阵EY得到高维空间投影矩阵PEX=IEX×EY,在用户端存储高维空间投影矩阵PEX;第...

【专利技术属性】
技术研发人员:吴震东李进
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1