公共背景噪声下激活式的声纹密码安全控制方法及系统技术方案

技术编号：16219452 阅读：151 留言：0更新日期：2017-09-16 01:55

本发明专利技术公开一种公共背景噪声下激活式的声纹密码安全控制方法及系统，方法的步骤包括：激活识别模块在普通环境下实时进行语音监测，判定语音信号是否需要激活声源定位拾取模块；声源定位拾取模块接收交互目标声源数据，并进行到达时延差的估计；对到达时延差，结合麦克风阵列的位置构造多个双曲面，确定交互目标声源位置，并得到交互目标声源的语音信号；预处理模块对交互目标声源的语音信号进行预处理；声纹密码识别模块提取语音信号特征参数，将特征参数与录音库的指令文本进行匹配。本发明专利技术解决了系统的功耗性，其他人声、回声、混响低信噪比下对语音突发的增量进行定位拾取，通过三次安全语音识别及控制的操作解决上述现状的问题。

Voiceprint password security control method and system of public activation of background noise

Voiceprint password security control method and system of the activation of the invention discloses a public background noise, the method comprises the following steps: activate the identification module in a general environment for real-time voice monitoring, to determine whether to activate the voice signal pickup module of sound source localization; sound source positioning pickup module receives the interactive target sound source data, and to estimate time delay of arrival; time delay, combined with the structural position of microphone array a hyperboloid, determine the interaction of target sound source position, and get the target sound source interactive speech signal preprocessing module; the interaction of target sound source speech signal processing; voice password recognition module speech signal feature extraction. By matching the instruction text feature parameters and tape library. The invention solves the power consumption of the system, the increment of other voices, echo and reverberation in low SNR of speech burst positioning pickup, solve the above situation through the three safety of speech recognition and control the operation of the problem.

全部详细技术资料下载

【技术实现步骤摘要】
公共背景噪声下激活式的声纹密码安全控制方法及系统
本专利技术涉及智能家居的人机交互
，尤其涉及一种公共背景噪声下激活式的声纹密码安全控制方法及系统。
技术介绍
随着社会的发展，语音作为一种媒介出现在人机交互界面中，是社会发展的趋势，相比其它任何一种人与人之间的交流方式来说，语音交流是一种快速的手段，语音识别已经慢慢渗透于我们日常生活当中，现在很多行业先驱相信借于语音进行人机之间的交互，会引向一个方便人们日常生活。自动语音识别(AutomaticSpeechRecognition，ASR)技术自从二十世纪五十年代以来一直研究的主题。自动语音识别技术是一种将人的语音转换为文本的技术。语音识别是一个多学科交叉的领域，它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性，语音识别系统在人机交互领域的应用还不是很成熟，只有在特定的条件下获得满意的性能，或者说只能应用于特定的某些场合。在智能家居给人们带来便捷生活的同时，人们的控制习惯渐渐发生了改变。语音技术的发展也为控制入口做出了一个很好的补充，再抛去传统遥控器...
公共背景噪声下激活式的声纹密码安全控制方法及系统

【技术保护点】
一种公共背景噪声下激活式的声纹密码安全控制方法，其特征在于，包括下述步骤：S1、激活识别模块在普通环境下实时进行语音信号监测，若检测到语音信号，则对语音信号进行预加重、加窗和分帧处理，并求取语音信号的幅度值；根据实验得到语音信号与噪声之间的信噪比，并将信噪比转化为幅度差T；设T为判决门限值，若语音信号的前一帧与后一帧只差大于等于T，则认为进入静默期；若语音信号的前一帧与后一帧只差小于T，则判断是激活标志，并激活声源定位拾取模块；S2、声源定位拾取模块通过麦克风阵列接收交互目标声源数据，并对交互目标声源进行到达时延差的估计；S3、对估计后的到达时延差，结合麦克风阵列的位置构造多个双曲面，并计算每...

【技术特征摘要】
1.一种公共背景噪声下激活式的声纹密码安全控制方法，其特征在于，包括下述步骤：S1、激活识别模块在普通环境下实时进行语音信号监测，若检测到语音信号，则对语音信号进行预加重、加窗和分帧处理，并求取语音信号的幅度值；根据实验得到语音信号与噪声之间的信噪比，并将信噪比转化为幅度差T；设T为判决门限值，若语音信号的前一帧与后一帧只差大于等于T，则认为进入静默期；若语音信号的前一帧与后一帧只差小于T，则判断是激活标志，并激活声源定位拾取模块；S2、声源定位拾取模块通过麦克风阵列接收交互目标声源数据，并对交互目标声源进行到达时延差的估计；S3、对估计后的到达时延差，结合麦克风阵列的位置构造多个双曲面，并计算每个双曲面的焦点，确定交互目标声源位置，从而在交互目标声源位置得到交互目标声源的语音信号；S4、预处理模块对交互目标声源的语音信号进行预处理，预处理包括预滤波、采样、量化、模式转换、预加重、加窗、分帧处理、端点检测以及生产MFCC_D特征参数过程；S5、对预处理后的语音信号，声纹密码识别模块提取特征参数，将特征参数与录音库的指令文本进行匹配。2.如权利要求1所述的公共背景噪声下激活式的声纹密码安全控制方法，其特征在于，所述步骤S2中对目标声源进行到达时延差的估计，包括在二维空间和三维空间对目标声源进行到达时延差的估计；其中所述二维空间对目标声源进行到达时延差的估计，具体为：设麦克风阵列包括三个麦克风，相邻麦克风之间的距离为Δd，以阵列中心的麦克风为参考点，目标声源距参考点的距离为r，目标声源与距离r关系满足下式：式中，τ1、τ2分别是麦克风阵列两侧的两个麦克风与参考点麦克风的时延差，v为声速；其中，上式中表示出目标声源相对于麦克风阵列的极坐标(r,θ)为：由上式得，只要获知τ1、τ2的值，即可唯一确定目标声源的极坐标；所述三维空间对目标声源进行到达时延差的估计，具体为：建立麦克风阵列模型，所述麦克风阵列模型包括两个平行的麦克风阵列，每个麦克风阵列包括三个麦克风；其中，麦克风阵列间距为d，且每个麦克风阵列均以中间的麦克风为参考点，把其中一个麦克风阵列的参考点作为原点，建立三维坐标系；设目标声源的球坐标为根据三个麦克风均匀线阵近场信号模型中，完成目标声源坐标中(r,θ)的确定，所以只需确定方位角即可完成目标声源的三维定位：首先，分别在麦克风阵列中通过上述二维空间对目标声源进行到达时延差的估计算法，得到目标声源相对两个麦克风阵列参考点的极坐标(r,θ)与(r',θ')，则由阵列的几何关系有：其中，由上式得，给定一个方位角φ'，就能由(r,θ)唯一地确定一组(r”,θ”)；引入误差函数在[-90°，90°]的范围内遍历方位角值，取使得误差函数最小的为目标声源方位角的最佳估值：3.如权利要求1或2所述的公共背景噪声下激活式的声纹密码安全控制方法，其特征在于，所述步骤S2，在进行到达时延差的估计前，先对交互目标声源进行阈值判决，具体为：A、对交互目标声源数据进行A/D转换，转换后第i个麦克风接收的信号xi(t)为：式中，为声音在大气中传播的幅度衰减因子，ri为第i个麦克风与目标声源之间的距离，s(t)为目标声源信号，ni(t)为包括其他说话人等干扰源在内的各种噪声的总和，t为时间，M为麦克风个数；B、为了确保时延差的估计精度，对麦克风接收到的信号进行插值处理，得到xi(n)；设定一个较阈值A0，根据式对xi(n)进行阈值判决处理，所述阈值A0在xi'(n)中的位置及数量目标语音信号决定，而只受少量的干扰影响，即由xi'(n)之间的时延差可精确估计xi(t)之间的时延差；C、对不同麦克风经过阈值判决后的信号进行相关处理，通过峰值检测完成到达时延差的估计，所述进行相关处理方式为：Rij(τ)＝E[xi(n)xj(n+τ)]。4.如权利要求3所述的公共背景噪声下激活式的声纹密码安全控制方法，其特征在于，所述步骤C得到经过到达时延差的估计后的交互目标声源信号，此时，需对交互目标声源信号利用改进的加权波束形成法进行语音增强，具体为：已知了...

【专利技术属性】
技术研发人员：金亚强，殷瑞祥，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人