【技术实现步骤摘要】
一种基于BP神经网络的说话人识别方法
本专利技术涉及说话人识别技术,特别是涉及一种基于BP神经网络的说话人识别方法。
技术介绍
说话人识别(Speaker Recognition, SR)又称话者识别,是指通过对说话人语音信号的分析处理,自动确认说话人的技术。其综合了生理学、语音学、数字信号处理、模式识另O、人工智能等学科知识的一个研究课题,以独特的方便性、经济性和准确性等优势,在相关领域内发挥着重要作用,并有着广阔的市场背景。说话人识别的基本原理,是利用说话人的语音为每个说话人建立一个能够描述此说话人特点的模型,作为此说话人语音特征参数的标准模板,然后针对测试的语音信号进行比对,实现判别说话人身份的目的。说话人的个性特征一定程度上体现在说话人的发音声道变化上,即声道特征可以更好地对说话人进行识别。基于声道的特征主要有:(I)美尔倒谱系数(Mel-frequencyCepstralCoefficients, MFCC),是基于听觉系统的临界带效应、在Mel标度频率域提取出来的一种倒谱参数。它能够比较充分利用人耳这种特殊的感知特性,这种特征具有比较强的鲁棒性 ...
【技术保护点】
一种基于BP神经网络的说话人识别方法,其步骤是:分为语音训练阶段和语音识别阶段两个步骤;其特征在于:所述语音训练阶段的步骤是:首先对说话人语音进行语音训练,获取说话人语音信号,并得到语音预处理信号;即:语音信号预处理,包括预加重、端点检测、分帧和加窗。
【技术特征摘要】
1.一种基于BP神经网络的说话人识别方法,其步骤是:分为语音训练阶段和语音识别阶段两个步骤;其特征在于:所述语音训练阶段的步骤是:首先对说话人语音进行语音训练,获取说话人语音信号,并得到语音预处理信号;即:语音信号预处理,包括预加重、端点检测、分帧和加窗。2.根据权利要求1所述一种基于BP神经网络的说话人识别方法,其特征在于:所述MFCC语音参数提取法对语音预处理信号进行特征提取,求得说话人的特征参数;即:MFCC语音参数提取示方法如下: (1)经过预处理的语音信号X(n,(Ok)的幅度将被Mel刻度滤波器组的频率响应加权。Mel刻度滤波器组的中心频率按Mel频率均匀排列,每个三角滤波器的两个底点是相邻滤波器的中心,这些滤波器的中心频率和带宽与听觉临界边带滤波器组大体一致;在系统中Mel刻度滤波器个数取值为28 ; (2)该步计算经Mel刻度滤波器频响加权后的能量值,表示第一个滤波器ν?(ω)的频率响应;时刻η的语音帧的第I个Mel刻度滤波器输出的能量为Emel (η, I),计算公式 3.根据权利要求2所述一种基于BP神经网络的说话人识别方法,其特征在于:所述PSO-BP神经网络进行模型训练,经过训练后的模型,建立和优化PSO-BP神经网络模型库;即:PS0-BP神经网络的建立和优化的模型库如下: 步骤1:初始化 初始化BP网络结构,包括设定网络的输入层、隐含层、输出...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。