【技术实现步骤摘要】
一种基于频谱自适应法的BP神经网络语音识别系统及方法
本专利技术属于语音识别
,尤其涉及一种基于频谱自适应法的BP神经网络语音识别系统及方法。
技术介绍
目前,最接近的现有技术:特征参数匹配法、隐马尔可夫法和神经网络法。现有语音识别技术多有环境噪声影响、说话人距离和位置变化的影响以及说话人心理和生理变化的影响等,缺乏稳定性和自适应性。语音识别的应用往往工作环境复杂,声学特征的精确提取通常较难获得。这就需要语音识别系统具有一定的自适应性并进行BP算法训练。目前,常被用于语音识别技术的方法有HMM模型,BP神经网络算法。然而,当周围存在较多高频噪声或说话人因情感变化而使说话口吻改变时,系统识别性能减弱,造成语音识别率不够。随科技发展,计算机和机器人需具有更强的表达、识别和理解能力,从而人机界面更为高效。综上所述,现有技术存在的问题是:现有语音识别技术多有环境噪声影响、说话人距离和位置变化的影响以及说话人心理和生理变化的影响等,缺乏稳定性和自适应性。解决上述技术问题的难度:任务过程中因环境变化、说话人距离改变、说话人因情感变化而改变说话口吻从而影响所提取特征值的有 ...
【技术保护点】
1.一种基于频谱自适应法的BP神经网络语音识别方法,其特征在于,所述基于频谱自适应法的BP神经网络语音识别方法包括:步骤一,语音输入;步骤二,对输入语音进行预处理/取帧;步骤三,特征提取;步骤四,频谱分析;步骤五,BP神经网络训练;步骤六,输出识别结果。
【技术特征摘要】
1.一种基于频谱自适应法的BP神经网络语音识别方法,其特征在于,所述基于频谱自适应法的BP神经网络语音识别方法包括:步骤一,语音输入;步骤二,对输入语音进行预处理/取帧;步骤三,特征提取;步骤四,频谱分析;步骤五,BP神经网络训练;步骤六,输出识别结果。2.如权利要求1所述基于频谱自适应法的BP神经网络语音识别方法,其特征在于,所述步骤三特征提取具体包括:语音输入即把语音输入设备采集的语音进行原始输入,通过扩音器将未知声音转化为电信号输入识别系统,进行预处理;预处理包括采样语音信号、反混叠带通滤波、去除个体发音差异和设备、环境引起的噪声影响,并且每隔一定时间间隔取出部分信号处理,确定帧的尺寸以及计算重叠率;根据取帧划分的语音信号的每帧中提取出韵律特征和质量特征,确定特征集中最佳分类的特征;在BP神经网络训练阶段,对特征进行分析并得到信号归属词汇,为每个词条建立一个模型,保存为模板库;在识别阶段,使用所获得的特征集来执行情感识别,语音信号经过相同的通道得到语音特征参数,生成测试模板,与参考模板进行匹配,生成识别结果。3.如权利要求1所述基于频谱自适应法的BP神经网络语音识别方法,其特征在于,步骤四频谱分析采用频谱自适应算法;频谱自适应算法包括:令训练向量和测试向量分别是向量X(1)和X(2),假设:U=AX(1),V=BX(2)(1)其中A和B是对应于X(1)和X(2)的变换矩阵,u和v是参考空...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。