一种语音识别方法和语音识别系统技术方案

技术编号:16081437 阅读:263 留言:0更新日期:2017-08-25 16:16
本发明专利技术提供了一种语音识别方法和语音识别系统,其中,所述语音识别方法包括一下步骤:对获取的语音信号进行预处理;从所述语音信号中提取特征参数;采用语言模型和基于长短时记忆模型结构建立得到的声学模型对所述语音信号进行自动识别;对自动识别得到的语音信号进行后处理。根据本发明专利技术,采用长短时记忆模型结构可以表征更长时间内的基音曲线,提高建模精度以及语音识别精度。

【技术实现步骤摘要】
一种语音识别方法和语音识别系统
本专利技术涉及语音识别领域,尤其涉及一种语音识别方法和语音识别系统。
技术介绍
语音识别,也称为自动语音识别(AutomaticSpeechRecognition,ASR),其目标是将人类语音转换为计算机可读的文字或指令,是模式识别的一个重要分支。一个完整的语音识别系统一般包括语音信号预处理、特征提取、模型训练、声学模型、语言模型以及自然语言后处理等几大模块。其中,声学模型的主要作用是用来辨识用户发什么样的音。对于一门具体的语言来说,需要采集该门语言数量众多的发音人的数据来进行训练,而且这些数据需要将对应的文字标记出来。近30年来,语音识别的声学模型建模方法有隐马尔科夫模型(HiddenMarkovModel,HMM)、高斯混合模型(GaussianMixtureModel,GMM)以及目前占主流地位的深度神经网络模型(DNN/CNN/RNN)等。目前语音识别技术路线为语言相关、说话人无关的统计模式识别技术,不同语言之间由于音系、音段和韵律表现方面的差异,声学模型的建模方法可以略有差异。西方语言(如英语、法语和德语等等)绝大多数都是不带调的语言,建立声本文档来自技高网...
一种语音识别方法和语音识别系统

【技术保护点】
一种语音识别方法,其特征在于,所述语音识别方法包括以下步骤:对获取的语音信号进行预处理;从所述语音信号中提取特征参数;采用语言模型和基于长短时记忆模型结构建立得到的声学模型对所述语音信号进行自动识别;对自动识别得到的结果进行后处理。

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述语音识别方法包括以下步骤:对获取的语音信号进行预处理;从所述语音信号中提取特征参数;采用语言模型和基于长短时记忆模型结构建立得到的声学模型对所述语音信号进行自动识别;对自动识别得到的结果进行后处理。2.如权利要求1所述的一种语音识别方法,其特征在于,声学模型的建立包括特征选取步骤,所述特征选取步骤包括:将连续若干帧的基音组合形成一特征向量;对所述特征向量进行归整化处理;将归整化处理后的特征向量作为长短时记忆模型结构的输入参数。3.如权利要求2所述的一种语音识别方法,其特征在于,在对所述特征向量进行归整化处理的过程中,所述归整化处理在音节层面进行,具体过程包括:根据同一个音节内部的基音曲线,算其平均值,各帧基音对平均值取预定比值。4.如权利要求3所述的一种语音识别方法,其特征在于,所述预定比值采用公式:其中,Fk表示第k帧的基音,Fmean表示音节的平均基音,其中,表示第k帧基音相对于平均基音的比值,k为自然数。5.如权利要求1所述的一种语音识别方法,其特征在于,声学模型的建立包括以下步骤:基于长短时记忆模型结构分别建立...

【专利技术属性】
技术研发人员:陈桂林
申请(专利权)人:上海优同科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1