语音识别方法和装置制造方法及图纸

技术编号：15507843 阅读：168 留言：0更新日期：2017-06-04 02:22

本申请公开了语音识别方法和装置。该方法的一具体实施方式包括：响应于检测到传声器接收到包含干扰音信号的语音信号，对语音信号进行高通滤波处理；消除经高通滤波处理后的语音信号中的干扰音信号；对消除干扰音信号后的语音信号进行自动增益控制处理，得到目标语音信号；从目标语音信号中提取特征向量，并将特征向量输入至预先训练的声学模型，得到与目标语音信号匹配的语音识别结果，其中，声学模型用于表征特征向量与语音识别结果的对应关系。该实施方式提高了语音识别的成功率。

Speech recognition method and apparatus

The present invention discloses a speech recognition method and apparatus. One embodiment of the method includes: receiving a response to the speech signal contains interference sound signal to the detected microphone, the voice signal processing of high pass filtering to eliminate the noise; signal processing of high pass filtering after the speech signal; to eliminate the noise signal of the automatic gain control processing, get the target speech signal; feature vectors are extracted from the target speech signal, and the feature vector is input to the acoustic model training in advance, to get the speech recognition results, matched with the target speech signal the corresponding relationship between the acoustic model to characterize the feature vector and the speech recognition results. The implementation improves the success rate of speech recognition.

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法和装置
本申请涉及计算机
，具体涉及互联网
，尤其涉及语音识别方法和装置。
技术介绍
随着计算机技术的发展，语音识别技术被应用于越来越多的领域，如智能家居、工业控制、终端设备的语音交互系统等。利用语音识别技术可以使信息的处理和获取更加便捷，从而提高用户的工作效率。然而，现有的语音识别方式通常将待识别的语音信号输入至基于纯净语音信号训练所得的声学模型，进而得到语音识别结果。由于待识别的语音信号通常与纯净语音信号存在较大差异，因而，这种语音识别方式存在着识别成功率较低的问题。
技术实现思路
本申请的目的在于提出一种改进的语音识别方法和装置，来解决以上
技术介绍
部分提到的技术问题。第一方面，本申请提供了一种语音识别方法，上述方法包括：响应于检测到上述传声器接收到包含干扰音信号的语音信号，对上述语音信号进行高通滤波处理；消除经高通滤波处理后的语音信号中的干扰音信号；对消除干扰音信号后的语音信号进行自动增益控制处理，得到目标语音信号；从上述目标语音信号中提取特征向量，并将上述特征向量输入至预先训练的声学模型，得到与上述目标语音信号匹配的语音识别结果，其中，上述声学模型用于表征特征向量与语音识别结果的对应关系。在一些实施例中，上述终端设备还安装有扬声器，上述干扰音信号由回声信号和噪音信号组成，其中，上述回声信号是由上述扬声器发送并传送至上述传声器的声音信号。在一些实施例中，上述消除上述语音信号中的上述干扰音信号，得到目标语音信号，包括：利用时延估计算法对经高通滤波处理后的语音信号进行自适应滤波处理，消除回声信号；利用噪声抑制算法消除经自适应滤波处理后...
语音识别方法和装置

【技术保护点】
一种用于终端设备的语音识别方法，其特征在于，所述终端设备安装有传声器，所述方法包括：响应于检测到所述传声器接收到包含干扰音信号的语音信号，对所述语音信号进行高通滤波处理；消除经高通滤波处理后的语音信号中的干扰音信号；对消除干扰音信号后的语音信号进行自动增益控制处理，得到目标语音信号；从所述目标语音信号中提取特征向量，并将所述特征向量输入至预先训练的声学模型，得到与所述目标语音信号匹配的语音识别结果，其中，所述声学模型用于表征特征向量与语音识别结果的对应关系。

【技术特征摘要】
1.一种用于终端设备的语音识别方法，其特征在于，所述终端设备安装有传声器，所述方法包括：响应于检测到所述传声器接收到包含干扰音信号的语音信号，对所述语音信号进行高通滤波处理；消除经高通滤波处理后的语音信号中的干扰音信号；对消除干扰音信号后的语音信号进行自动增益控制处理，得到目标语音信号；从所述目标语音信号中提取特征向量，并将所述特征向量输入至预先训练的声学模型，得到与所述目标语音信号匹配的语音识别结果，其中，所述声学模型用于表征特征向量与语音识别结果的对应关系。2.根据权利要求1所述的语音识别方法，其特征在于，所述终端设备还安装有扬声器，所述干扰音信号由回声信号和噪音信号组成，其中，所述回声信号是由所述扬声器发送并传送至所述传声器的声音信号。3.根据权利要求2所述的语音识别方法，其特征在于，所述消除所述语音信号中的所述干扰音信号，得到目标语音信号，包括：利用时延估计算法对经高通滤波处理后的语音信号进行自适应滤波处理，消除回声信号；利用噪声抑制算法消除经自适应滤波处理后的语音信号中的噪音信号。4.根据权利要求1所述的语音识别方法，其特征在于，所述响应于确定所述传声器接收到语音信号之前，所述方法还包括：对预先获取的训练样本进行预处理，生成目标训练样本，其中，所述目标训练样本包括语音标识；从所述目标训练样本中提取特征向量；基于卷积神经网络、深度神经网络和受限波尔兹曼机，将从所述目标训练样本中提取的特征向量作为输入，所述语音标识作为输出，训练得到所述声学模型。5.根据权利要求4所述的语音识别方法，其特征在于，所述对预先获取的训练样本进行预处理，生成目标训练样本，包括：对预先获取的训练样本进行高通滤波处理；对经高通滤波处理后的训练样本依次进行回声消除和噪声抑制处理；对经噪声抑制处理后的训练样本进行自动增益控制处理，生成目标训练样本。6.根据权利要求4所述的语音识别方法，其特征在于，所述响应于确定所述传声器接收到语音信号之前，所述方法还包括：利用聚类算法对所述声学模型输出的语音标识进行聚类，将聚类后的语音标识确定为与所述训练样本匹配的语音识别结果。7.一种用于终端设备的语音识别装置，其特征在于，所...

【专利技术属性】
技术研发人员：崔玮玮，孙珏，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人