语音识别方法及装置制造方法及图纸

技术编号:15393061 阅读:21 留言:0更新日期:2017-05-19 05:37
本申请公开了一种语音识别方法,包括:利用预设的语音知识源,生成包含客户端预设信息的、用于对语音信号进行解码的搜索空间;提取待识别语音信号的特征矢量序列;计算特征矢量对应于搜索空间基本单元的概率;以所述概率为输入、在所述搜索空间中执行解码操作,得到与所述特征矢量序列对应的词序列。本申请同时提供一种语音识别装置,以及另一种语音识别方法及装置。采用本申请提供的方法,由于在生成用于解码的搜索空间时包含了客户端预设信息,因此在对客户端采集的语音信号进行识别时能够相对准确地识别出与客户端相关的信息,从而可以提高语音识别的准确率,提升用户的使用体验。

Speech recognition method and apparatus

The invention discloses a method of speech recognition, including: the use of phonetic knowledge source of presupposition, presupposition and generation including client information for decoding the search space of speech signal feature extraction; vector sequence for speech signal recognition; feature vector is computed correspond to the probability of the basic unit in the search space; the probability of input in the search decoding operation space, get the word sequence corresponding to the feature vector sequence. The present application also provides a speech recognition device and another speech recognition method and apparatus. The application provides a method for decoding, because the search space when generating the client contains preset information, so the recognition in speech signal acquisition of the client can relatively accurately identify the client related information, which can improve the speech recognition accuracy, improve the user experience.

【技术实现步骤摘要】
语音识别方法及装置
本申请涉及语音识别技术,具体涉及一种语音识别方法及装置。本申请同时涉及另一种语音识别方法及装置。
技术介绍
语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段,也是人类思维的一种依托。自动语音识别(AutomaticSpeechRecognition—ASR)通常是指让计算机等设备通过对语音的识别和理解,把人的口语转化为相应的输出文本或者命令的过程。其核心框架是:在利用统计模型建模的基础上,根据从待识别语音信号中提取的特征序列O,利用下述贝叶斯决策准则来求解与待识别语音信号对应的最佳词序列W*:W*=argmaxP(O|W)P(W)在具体实施中,上述求解最佳词序列的过程称为解码过程(实现解码功能的模块通常称为解码器),即:在由发音词典、语言模型等多种知识源组成的搜索空间中搜索出上式所示的最佳词序列。随着技术的发展,硬件的计算能力和存储容量有了很大的进步,语音识别系统已经逐步在业界得以应用,在客户端设备上也出现了各种用语音作为人机交互媒介的应用,例如智能手机上的拨打电话应用,用户只需发出语音指示(如:“给张三打电话”),即可自动实现电话拨打功能。目前的语音识别应用通常采