一种语音识别的方法和装置制造方法及图纸

技术编号：15642590 阅读：141 留言：0更新日期：2017-06-16 16:06

本申请提供了一种语音识别的方法和装置，包括：将语言模型表示为有限状态转移机；待识别的新词根据设定规则在所述有限状态转移机获得所述新词对应的近义词；将所述新词添加到所述有限状态转移机，获得更新后的有限状态转移机，使用所述更新后的有限状态转移机进行语音识别，从而解决了目前语音识别中新词快速添加和识别的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别的方法和装置
本申请涉及信息
，特别是涉及一种语音识别的方法和装置。
技术介绍
近年来，语音识别技术成为了信息
中的重要的发展技术之一。语音识别技术使人们能够甩掉键盘，通过语音命令进行操作，使语音识别技术在众多领域得到广泛应用。语音识别技术是将声音转变成文本的技术。目前采用语音模型和语言模型结合的方式，实现对语音的识别，其中，语音模型用来描述语音信号的分布特性，而语言模型用于识别语音信号对应的词序列，用以限制系统能识别的句子范围，语言模型基于一个系统词表，只有在词表中出现的词才有可能被识别出来。随着信息社会的快速发展，新生的词汇不断涌现，例如：颜值、吐槽、洪荒之力等等，由于新的词汇不在语音识别的系统词表中，因此很难被识别出来。
技术实现思路
本申请实施例提供了一种语音识别的方法和装置，以解决目前无法识别新词和新词快速添加的问题。为了解决上述问题，本申请公开了一种语音识别的方法，包括：将语言模型表示为有限状态转移机；待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词；将所述新词添加到所述有限状态转移机，获得更新后的有限状态转移机，使用所述更新后的有限状态转移机进行语音识别。优选的，所述待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词的步骤包括：根据静态配置获得新词对应的近义词。优选的，所述待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词的步骤包括：将所述新词映射到向量空间，获得第一向量；将语言模型的词表中的词映射到向量空间，获得第二向量；根据所述第一向量和所述第二向量利用余弦...
一种语音识别的方法和装置

【技术保护点】
一种语音识别的方法，其特征在于，包括：将语言模型表示为有限状态转移机；待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词；将所述新词添加到所述有限状态转移机，获得更新后的有限状态转移机，使用所述更新后的有限状态转移机进行语音识别。

【技术特征摘要】
1.一种语音识别的方法，其特征在于，包括：将语言模型表示为有限状态转移机；待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词；将所述新词添加到所述有限状态转移机，获得更新后的有限状态转移机，使用所述更新后的有限状态转移机进行语音识别。2.根据权利要求1所述的方法，其特征在于，所述待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词的步骤包括：根据静态配置获得新词对应的近义词。3.根据权利要求1所述的方法，其特征在于，所述待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词的步骤包括：将所述新词映射到向量空间，获得第一向量；将语言模型词表中的词映射到向量空间，获得第二向量；根据所述第一向量和所述第二向量利用余弦距离公式，获得新词和所述词表中的词之间的相似度；将所述相似度高的所述词表中的词确定为新词对应的近义词。4.根据权利要求3所述的方法，其特征在于，所述将所述近似词添加到所述有限状态转移机，获得更新后的有限状态转移机的步骤包括：将所述获得新词和所述词表中的词之间的相似度与近义词的权重的乘积作为新词的权重；将所述新词和所述新词的权重并列添加在所述有限状态转移机中的近似词处...

【专利技术属性】
技术研发人员：王东，马习，张之勇，张雪薇，张玥，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人