当前位置: 首页 > 专利查询>清华大学专利>正文

一种语音识别的方法和装置制造方法及图纸

技术编号:15642590 阅读:141 留言:0更新日期:2017-06-16 16:06
本申请提供了一种语音识别的方法和装置,包括:将语言模型表示为有限状态转移机;待识别的新词根据设定规则在所述有限状态转移机获得所述新词对应的近义词;将所述新词添加到所述有限状态转移机,获得更新后的有限状态转移机,使用所述更新后的有限状态转移机进行语音识别,从而解决了目前语音识别中新词快速添加和识别的问题。

【技术实现步骤摘要】
一种语音识别的方法和装置
本申请涉及信息
,特别是涉及一种语音识别的方法和装置。
技术介绍
近年来,语音识别技术成为了信息
中的重要的发展技术之一。语音识别技术使人们能够甩掉键盘,通过语音命令进行操作,使语音识别技术在众多领域得到广泛应用。语音识别技术是将声音转变成文本的技术。目前采用语音模型和语言模型结合的方式,实现对语音的识别,其中,语音模型用来描述语音信号的分布特性,而语言模型用于识别语音信号对应的词序列,用以限制系统能识别的句子范围,语言模型基于一个系统词表,只有在词表中出现的词才有可能被识别出来。随着信息社会的快速发展,新生的词汇不断涌现,例如:颜值、吐槽、洪荒之力等等,由于新的词汇不在语音识别的系统词表中,因此很难被识别出来。
技术实现思路
本申请实施例提供了一种语音识别的方法和装置,以解决目前无法识别新词和新词快速添加的问题。为了解决上述问题,本申请公开了一种语音识别的方法,包括:将语言模型表示为有限状态转移机;待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词;将所述新词添加到所述有限状态转移机,获得更新后的有限状态转移机,使用所述更新后的有限状态转移机进行语音识别。优选的,所述待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词的步骤包括:根据静态配置获得新词对应的近义词。优选的,所述待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词的步骤包括:将所述新词映射到向量空间,获得第一向量;将语言模型的词表中的词映射到向量空间,获得第二向量;根据所述第一向量和所述第二向量利用余弦距离公式,获得新词和所述词表中的词之间的相似度;将所述相似度高的所述词表中的词确定为新词对应的近义词。优选的,将所述近似词添加到所述有限状态转移机,获得更新后的有限状态转移机的步骤包括:将所述获得新词和所述词表中的词之间的相似度与近义词的权重的乘积作为新词的权重;将所述新词和所述新词的权重并列添加在所述有限状态转移机中的近似词处,获得更新后的有限状态转移机图。为了解决上述问题,本申请还公开了一种语音识别的装置,包括:转换模块,用于将语言模型表示为有限状态转移机;近义词模块,用于待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词;更新模块,用于将所述近似词添加到所述有限状态转移机,获得更新后的有限状态转移机,使用所述更新后的有限状态转移机进行语音识别。优选的,近义词模块包括:配置子模块,用于根据静态配置获得新词对应的近义词。优选的,近义词模块包括:第一映射子模块,用于将所述新词映射到向量空间,获得第一向量;第二映射子模块,用于将语言模型的词表中的词映射到向量空间,获得第二向量;词间距离子模块,用于根据所述第一向量和所述第二向量利用余弦距离公式,获得新词和所述词表中的词之间的相似度;确定子模块,用于将所述相似度高的所述词表中的词确定为新词对应的近义词。优选的,所述更新模块具体用于:将所述获得新词和所述词表中的词之间的相似度与近义词的权重的乘积作为新词的权重;将所述新词和所述新词的权重并列添加在所述有限状态转移机中的近似词处,获得更新后的有限状态转移机。与现有技术相比,本申请包括以下优点:本申请通过将待识别的新词根据设定规则在有限状态转移机上获得所述新词对应的近义词,将所述近似词添加到所述有限状态转移机,获得更新后的有限状态转移机,使用所述更新后的有限状态转移机进行语音识别从而避免了重新训练语言模型,并且在不改变语言模型的前提下完成了对新词的识别和新词的添加,提高了识别效率。当然,实施本申请的任一产品不一定需要同时达到以上所述的所有优点。附图说明图1是本申请实施例所述一种语音识别方法的流程图;图2是本申请实施例将语言模型转换为有限状态转移机的示意图;图3是本申请实施例所述一种语音识别方法的流程图;图4是本申请实施例更新后有限状态转移机的示意图;图5是本申请实施例所述一种语音识别装置的结构框图;图6本申请实施例所述一种语音识别装置的结构框图。具体实施方式为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。参照图1,其示出了本申请实施例所述一种语音识别方法的流程图,该方法包括:步骤101:将语言模型表示为有限状态转移机。语言模型中包括:词语和该词语的概率,将词语和该词语的概率表示为有限状态转移。例如:语言模型中的词语为A,A的概率为1/A,词语B,B的概率为1/B,则转换的有限状态转移,如图2所示,有限状态转移机仅仅是示例,在实际应用中可以有多个输出结果,获得的有限状态转移机也不同,对此本申请不做具体限制。步骤102:待识别的新词根据设定规则在所述有限状态转移机FST上获得所述新词对应的近义词。待识别的新词可以理解为新生的词汇,也可以理解为在语言模型词表中不存在的词语。待识别的新词以列表的形式进行保存,可以根据列表中存储新词获得新词对应的近义词,该近义词也可以采用列表的形式进行保存,也可以采用其他方式,对此本申请不做具体限制。步骤103:将所述新词添加到所述有限状态转移机,获得更新后的有限状态转移机,使用所述更新后的有限状态转移机进行语音识别。本实施例,通过将待识别的新词根据设定规则在有限状态转移机上获得所述新词对应的近义词,将所述近似词添加到所述有限状态转移机,获得更新后的有限状态转移机,使用所述更新后的有限状态转移机进行语音识别从而避免了重新训练语言模型,并且在不改变语言模型的前提下完成了对新词的识别和新词的添加,提高了识别效率。参照图3,其示出了本申请实施例所述一种语音识别方法的流程图,该方法包括:步骤301:将语言模型表示为有限状态转移机。步骤302:根据静态配置获得新词对应的近义词。静态配置获取新词对应的近义词,即静态配置也可以理解为人工定义获取新词对应的近义词,人工定义,可以充分利用人的知识,比较精确获取新词对应的近似词,但是繁琐,效率低,目前人工定义主要适用于小规模新词加入。新词对应的近义词可以为一个或者多个,若为多个,可以人工选择最接近的词作为新词对应的近义词。设有一个新词集X={x1,x2…,xm},对于每一个xi∈X,都有一个近义词集Si={y1,y2…,yn}。对任意一个yj∈Si,在FST中寻找所为标注为yj的边,并在yj的边旁并列的加上xi。在基线系统中,近义词集和近义词权重值均由人工确定。作为其中一种实现方式,所述待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词的步骤包括:将所述新词映射到向量空间,获得第一向量。新词具有新词集,将新词映射到向量空间,获得多个第一向量。将语言模型的词表中的词映射到向量空间,获得第二向量。根据所述第一向量和所述第二向量利用余弦距离公式,获得新词和所述词表中的词之间的相似度。对新词和词表中的词之间的相似度进行排序,例如从大到小的顺序排列或者按照从小到大的顺序进行排列,将词表中的词相似度高的词确定为新词对应的近义词。将所述相似度高的所述词表中的词确定为新词对应的近义词。通过将映射到向量空间,利用词向量空间的方式增加新词的加入解决了手动加入新词效率低的问题,同时也适用于大规模新词加入。步骤303:将所述本文档来自技高网...
一种语音识别的方法和装置

【技术保护点】
一种语音识别的方法,其特征在于,包括:将语言模型表示为有限状态转移机;待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词;将所述新词添加到所述有限状态转移机,获得更新后的有限状态转移机,使用所述更新后的有限状态转移机进行语音识别。

【技术特征摘要】
1.一种语音识别的方法,其特征在于,包括:将语言模型表示为有限状态转移机;待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词;将所述新词添加到所述有限状态转移机,获得更新后的有限状态转移机,使用所述更新后的有限状态转移机进行语音识别。2.根据权利要求1所述的方法,其特征在于,所述待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词的步骤包括:根据静态配置获得新词对应的近义词。3.根据权利要求1所述的方法,其特征在于,所述待识别的新词根据设定规则在所述有限状态转移机上获得所述新词对应的近义词的步骤包括:将所述新词映射到向量空间,获得第一向量;将语言模型词表中的词映射到向量空间,获得第二向量;根据所述第一向量和所述第二向量利用余弦距离公式,获得新词和所述词表中的词之间的相似度;将所述相似度高的所述词表中的词确定为新词对应的近义词。4.根据权利要求3所述的方法,其特征在于,所述将所述近似词添加到所述有限状态转移机,获得更新后的有限状态转移机的步骤包括:将所述获得新词和所述词表中的词之间的相似度与近义词的权重的乘积作为新词的权重;将所述新词和所述新词的权重并列添加在所述有限状态转移机中的近似词处...

【专利技术属性】
技术研发人员:王东马习张之勇张雪薇张玥
申请(专利权)人:清华大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1