一种领域词的语音识别增强方法和装置制造方法及图纸

技术编号:20428530 阅读:48 留言:0更新日期:2019-02-23 09:41
本发明专利技术涉及一种领域词的语音识别增强方法和装置,所述方法包括:通过收集的文本语料数据,训练生成第一语言模型;将所述第一语言模型转换为第一解码图;获取所述领域词与所述文本语料数据的相似度;通过所述第一解码图和所述相似度,计算出与所述领域词相对应的第二语言模型;根据所述第二语言模块对所述第一解码图进行扩展,得到包含所述领域词信息的第二解码图;利用所述第二解码图对用户输入的语音进行语音识别处理。本发明专利技术所述的方法处理过程简单,通过对领域词权重增强和扩展,提高了对未出现的领域词和信息较少领域词在语音识别中的识别准确率,有利于提高用户体验,也有利于语音识别在更多领域的应用。

【技术实现步骤摘要】
一种领域词的语音识别增强方法和装置
本专利技术涉及语音识别
,具体涉及一种领域词的语音识别增强方法和装置。
技术介绍
近年来,随着大规模连续语音识别技术的发展,语音识别技术被运用在越来越多的应用场景上。随着应用场景的增多,用户对语音识别系统在不同领域上的领域词识别准确率要求越来越高。现有技术中存在对领域词识别增强的方法,现有增强方法主要是采用基于类别的语言模型来解决领域词识别的问题,即将领域词预先划入不同的类别,比如可以将领域词划为歌名类、电器类、食品类等等,通过类别替换获取该类别内的领域语料,并训练得到类别语言模型,从而实现对领域词的识别。然而这种方法需要提前确定领域词的类别,处理过程较复杂,且对于那些不属于任一类别的领域词无法建模,无法进行识别,大大影响了用户体验。
技术实现思路
有鉴于此,本专利技术的目的在于克服现有技术的不足,提供一种领域词的语音识别增强方法和装置。为实现以上目的,本专利技术采用如下技术方案:一种领域词的语音识别增强方法,包括:通过收集的文本语料数据,训练生成第一语言模型;将所述第一语言模型转换为第一解码图;获取所述领域词与所述文本语料数据的相似度;通过所述本文档来自技高网...

【技术保护点】
1.一种领域词的语音识别增强方法,其特征在于,包括:通过收集的文本语料数据,训练生成第一语言模型;将所述第一语言模型转换为第一解码图;获取所述领域词与所述文本语料数据的相似度;通过所述第一解码图和所述相似度,计算出与所述领域词相对应的第二语言模型;根据所述第二语言模块对所述第一解码图进行扩展,得到包含所述领域词信息的第二解码图;利用所述第二解码图对用户输入的语音进行语音识别处理。

【技术特征摘要】
1.一种领域词的语音识别增强方法,其特征在于,包括:通过收集的文本语料数据,训练生成第一语言模型;将所述第一语言模型转换为第一解码图;获取所述领域词与所述文本语料数据的相似度;通过所述第一解码图和所述相似度,计算出与所述领域词相对应的第二语言模型;根据所述第二语言模块对所述第一解码图进行扩展,得到包含所述领域词信息的第二解码图;利用所述第二解码图对用户输入的语音进行语音识别处理。2.根据权利要求1所述的方法,其特征在于,所述通过收集的文本语料数据,训练生成第一语言模型,包括:对所述文本语料数据进行清洗,过滤掉特殊字符;将清洗后得到的数据进行分词处理;对分词处理后的数据进行n元词频统计;根据n元词频统计的结果生成第一语言模型。3.根据权利要求1所述的方法,其特征在于,所述第一解码图为FST图模型;所述将所述第一语言模型转换为第一解码图是通过openFST转换工具实现的。4.根据权利要求1所述的方法,其特征在于,所述获取所述领域词与所述文本语料数据的相似度,包括:对所述文本语料数据进行预处理,以去除掉特殊字符;对所述文本语料数据进行分词处理;分别获取所述领域词和分词处理后的词语的词向量;计算所述领域词的词向量与所述文本语料分词处理后的词向量的相似距离。5.根据权利要求1至4任一项所述的方法,其特征在于,所述通过所述第一解码图和所述相似度,计算出与所述领域词相对应的第二语言模型,包括:获取所述第一解码图中,现有领域词w2的概率信息;通过所述现有领域词w2的概率信息增强领域词w1相对应的第二语言模型信息,具体处理过程包括:遍历领域词w2在第一解码图中的概率信息,p(w2|c1),p(w2|c2)…p(w2|cn);根据领域词w2的概率信息,计算领域词w1在上下文cn上的概率信息,具体计算公式为:p(w1|cn)=sim(w1,w2)*p(w2|cn)*alpha其中,alpha为可调节权重,p(w2|cn)表示领域词w2在各个上下文的概率信息,sim(w1,w2)表示领域词w1与领域词w2的相似度。6.一种领域词的语音识别增强装置,其特征在于,包括:第一语言模型生成模块,用于通过收集的文本语料数据,训练生成第一语言模型;模型转换模块,用于将所述第一语言模型转换为第一解码图;相似度获取模块,用于获取所述领域词与...

【专利技术属性】
技术研发人员:张明关磊王东刘荣
申请(专利权)人:北京分音塔科技有限公司清华大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1