一种建立用于语音识别的语言模型的方法及装置制造方法及图纸

技术编号:8883682 阅读:226 留言:0更新日期:2013-07-04 02:25
本发明专利技术提供了一种建立用于语音识别的语言模型的方法及装置,其中所述方法包括:A.将对用户的语音搜索查询进行识别的结果作为语音搜索语料进行语言模型训练,得到语音语言模型;以及,将用户的文本搜索查询作为文本搜索语料进行语言模型训练,得到文本语言模型;B.将所述语音语言模型与所述文本语言模型融合,得到识别语言模型。通过上述方式得到的识别语言模型,能够很好地反映用户语音输入时的用词偏好,将该识别语言模型应用于语音识别中可以提高语音识别的精度。

【技术实现步骤摘要】
—种建立用于语音识别的语言模型的方法及装置
本专利技术涉及语音识别技术,特别涉及一种建立用于语音识别的语言模型的方法及装置。
技术介绍
搜索引擎大大改变了人们获取信息的方式,已经越来越成为人们生活中不可或缺的部分。近年来,随着语音识别技术的发展,语音搜索成了一种更为便捷的搜索方式。人们通过移动终端输入语音搜索请求,就可以从搜索引擎服务器得到满足自己需求的搜索结果O语音搜索依赖语音识别技术,只有正确对用户的语音输入进行识别,才能返回用户想要查找的信息。语音识别的效果取决于语音识别中使用的声学模型及语言模型。声学模型在语音识别中应用于语音到音节概率的计算,而语言模型在语音识别中应用于音节到字概率的计算。语言模型是描述词语概率分布的模型,一个能可靠反映用户语音搜索时用词的概率分布的语言模型,是语音搜索系统取得可靠结果的关键。由于语言模型中词语的概率分布取决于训练该语言模型时使用的语料,因此,获取与用户语音搜索时用词习惯一致的训练语料非常重要。在现有技术中,通常采用两种方法获取训练语料,第一种是人工标注用户在语音搜索时的查询请求并将标注后的查询请求作为训练语料,这种方式的缺点是成本很高,也很难获取到足够数量的语料,另一种方式是直接将用户以文字输入的查询请求作为训练语料,这种方式的缺点是由于用户使用语音输入方式发出搜索请求时的用词与使用文字输入方式发出搜索请求时的用词相比存在差异,这种方式得到的语言模型,很难反映用户使用语音搜索时用词的偏好,将这样的语言模型应用于语音识别中,就会降低语音识别的精度。
技术实现思路
本专利技术所要解决的技术问题是提供一种建立用于语音识别的语言模型的方法及装置,以解决现有技术的语言模型难以反映用户在语音表述时的用词习惯从而影响语音识别精度的缺陷。本专利技术为解决技术问题而采用的技术方案是提供一种建立用于语音识别的语言模型的方法,包括:Α.将对用户的语音搜索查询进行识别的结果作为语音搜索语料进行语言模型训练,得到语音语言模型;以及,将用户的文本搜索查询作为文本搜索语料进行语言模型训练,得到文本语言模型;Β.将所述语音语言模型与所述文本语言模型融合,得到识别语目模型。根据本专利技术之一优选实施例,所述步骤A中,使用初始的识别语言模型对用户的语音搜索查询进行识别。根据本专利技术之一优选实施例,所述步骤B中,将所述语音语言模型与所述文本语言模型融合时,将所述语音语言模型中的参数与所述文本语言模型中的参数进行插值,以得到所述识别语言模型中的参数。根据本专利技术之一优选实施例,将所述语音语言模型与所述文本语言模型中的参数进行插值时,对所述语音语言模型或所述文本语言模型中的参数进行加权。根据本专利技术之一优选实施例,所述方法进一步包括:使用所述识别语言模型对用户的语音搜索查询进行识别,得到识别结果。根据本专利技术之一优选实施例,所述方法进一步包括:将所述识别结果作为新增加的语音搜索语料进行语言模型训练,以更新所述语音语言模型,并返回所述步骤B。根据本专利技术之一优选实施例,使用识别语言模型对用户的语音搜索查询进行识别的步骤包括:根据用户的语音搜索查询建立多个候选词序列;使用识别语言模型计算每个候选词序列在识别语言模型中出现的概率,并选择出现概率最大的候选词序列作为对用户的语音搜索查询的识别结果。8、根据权利要求5所述的方法,其特征在于,所述方法进一步包括:向用户返回与所述识别结果相关的检索结果。本专利技术还提供了一种建立识别语音模型的装置,包括:第一训练单元,用于将对用户的语音搜索查询进行识别的结果作为语音搜索语料进行语言模型训练,得到语音语言模型;第二训练单元,用于将用户的文本搜索查询作为文本搜索语料进行语言模型训练,得到文本语言模型;融合单元,用于将所述语音语言模型与所述文本语言模型融合,得到识别语目模型。根据本专利技术之一优选实施例,所述第一训练单元进行语言模型训练时使用的语音搜索语料是使用初始的识别语言模型对用户的语音搜索查询进行识别后得到的。根据本专利技术之一优选实施例,所述融合单元将所述语音语言模型与所述文本语言模型融合时,对所述语音语言模型和所述文本语言模型中的参数进行插值,以得到所述识别语言模型中的参数。根据本专利技术之一优选实施例,所述融合单元对所述语音语言模型和文本语言模型中的参数进行插值时,对所述语音语言模型或所述文本语言模型中的参数进行加权。根据本专利技术之一优选实施例,所述装置进一步包括:识别单元,用于使用所述识别语言模型对用户的语音搜索查询进行识别,得到识别结果。根据本专利技术之一优选实施例,所述识别单元将得到的识别结果提供给所述第一训练单元,供所述第一训练单元将所述识别结果作为新增加的语音搜索语料进行语言模型训练,以更新所述语音语言模型。根据本专利技术之一优选实施例,所述识别单元包括:词序列单元,用于根据用户的语音搜索查询建立多个候选词序列;计算单元,用于使用所述识别语言模型计算每个候选词序列在所述识别语言模型中出现的概率,并选择出现概率最大的候选词序列作为对用户的语音搜索查询的识别结果。根据本专利技术之一优选实施例,所述装置进一步包括:检索单元,用于向用户返回与所述识别结果相关的检索结果。由以上技术方案可以看出,通过将语音识别结果作为语料进行语言模型训练,并将语音识别结果训练的语言模型与文本语料训练的语言模型融合得到的识别语言模型,能够很好地反映用户语音输入时的用词偏好,将这样的识别语言模型应用于语音识别中,可以提闻语首识别的精度。附图说明图1为本专利技术中建立用于语音识别的语言模型的方法的实施例的流程示意图;图2为本专利技术中获取语音搜索语料及文本搜索语料的实施例的示意图;图3为本专利技术中词图的实施例的示意图;图4为本专利技术中建立用于语音识别的语言模型的装置的实施例的结构示意框图;图5为本专利技术中识别单元的实施例的结构示意框图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本专利技术进行详细描述。请参考图1,图1为本专利技术中建立用于语音识别的语言模型的方法的实施例的流程示意图。如图1所示,该方法包括:SlOl:将对用户的语音搜索查询进行识别的结果作为语音搜索语料进行语言模型训练,得到语音语言模型;以及,将用户的文本搜索查询作为文本搜索语料进行语言模型训练,得到文本语言模型。S102:将语音语言模型与文本语言模型融合以得到识别语言模型。下面对上述步 骤进行具体说明。请参考图2,图2为步骤SlOl中获取语音搜索语料及文本搜索语料的实施例的示意图。如图2所示,用户在搜索时,可以通过文字输入或语音输入的方式进行。当用户利用键盘输入搜索请求,文本收集客户端就会将收集到的文本搜索请求通过网络发送到搜索引擎服务器,服务器中的日志记录装置在检索日志中记录用户通过键盘输入的搜索请求,该检索日志就可以作为本专利技术中的文本搜索语料。当用户通过移动终端(如手机)发出语音搜索请求时,语音收集客户端会将收集到的语音信号通过网络传递到搜索引擎服务器,搜索引擎服务器中的语音识别装置对用户的语音搜索请求进行识别后得到识别结果,该识别结果即可作为本专利技术中的语音搜索语料。在图2所示的获取语音搜索语料的实施例中,语音识别装置需要利用初始的识别语言模型对用户的语音搜索查询进行识别。本实施例中的初始的识别语言模型可以是一个现有的识别语言模型,也可以本文档来自技高网...

【技术保护点】
一种建立用于语音识别的语言模型的方法,其特征在于,该方法包括:A.将对用户的语音搜索查询进行识别的结果作为语音搜索语料进行语言模型训练,得到语音语言模型;以及,将用户的文本搜索查询作为文本搜索语料进行语言模型训练,得到文本语言模型;B.将所述语音语言模型与所述文本语言模型融合,得到识别语言模型。

【技术特征摘要】

【专利技术属性】
技术研发人员:万广鲁贾磊
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1