【技术实现步骤摘要】
一种建立语言模型的方法、 语音识别的方法及其装置
本专利技术涉及自然语言处理技术,特别涉及一种建立语言模型的方法、语音识别的方法及其装置。
技术介绍
随着搜索引擎技术和移动通讯技术的发展,如今采用语音搜索的方式获取信息已经变得非常普遍。语音搜索不需要人们通过文字输入即可发出搜索请求,使得人们能够在运动状态时也轻易获取相关信息,给人们的生活带来了极大的便利。语音搜索中,首先需要对用户的语音进行识别,只有准确地将用户的语音表述识别成一致的语义文本,才能向用户返回准确的检索结果。而语音识别的结果依赖于在语音识别中使用的语言模型,现有的语音搜索中的语音识别系统,使用的语言模型一旦被训练好,其中的参数通常不再改变,这样的语言模型难以反映用户检索行为的变化,因此在面对用户对一些热点事件的语音搜索行为时,容易出现识别结果不准确的现象。例如现实生活中突发的某种事件,常被用户冠名为“某某门”,这种“某某门”的搜索词由于过去从来没出现过,在现有的语言模型中出现的概率很低,因此最终语音识别系统对这种搜索词的识别率就会降低。
技术实现思路
本专利技术所要解决的技术问题是提供一种建立语言模型的 ...
【技术保护点】
【技术特征摘要】
1.一种建立语言模型的方法,其特征在于,所述方法包括 获取时效性搜索语料; 利用获取到的时效性搜索语料进行语言模型训练,以得到时效性语言模型; 将所述时效性语言模型与背景语言模型融合,以得到最终的识别语言模型,其中所述背景语言模型用于描述用户的长期检索行为。2.根据权利要求I所述的方法,其特征在于,所述背景语言模型为已有的识别语言模型。3.根据权利要求I所述的方法,其特征在于,获取时效性搜索语料的步骤包括 从搜索引擎服务器上获取最近的设定时间长度内的检索日志并将获取的检索日志作为时效性搜索语料;或者, 将在最近的设定时间长度内对用户的语音搜索查询的识别结果作为时效性搜索语料。4.根据权利要求I所述的方法,其特征在于,在将所述时效性语言模型与所述背景语言模型融合时,将所述时效性语言模型中的参数与所述背景语言模型中的参数进行插值,以得到所述识别语言模型中的参数,其中所述参数为各N元词组N-Gram的概率值。5.根据权利要求4所述的方法,其特征在于,将所述时效性语言模型中的参数与所述背景语言模型中的参数进行插值时,对所述时效性语言模型中的参数进行加权。6.一种语音识别的方法,其特征在于,所述方法包括 获取用户的语音搜索查询; 使用权利要求I至5中任一权项所述建立语言模型的方法建立的识别语言模型对用户的语音搜索查询进行识别,得到识别结果。7.根据权利要求6所述的方法,其特征在于,所述方法进一步包括 向用户返回与所述识别结果相关的检索结果。8.根据权利要求6所述的方法,其特征在于,对用户的语音搜索查询进行识别的步骤包括 利用声学模型将用户的语音搜索查询转化为相应的音节序列; 获取与所述音节序列对应的一个以上的候选词序列; 使用所述识别语言模型计算每个候选词序列在所述识别语言模型中出现的概率,并选择出现概率最大的候选词序列作为对用户的语音搜索查询的识别结果。9.一种建立语言模型的装置,其特征在于,所述装置包括 获取单...
【专利技术属性】
技术研发人员:万广鲁,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。