【技术实现步骤摘要】
【国外来华专利技术】用于使用语法模型执行话音识别的方法和设备
本专利技术涉及一种用于使用语言模型来执行语音识别的方法和设备。
技术介绍
语音识别是一种用于从用户接收语音的输入、将语音自动地转换成文本、并且识别该文本的技术。最近,语音识别被用作一种用于替代用于智能电话或者TV的键盘输入的接口技术。语音识别系统可以包括用于接收话音信号的客户端和用于从话音信号中识别语音的自动语音识别(automaticspeechrecognition,ASR)引擎,其中客户端和ASR引擎可以被独立地设计。一般地,语音识别系统可以通过使用声学模型、语言模型和发音字典来执行语音识别。有必要预先为语音识别系统建立关于预定字的语言模型和发音字典,以从话音信号中语音识别出预定字。
技术实现思路
技术方案本专利技术提供了一种用于使用语言模型执行语音识别的方法和设备,并且更具体地,提供了一种用于为新字的语音识别建立语言模型和针对包括新字的语音执行语音识别的方法和装置。有益效果根据以上示例性实施例中的一个或者更多,可以通过更新包括相对小数量的概率的语言模型而不是更新包括相对大数量的概率的语言模型来最小化用于更新语言模型所消 ...
【技术保护点】
一种更新包括用于语音识别的语言模型的语音识别数据的方法,所述方法包括:获取包括至少一个字的语言数据;从所述至少一个字当中检测不存在于所述语言模型中的字;获取关于检测到的字的至少一个音素序列;通过将所述至少一个音素序列划分成预定单元分量来获取构成所述至少一个音素序列的分量;确定关于在所述语音识别期间构成所述至少一个音素序列中的每一个的各个分量出现的概率的信息;以及基于所确定的概率信息来更新所述语言模型。
【技术特征摘要】
【国外来华专利技术】1.一种更新包括用于语音识别的语言模型的语音识别数据的方法,所述方法包括:获取包括至少一个字的语言数据;从所述至少一个字当中检测不存在于所述语言模型中的字;获取关于检测到的字的至少一个音素序列;通过将所述至少一个音素序列划分成预定单元分量来获取构成所述至少一个音素序列的分量;确定关于在所述语音识别期间构成所述至少一个音素序列中的每一个的各个分量出现的概率的信息;以及基于所确定的概率信息来更新所述语言模型。2.如权利要求1所述的方法,其中,所述语言模型包括第一语言模型和包括至少一个语言模型的第二语言模型,并且所述语言模型的更新包括基于所述所确定的概率信息更新第二语言模型。3.如权利要求2所述的方法,进一步包括:基于包括在所述第二语言模型中的至少一个出现概率信息来更新所述第一语言模型;以及基于所述检测到的字的所述至少一个音素序列来更新包括关于字的音素序列的信息的发音字典。4.如权利要求1所述的方法,其中,所述出现概率信息包括关于在字或者另一分量在所述分量之前出现的条件下,相应的分量中的每一个的出现概率的信息。5.如权利要求1所述的方法,其中,确定所述出现概率信息包括:获取关于与所述检测到的字相对应的周围情形的情形信息;以及基于所述情形信息,选择要添加关于所述检测到的字的出现概率信息的语言模型。6.如权利要求5所述的方法,其中,所述语言模型的更新包括基于所确定的出现概率信息来更新关于与所述情形信息相对应的模块的第二语言模型。7.一种执行语音识别的方法,所述方法包括:获取用于执行语音识别的语音数据;从所述语音数据中获取至少一个音素序列;获取关于在所述语音识别期间构成所述至少一个音素序列的预定单元分量出现的概率的信息;基于关于在所述语音识别期间所述预定单元分量出现的概率的信息来确定所述至少一个音素序列中的一个;以及基于用于将包括在所述所确定的音素序列中的所述预定单元分量转换成字的分段信息,来获取与所述所确定的音素序列相对应的字。8.如权利要求7所述的方法,其中,所述至少一个音素序列的获取包括获取以下各项:音素序列,对于该音素序列而言,关于与该音素序列相对应的字的信息存在于包括关于字的音素序列的信息的发音字典中的音素序列;以及音素序列,对于该音素序列而言,关于与该音素序列相对应的字的信息不存在于所述发音字典中的音素序列。9.如权利要求7所述的方法,其中,关于所述分量的出现概率信息的获取包括:确定包括关于所述分量的出现概率信息的多个语言模型;确定针对所述多个所确定的语言模型的权重;从所述多个语言模型中获取关于所述分量的至少一个出现概率信...
【专利技术属性】
技术研发人员:朴致衍,金逸桓,李暻慜,金南勋,李在原,
申请(专利权)人:三星电子株式会社,
类型:发明
国别省市:韩国,KR
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。