【技术实现步骤摘要】
本专利技术涉及自动语音识别
,是一种基于统计语言模型、结合语法规则、面向口 语识别应用的语音识别方法。
技术介绍
信息系统或控制系统越来越多地应用语音界面来与用户进行快速和直接的交互作用,由 于这些系统的功能正在变得越来越复杂,所需的对话方式也变得更丰富,人们正在进入大词 汇量口语连续语音识别的领域。大词汇量连续语音识别系统的设计都需要产生一个语言模型,它确定一个词汇序列可能 的概率。对于口语识别而言,这种语言模型必须能再现系统用户通常使用的讲话样式反复、无 关插入语、集外词或模糊发音。所用语言模型的质量极大地影响语音识别的准确率。这种质量通常是用语言模型的困惑 度指标来衡量,在原理上,该指标表示选择的数目,这种选择是系统对每一被解码的词必须 做的。这一指标越低,质量越高。语言模型需要把发音单元序列转换成词的文本串,这是X寸话系统常用的步骤。然后,需 要构建一种能理解的逻辑关系,使能理解口头的提问,从而作出回答。有两种产生大词汇语言模型的标准方法1) 基于N元语法的统计语言模型,最常用的双语法或三语法,其要点是,假定一个 词在句中的出现概率仅仅与前面的(N ...
【技术保护点】
基于统计模型和语法规则的口语语音识别方法,具体是一种基于统计语言模型、结合语法规则、面向口语识别应用的语音识别方法。本专利技术由声学模型训练、语言模型训练、前端处理、及识别解码四个部分组成。其特征在于:语言模型以N元语法统计模型为基础,辅以语法规则网络,用以处理口语中常见的集外词、口头禅、模糊发音、语句快速切换等现象。 定义符号:SENT表示一个句子,NGram表示N元语法统计模型,WORD表示词,WORDCLASS表示词类,GB表示垃圾词过滤模型,FzPr表示模糊发音过滤 模型,FvPh表示口头禅过滤模型,OOV表示集外词模型。 以下是用BNF语法定义的语法规则 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:王辉,
申请(专利权)人:北京森博克智能科技有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。