用于更新语言模型并执行语音识别的方法和装置制造方法及图纸

技术编号:14676910 阅读:84 留言:0更新日期:2017-02-19 02:54
公开了一种用于更新语言模型并执行语音识别的方法和装置。所述方法包括:获得包括至少一个单词的语料库;从语料库中获得所述至少一个单词;将所述至少一个获得的单词划分为至少一个音段(segment);产生用于将所述至少一个音段重新组合为所述至少一个单词的提示;使用包括所述提示的至少一个音段更新语法模型。

【技术实现步骤摘要】
本申请基于并要求于2015年7月28日提交到韩国知识产权局的第10-2015-0106772号韩国专利申请的优先权,其公开内容通过引用完全合并于此。
本公开涉及用于通过使用语言模型执行语音识别的方法和装置,例如,涉及用于使用语料库(corpus)更新语言模型的方法和装置。
技术介绍
语音识别是一种将接收到的用户语音输入自动转换为文本以便识别语音的技术。近年来,语音识别正被用作用于替代智能电话和电视机中的键盘输入的接口技术。语音识别系统可被划分为接收语音(speechsound)的客户机以及对语音执行语音识别的自动语音识别(ASR)引擎,并且可彼此独立设计所述两部分。一般而言,语音识别系统可通过使用声学模型、语法模型及发音词典执行语音识别。在语音识别系统中为了对来自语音的指定单词执行语音识别,有必要预先建立针对所述指定单词的语法模型和发音词典。
技术实现思路
提供用于更新语言模型以便对集外(OOV)单词(即,新的单词)执行语音识别并通过使用语言模型执行语音识别的方法和装置。附加的各方面将部分地在随后的描述中予以展示,部分地将从所述描述中变得清楚。根据示例实施例的一方面,一种更新在语音识别期间所使用的语法模型的方法包括:获得包括至少一个单词的语料库;从语料库中获得所述至少一个单词;将所述至少一个获得的单词划分为至少一个音段(segment);产生用于将所述至少一个音段重新组合为所述至少一个单词的提示;使用包括所述提示的至少一个音段更新语法模型。所述划分处理可包括:基于所述至少一个获得的单词的出现频率和长度中的一个或多个确定将被划分的单词;划分所述获得的单词。所述划分处理可包括:确定针对所述获得的单词的至少一个候选划分点;基于以每个候选划分点为基础的音段的出现概率信息获得每个候选划分点的分数;基于所述分数从所述至少一个候选划分点之中确定划分点;基于所述划分点将所述获得的单词划分为至少一个音段。所述划分处理可包括:基于所述至少一个音段以音段为单位划分在语料库中包括的单词。产生所述提示的步骤可包括:基于所述至少一个音段是否位于所述单词的边界产生针对所述至少一个音段的提示。所述语法模型的更新处理可包括:确定在语音识别期间所述至少一个音段的出现概率信息;基于所确定的出现概率信息更新语法模型。所述划分处理可包括:将所述至少一个获得的单词划分为音素、音节或词素的音段。所述方法可还包括:产生针对所述至少一个获得的单词的发音变体;从发音词典中包括的发音变体之中获得与所产生的发音变体相应的发音变体;确定在语音识别期间所获得的发音变体的出现概率信息;基于所确定的出现概率信息更新第二语法模型。所述语法模型的更新处理可包括:将进入令牌(entrytoken)添加到所述至少一个获得的单词或检测到的音段;基于包括所述进入令牌的所述至少一个获得的单词或检测到的音段更新基于类别的语法模型。所述语法模型的更新处理可包括:确定所述单词或音段所属的类别;确定是否将进入令牌或退出令牌(exittoken)添加到所述单词或音段;基于所述确定处理的结果将进入令牌或退出令牌添加到所述单词或音段;基于所述单词或音段更新所确定的类别的语法模型。根据另一示例实施例的一方面,一种执行语音识别的方法包括:获得用于执行语音识别的语音数据;通过基于包括至少一个音段的出现概率信息的语法模型执行语音识别来检测所述至少一个音段;基于检测到的音段的提示将检测到的音段重新组合为单词。所述方法可还包括:执行语音识别,使得当所述单词或检测到的音段属于第一顺序的单词时可基于第二语法模型按照指定顺序检测所述单词。所述语法模型可包括基于类别的语法模型,并且所述方法可包括:当所述单词或检测到的音段包括进入令牌时,基于进入令牌所属的类别的语法模型执行语音识别;当所述单词或音段包括退出令牌时,以基于类别的语法模型为基础执行语音识别。根据另一示例实施例的一方面,一种用于更新语法模型的装置包括:接收器,被配置为获得包括至少一个单词的语料库;存储器,被配置为存储语法模型;控制器,被配置为从语料库中获得至少一个单词,将所述至少一个获得的单词划分为至少一个音段,产生用于将所述至少一个音段重新组合为所述至少一个单词的提示,使用包括所述提示的至少一个音段更新语法模型。根据另一示例实施例的一方面,一种用于执行语音识别的装置包括:接收器,被配置为获得用于执行语音识别的语音数据;存储器,被配置为存储包括至少一个音段的出现概率信息的语法模型;控制器,被配置为通过基于包括至少一个音段的出现概率信息的语法模型执行语音识别来检测所述至少一个音段;基于检测到的音段的提示将所确定的音段重新组合为所述单词。附图说明从以下结合附图的详细描述中,这些和/或其它方面将变得清楚且更容易理解,其中,同样的附图标号指示同样的元件,其中:图1是示出用于执行语音识别的示例装置的框图;图2是示出更新语法模型并使用更新后的语法模型执行语音识别的示例处理的框图;图3是示出更新语法模型的示例方法的流程图;图4是示出根据单词出现频率和单词长度的单词的示例的曲线图;图5是示出示例单词划分顺序的曲线图;图6是示出单词划分的示例的示图;图7是示出执行语音识别的示例方法的流程图;图8是示出从语音数据中包括的单词之中检测集外(OOV)单词并基于检测到的OOV单词更新语法模型的处理的示例的示图;图9是示出更新语法模型的示例方法的流程图;图10是示出更新第二语法模型的示例方法的流程图;图11是示出执行语音识别的示例处理的示图;图12是示出执行语音识别的示例方法的流程图;图13是示出执行语音识别的示例处理的示图;图14是示出语音识别器的示例内部配置的框图;图15是示出基于指定单词顺序执行语音识别的示例处理的流程图;图16是示出基于所确定的顺序执行语音识别的示例处理的示图;图17是示出基于单词所属的类别(class)执行语音识别的语音识别器的示例内部配置的框图;图18是示出更新基于类别的语法模型的示例方法的流程图;图19是示出按照类别更新语法模型的示例方法的流程图;图20是示出使用基于类别的语法模型以及按照类别的语法模型执行语音识别的示例处理的示图;图21是示出基于单词所属的类别执行语音识别的示例方法的流程图;图22是示出用于更新语法模型的装置的示例内部配置的框图;图23是示出语音识别装置的示例内部配置的框图。具体实施方式现在将更详细地参照在附图中示出其示例的示例实施例,其中,同样的附图标号始终指示同样的元件。就此而言,本示例实施例可具有不同形式并且不应理解为限于在此展示的描述。因此,仅通过参照附图在下文描述示例实施例以解释各方面。当诸如“…中的至少一个”的表述位于一列元件之后时,该表述修饰整列元件而非修饰所述列中的单个元件。简要描述在本公开中使用的术语并且将更详细地描述本构思。在本公开中使用的术语是通过考虑在本公开中的功能而从当前被广泛使用的普通术语中所选择的术语。然而,所述术语可根据工程师的意图、法律先例或新技术的出现而变化。另外,针对特殊情况,可任意地选择术语,其中,将在说明书部分中详细描述所选择的术语的含义。因此,基于术语的含义和贯穿本公开所讨论的内容限定在本公开中使用的术语,不一定通过其简单含义限定所述术语。如在本公开中所使用,术语“和/或”包本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/21/201610604984.html" title="用于更新语言模型并执行语音识别的方法和装置原文来自X技术">用于更新语言模型并执行语音识别的方法和装置</a>

【技术保护点】
一种更新在语音识别期间所使用的语法模型的方法,所述方法包括:获得包括至少一个单词的语料库;从语料库中获得至少一个单词;将获得的至少一个单词划分为至少一个音段;产生用于将所述至少一个音段重新组合为所述至少一个单词的提示;以及使用包括所述提示的至少一个音段更新语法模型。

【技术特征摘要】
2015.07.28 KR 10-2015-01067721.一种更新在语音识别期间所使用的语法模型的方法,所述方法包括:获得包括至少一个单词的语料库;从语料库中获得至少一个单词;将获得的至少一个单词划分为至少一个音段;产生用于将所述至少一个音段重新组合为所述至少一个单词的提示;以及使用包括所述提示的至少一个音段更新语法模型。2.如权利要求1所述的方法,其中,划分步骤包括:基于获得的至少一个单词的出现频率和长度中的一个或更多个确定将被划分的单词;划分确定的单词。3.如权利要求1所述的方法,其中,划分步骤包括:针对获得的至少一个单词确定至少一个候选划分点;基于以每个候选划分点为基础的音段的出现概率信息获得每个候选划分点的分数;以及基于所述分数从所述至少一个候选划分点之中确定划分点并基于所述划分点将获得的单词划分为至少一个音段。4.如权利要求1所述的方法,其中,划分步骤包括:基于所述至少一个音段以音段为单位划分获得的至少一个单词。5.如权利要求1所述的方法,其中,产生提示的步骤包括:基于所述至少一个音段是否位于单词的边界来产生针对所述至少一个音段的提示。6.如权利要求1所述的方法,其中,更新语法模型的步骤包括:将进入令牌添加到获得的至少一个单词或划分的音段;基于包括进入令牌的获得的至少一个单词或划分的音段更新基于类别的语法模型。7.如权利要求6所述的方法,其中,更新语法模型的步骤包括:确定单词或音段所属的类别;确定是否将进入令牌或退出令牌添加到单词或音段并基于确定的结果将进入令牌或退出令牌添加到所述单词或音段;以及基于单词或音段更新所确定的类别的语法模型。8.一种执行语音识别的方法,所述方法包括:获得用于执行语音识别的语音数据;通过基于包括语音数据的至少一个音段的出现概率信息的语法模型执行语音识别来检测所述至少一个音段;以及基于检测到的音段的提示将检测到的音段重新组合为单词。9.如权利要求8所述的方法,还包括:执行语...

【专利技术属性】
技术研发人员:安桐薰朴致衍李暻慜李在原
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国;KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1