用于更新语言模型并执行语音识别的方法和装置制造方法及图纸

技术编号：14676910 阅读：84 留言：0更新日期：2017-02-19 02:54

公开了一种用于更新语言模型并执行语音识别的方法和装置。所述方法包括：获得包括至少一个单词的语料库；从语料库中获得所述至少一个单词；将所述至少一个获得的单词划分为至少一个音段(segment)；产生用于将所述至少一个音段重新组合为所述至少一个单词的提示；使用包括所述提示的至少一个音段更新语法模型。

全部详细技术资料下载

【技术实现步骤摘要】
本申请基于并要求于2015年7月28日提交到韩国知识产权局的第10-2015-0106772号韩国专利申请的优先权，其公开内容通过引用完全合并于此。
本公开涉及用于通过使用语言模型执行语音识别的方法和装置，例如，涉及用于使用语料库(corpus)更新语言模型的方法和装置。
技术介绍
语音识别是一种将接收到的用户语音输入自动转换为文本以便识别语音的技术。近年来，语音识别正被用作用于替代智能电话和电视机中的键盘输入的接口技术。语音识别系统可被划分为接收语音(speechsound)的客户机以及对语音执行语音识别的自动语音识别(ASR)引擎，并且可彼此独立设计所述两部分。一般而言，语音识别系统可通过使用声学模型、语法模型及发音词典执行语音识别。在语音识别系统中为了对来自语音的指定单词执行语音识别，有必要预先建立针对所述指定单词的语法模型和发音词典。
技术实现思路
提供用于更新语言模型以便对集外(OOV)单词(即，新的单词)执行语音识别并通过使用语言模型执行语音识别的方法和装置。附加的各方面将部分地在随后的描述中予以展示，部分地将从所述描述中变得清楚。根据示例实施例的一方面，一种更新在语音识别期间所使用的语法模型的方法包括：获得包括至少一个单词的语料库；从语料库中获得所述至少一个单词；将所述至少一个获得的单词划分为至少一个音段(segment)；产生用于将所述至少一个音段重新组合为所述至少一个单词的提示；使用包括所述提示的至少一个音段更新语法模型。所述划分处理可包括：基于所述至少一个获得的单词的出现频率和长度中的一个或多个确定将被划分的单词；划分所述获得的单词。所述划...
<a href="http://www.xjishu.com/zhuanli/21/201610604984.html" title="用于更新语言模型并执行语音识别的方法和装置原文来自X技术">用于更新语言模型并执行语音识别的方法和装置</a>

【技术保护点】
一种更新在语音识别期间所使用的语法模型的方法，所述方法包括：获得包括至少一个单词的语料库；从语料库中获得至少一个单词；将获得的至少一个单词划分为至少一个音段；产生用于将所述至少一个音段重新组合为所述至少一个单词的提示；以及使用包括所述提示的至少一个音段更新语法模型。

【技术特征摘要】
2015.07.28 KR 10-2015-01067721.一种更新在语音识别期间所使用的语法模型的方法，所述方法包括：获得包括至少一个单词的语料库；从语料库中获得至少一个单词；将获得的至少一个单词划分为至少一个音段；产生用于将所述至少一个音段重新组合为所述至少一个单词的提示；以及使用包括所述提示的至少一个音段更新语法模型。2.如权利要求1所述的方法，其中，划分步骤包括：基于获得的至少一个单词的出现频率和长度中的一个或更多个确定将被划分的单词；划分确定的单词。3.如权利要求1所述的方法，其中，划分步骤包括：针对获得的至少一个单词确定至少一个候选划分点；基于以每个候选划分点为基础的音段的出现概率信息获得每个候选划分点的分数；以及基于所述分数从所述至少一个候选划分点之中确定划分点并基于所述划分点将获得的单词划分为至少一个音段。4.如权利要求1所述的方法，其中，划分步骤包括：基于所述至少一个音段以音段为单位划分获得的至少一个单词。5.如权利要求1所述的方法，其中，产生提示的步骤包括：基于所述至少一个音段是否位于单词的边界来产生针对所述至少一个音段的提示。6.如权利要求1所述的方法，其中，更新语法模型的步骤包括：将进入令牌添加到获得的至少一个单词或划分的音段；基于包括进入令牌的获得的至少一个单词或划分的音段更新基于类别的语法模型。7.如权利要求6所述的方法，其中，更新语法模型的步骤包括：确定单词或音段所属的类别；确定是否将进入令牌或退出令牌添加到单词或音段并基于确定的结果将进入令牌或退出令牌添加到所述单词或音段；以及基于单词或音段更新所确定的类别的语法模型。8.一种执行语音识别的方法，所述方法包括：获得用于执行语音识别的语音数据；通过基于包括语音数据的至少一个音段的出现概率信息的语法模型执行语音识别来检测所述至少一个音段；以及基于检测到的音段的提示将检测到的音段重新组合为单词。9.如权利要求8所述的方法，还包括：执行语...

【专利技术属性】
技术研发人员：安桐薰，朴致衍，李暻慜，李在原，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：韩国;KR

全部详细技术资料下载我是这个专利的主人