【技术实现步骤摘要】
本专利技术涉及语音识别装置、语音识别方法、以及其上记录有语音识 别软件程序的记录介质,更具体地讲,涉及一种语音识别装置、语音识 别方法、以及其上记录有语音识别软件程序的记录介质,其由于除了设 置有用于存储识别词汇单词的识别单词字典之外还设置有用于存储可抛 弃词汇单词的可抛弃单词字典,从而能够抛弃背景噪声、背景语音或识 别词汇单词以外的单词的发声,并且仅当对识别词汇单词发声时才输出 识别结果。
技术介绍
在过去已知这样的语音识别装置,该语音识别装置将语音识别引擎 用作从用户接收输入以识别用户发声(语音)并且接受它们作为对系统 的输入的装置。例如,这种语音识别装置已经被实际用于包括语音门户、 汽车导航系统等的信息提供系统。此外,这种语音识别装置受制于如下问题例如,根据设置有这种 语音识别装置的信息提供系统的使用环境,背景噪声、背景语音等可能 被误识别为识别词汇单词。此外,存在如下问题当用户对识别词汇单 词以外的单词发声时,这些单词可能被误识别为识别词汇单词。为了消除这些问题,提出了一种语音识别装置,该语音识别装置除 了用于存储识别词汇单词的识别单词字典以外,还设置有用于存储可抛 弃词汇单词的可抛弃单词字典。具体地讲,该语音识别装置除了计算输 入语音与识别词汇单词之间的相似度以外,还计算输入语音与可抛弃词 汇单词之间的相似度。作为计算相似度的结果,当识别词汇单词的相似 度高于可抛弃词汇单词的相似度时,将识别词汇单词输出作为识别结果。 另一方面,当识别词汇单词的相似度小于可抛弃词汇单词的相似度时,抛弃输入语音。因此,在可抛弃单词字典中存储背景噪声、背景语音或 识 ...
【技术保护点】
一种语音识别装置,该语音识别装置包括:语音输入单元,其将输入语音转换成发声语音数据;语音分析单元,其将所述发声语音数据转换成特征量;识别单词字典,其存储多个识别词汇单词;可抛弃单词字典,其存储多个可抛弃词汇单词;语音验证单元,其利用通过所述语音分析单元进行的转换而获得的特征量,计算所述输入语音与存储在所述识别单词字典中的所述多个识别词汇单词之间的相似度,利用通过所述语音分析单元进行的转换而获得的特征量,计算所述输入语音与存储在所述可抛弃单词字典中的所述多个可抛弃词汇单词之间的相似度,并且,作为计算这些相似度的结果,从所述识别词汇单词中提取具有最高相似度的识别词汇单词作为识别候选项,并且从所述可抛弃词汇单词中提取具有最高相似度的可抛弃词汇单词作为抛弃候选项;第一阈值存储单元,其存储用作抛弃所述输入语音的量度的第一阈值;以及第二阈值存储单元,其存储第二阈值,所述第二阈值大于所述第一阈值并且用作输出作为识别结果的所述识别候选项的量度,其中,如果所述识别候选项的相似度大于所述第二阈值,则所述语音验证单元输出所述识别候选项作为识别结果,并且如果所述识别候选项的相似度小于所述第二阈值,则当所述识别 ...
【技术特征摘要】
JP 2006-11-20 2006-3131981、一种语音识别装置,该语音识别装置包括语音输入单元,其将输入语音转换成发声语音数据;语音分析单元,其将所述发声语音数据转换成特征量;识别单词字典,其存储多个识别词汇单词;可抛弃单词字典,其存储多个可抛弃词汇单词;语音验证单元,其利用通过所述语音分析单元进行的转换而获得的特征量,计算所述输入语音与存储在所述识别单词字典中的所述多个识别词汇单词之间的相似度,利用通过所述语音分析单元进行的转换而获得的特征量,计算所述输入语音与存储在所述可抛弃单词字典中的所述多个可抛弃词汇单词之间的相似度,并且,作为计算这些相似度的结果,从所述识别词汇单词中提取具有最高相似度的识别词汇单词作为识别候选项,并且从所述可抛弃词汇单词中提取具有最高相似度的可抛弃词汇单词作为抛弃候选项;第一阈值存储单元,其存储用作抛弃所述输入语音的量度的第一阈值;以及第二阈值存储单元,其存储第二阈值,所述第二阈值大于所述第一阈值并且用作输出作为识别结果的所述识别候选项的量度,其中,如果所述识别候选项的相似度大于所述第二阈值,则所述语音验证单元输出所述识别候选项作为识别结果,并且如果所述识别候选项的相似度小于所述第二阈值,则当所述识别候选项的相似度大于所述第一阈值并且同时所述识别候选项的相似度高于所述抛弃候选项的相似度时,所述语音验证单元输出所述识别候选项作为识别结果。2、 如权利要求1所述的语音识别装置,其中,如果所述识别候选项的相似度大于所述第一阈值,则当所述 识别候选项的相似度小于所述第二阈值并且同时所述识别候选项的相似 度小于所述抛弃候选项的相似度时,所述语音验证单元抛弃所述输入语 音,并且如果所述识别候选项的相似度小于所述第一阈值,则所述语音验证 单元抛弃所述输入语音。3、 如权利要求1所述的语音识别装置,该语音识别装置还包括补偿 数据存储单元,所述补偿数据存储单元存储用于改变所述识别候选项的 相似度和所述抛弃候选项的相似度中的至少一个相似度的补偿数据,其中,所述语音验证单元基于所述补偿数据,改变所述识别候选项 的相似度和所述抛弃候选项的相似度中的至少一个相似度。4、 如权利要求1所述的语音识别装置,其中,所述第二阈值存储单元存储分别对应于各个所述识别词汇单词的多个第二阈值。5、 如权利要求1所述的语音识别装置,该语音识别装置还包括多个可抛弃单词字典,其分别包含不同数目的可抛弃词汇单词;以及选择单元,其基于存储在所述识别单词字典中的识别词汇单词的数 目,从所述多个可抛弃单词字典中选择要由所述语音验证单元进行相似 度计算的可抛弃单词字典。6、 一种语音识别方法,其中,设置有存储有多个识别词汇单词的识别单词字典和存储有多个可抛弃词汇单词的可抛弃单词字典的计算机执行如下步骤 语音输入步骤,将输入语音转...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。