语音识别装置和方法制造方法及图纸

技术编号：3044723 阅读：150 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供了语音识别装置、方法和记录有语音识别软件程序的记录介质。当识别候选项的相似度大于第二阈值时，语音验证单元输出识别候选项作为识别结果，并且当识别候选项的相似度小于第二阈值时，如果该识别候选项的相似度大于第一阈值并且同时该识别候选项的相似度大于抛弃候选项的相似度，则语音验证单元输出识别候选项作为识别结果。应该注意，第一阈值是用于抛弃输入语音的量度。第二阈值大于第一阈值并且用作用于输出作为识别结果的识别候选项的量度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别装置、语音识别方法、以及其上记录有语音识别软件程序的记录介质，更具体地讲，涉及一种语音识别装置、语音识别方法、以及其上记录有语音识别软件程序的记录介质，其由于除了设置有用于存储识别词汇单词的识别单词字典之外还设置有用于存储可抛弃词汇单词的可抛弃单词字典，从而能够抛弃背景噪声、背景语音或识别词汇单词以外的单词的发声，并且仅当对识别词汇单词发声时才输出识别结果。
技术介绍
在过去已知这样的语音识别装置，该语音识别装置将语音识别引擎用作从用户接收输入以识别用户发声(语音)并且接受它们作为对系统的输入的装置。例如，这种语音识别装置已经被实际用于包括语音门户、汽车导航系统等的信息提供系统。此外，这种语音识别装置受制于如下问题例如，根据设置有这种语音识别装置的信息提供系统的使用环境，背景噪声、背景语音等可能被误识别为识别词汇单词。此外，存在如下问题当用户对识别词汇单词以外的单词发声时，这些单词可能被误识别为识别词汇单词。为了消除这些问题，提出了一种语音识别装置，该语音识别装置除了用于存储识别词汇单词的识别单词字典以外，还设置有用于存储可抛弃词汇单词的可抛弃单词字典。具体地讲，该语音识别装置除了计算输入语音与识别词汇单词之间的相似度以外，还计算输入语音与可抛弃词汇单词之间的相似度。作为计算相似度的结果，当识别词汇单词的相似度高于可抛弃词汇单词的相似度时，将识别词汇单词输出作为识别结果。另一方面，当识别词汇单词的相似度小于可抛弃词汇单词的相似度时，抛弃输入语音。因此，在可抛弃单词字典中存储背景噪声、背景语音或识...

【技术保护点】
一种语音识别装置，该语音识别装置包括：语音输入单元，其将输入语音转换成发声语音数据；语音分析单元，其将所述发声语音数据转换成特征量；识别单词字典，其存储多个识别词汇单词；可抛弃单词字典，其存储多个可抛弃词汇单词；语音验证单元，其利用通过所述语音分析单元进行的转换而获得的特征量，计算所述输入语音与存储在所述识别单词字典中的所述多个识别词汇单词之间的相似度，利用通过所述语音分析单元进行的转换而获得的特征量，计算所述输入语音与存储在所述可抛弃单词字典中的所述多个可抛弃词汇单词之间的相似度，并且，作为计算这些相似度的结果，从所述识别词汇单词中提取具有最高相似度的识别词汇单词作为识别候选项，并且从所述可抛弃词汇单词中提取具有最高相似度的可抛弃词汇单词作为抛弃候选项；第一阈值存储单元，其存储用作抛弃所述输入语音的量度的第一阈值；以及第二阈值存储单元，其存储第二阈值，所述第二阈值大于所述第一阈值并且用作输出作为识别结果的所述识别候选项的量度，其中，如果所述识别候选项的相似度大于所述第二阈值，则所述语音验证单元输出所述识别候选项作为识别结果，并且如果所述识别候选项的相似度小于所述第二阈值，则当所述识别...

【技术特征摘要】
JP 2006-11-20 2006-3131981、一种语音识别装置，该语音识别装置包括语音输入单元，其将输入语音转换成发声语音数据；语音分析单元，其将所述发声语音数据转换成特征量；识别单词字典，其存储多个识别词汇单词；可抛弃单词字典，其存储多个可抛弃词汇单词；语音验证单元，其利用通过所述语音分析单元进行的转换而获得的特征量，计算所述输入语音与存储在所述识别单词字典中的所述多个识别词汇单词之间的相似度，利用通过所述语音分析单元进行的转换而获得的特征量，计算所述输入语音与存储在所述可抛弃单词字典中的所述多个可抛弃词汇单词之间的相似度，并且，作为计算这些相似度的结果，从所述识别词汇单词中提取具有最高相似度的识别词汇单词作为识别候选项，并且从所述可抛弃词汇单词中提取具有最高相似度的可抛弃词汇单词作为抛弃候选项；第一阈值存储单元，其存储用作抛弃所述输入语音的量度的第一阈值；以及第二阈值存储单元，其存储第二阈值，所述第二阈值大于所述第一阈值并且用作输出作为识别结果的所述识别候选项的量度，其中，如果所述识别候选项的相似度大于所述第二阈值，则所述语音验证单元输出所述识别候选项作为识别结果，并且如果所述识别候选项的相似度小于所述第二阈值，则当所述识别候选项的相似度大于所述第一阈值并且同时所述识别候选项的相似度高于所述抛弃候选项的相似度时，所述语音验证单元输出所述识别候选项作为识别结果。2、如权利要求1所述的语音识别装置，其中，如果所述识别候选项的相似度大于所述第一阈值，则当所述识别候选项的相似度小于所述第二阈值并且同时所述识别候选项的相似度小于所述抛弃候选项的相似度时，所述语音验证单元抛弃所述输入语音，并且如果所述识别候选项的相似度小于所述第一阈值，则所述语音验证单元抛弃所述输入语音。3、如权利要求1所述的语音识别装置，该语音识别装置还包括补偿数据存储单元，所述补偿数据存储单元存储用于改变所述识别候选项的相似度和所述抛弃候选项的相似度中的至少一个相似度的补偿数据，其中，所述语音验证单元基于所述补偿数据，改变所述识别候选项的相似度和所述抛弃候选项的相似度中的至少一个相似度。4、如权利要求1所述的语音识别装置，其中，所述第二阈值存储单元存储分别对应于各个所述识别词汇单词的多个第二阈值。5、如权利要求1所述的语音识别装置，该语音识别装置还包括多个可抛弃单词字典，其分别包含不同数目的可抛弃词汇单词；以及选择单元，其基于存储在所述识别单词字典中的识别词汇单词的数目，从所述多个可抛弃单词字典中选择要由所述语音验证单元进行相似度计算的可抛弃单词字典。6、一种语音识别方法，其中，设置有存储有多个识别词汇单词的识别单词字典和存储有多个可抛弃词汇单词的可抛弃单词字典的计算机执行如下步骤语音输入步骤，将输入语音转...

【专利技术属性】
技术研发人员：原田将治，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人