声音识别装置及计算机程序制造方法及图纸

技术编号：17102691 阅读：78 留言：0更新日期：2018-01-21 12:44

提供能有效利用神经网络的特性来提高识别精度的声音识别装置。声音识别装置包含：基于RNN(循环神经网络)的声学模型(308)，其按每个状态序列算出给出由从声音信号得到的给定的声音特征量构成的观测序列时的状态序列的后验概率；基于S

Sound recognition device and computer program

A sound recognition device that provides an effective use of the characteristics of the neural network to improve the recognition accuracy. The voice recognition device includes: the acoustic model based on RNN (308). It calculates the posterior probability of the state sequence based on the sequence of each state by giving the observed sequence of the given voice characteristic quantity from the sound signal, and based on S.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】声音识别装置及计算机程序
本专利技术涉及声音识别装置，特别涉及使用神经网络来进行高精度的声音识别的声音识别装置及其计算机程序。
技术介绍
使用基于声音的输入输出来作为人与计算机的接口的装置以及服务不断增加。例如在便携式电话的操作中也利用了基于声音的输入输出。在基于声音的输入输出中，需要尽可能提高构成其基础的声音识别装置的识别精度。作为声音识别，一般的技术使用通过统计学上的机器学习而得到的模型。例如作为声学模型而使用HMM(隐马尔可夫模型)。另外，还使用：用于算出在声音识别的过程中生成的字符串能以何种程度的概率从HMM的状态串中得到的单词发声辞典；以及用于算出某语言的单词串以何种程度的概率出现的语言模型等。为了进行这样的处理，现有的声音识别装置包含：帧化处理部，其将声音信号帧化；特征量生成部，其从各帧算出梅尔频率倒谱系数等特征量，生成多维的特征量矢量的序列；和解码器，其使用该特征量矢量的序列，输出用声学模型和语言模型给出该特征量矢量的序列的似然性最高的单词串，作为声音识别结果。在似然性计算中，来自构成声学模型的HMM的各状态的输出概率和状态过渡概率起到重要作用。这些都能通过机器学习而得到。输出概率用通过学习得到的高斯混合模型算出。参考图1来说明现有的声音识别装置中的声音识别的基本思路。过去，认为单词串30(单词串W)会历经各种噪声的影响而作为观测序列36(观测序列X)被观测到，并输出给出最终的观测序列X的似然性最高那样的单词串作为声音识别的结果。在该过程中，用P(W)表征生成单词串W的概率。将从该单词串W起经过中间生成物即发声串32而生成HMM的状态序列S(...
声音识别装置及计算机程序

【技术保护点】
一种声音识别装置，包含：第1后验概率算出单元，其按每个状态序列算出给出由从声音信号得到的给定的声音特征量构成的观测序列时的状态序列的后验概率；第2后验概率算出单元，其针对各单词串算出给出状态序列时的单词串的后验概率；和用于以下处理的单元，即，使用针对输入观测序列由所述第1后验概率算出单元以及所述第2后验概率算出单元分别算出的后验概率，基于按与所述声音信号对应的单词串的每个假设算出的评分来进行针对所述声音信号的声音识别。

【技术特征摘要】
【国外来华专利技术】2015.05.22 JP 2015-1043361.一种声音识别装置，包含：第1后验概率算出单元，其按每个状态序列算出给出由从声音信号得到的给定的声音特征量构成的观测序列时的状态序列的后验概率；第2后验概率算出单元，其针对各单词串算出给出状态序列时的单词串的后验概率；和用于以下处理的单元，即，使用针对输入观测序列由所述第1后验概率算出单元以及所述第2后验概率算出单元分别算出的后验概率，基于按与所述声音信号对应的单词串的每个假设算出的评分来进行针对所述声音信号的声音识别。2.根据权利要求1所述的声音识别装置，其中，所述第2后验概率算出单元包含：用于以下处理的单元，即，根据基于语言模型的单词串的发生概率、构成声学模...

【专利技术属性】
技术研发人员：神田直之，
申请(专利权)人：国立研究开发法人情报通信研究机构，
类型：发明
国别省市：日本,JP

全部详细技术资料下载我是这个专利的主人