【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及适用于例如高精度且高速的大语量连续的语音识别(Large Vocabulary Continuous Speech Recognition: LVCSR)的语音识别系统、语 音识别方法以及语音识别程序。10
技术介绍
如非专利文献1所述,近年来想要实现高精度且高速的LVCSR的试 验越来越盛行。在该LVCSR中,由于搜索空间非常大,因此搜索算法的 设计很重要。在该搜索算法中,广泛采用在搜索的过程中不仅考虑网格15 (trellis)上的节点的累计分数而且考虑该节点之后的累计分数(的推定值) 的预测的方法。将该技术相关的语音识别系统作为第一现有例,在图 5中表示。以下,基于该附图进行说明。第一现有例的语音识别系统700由数据处理装置710以及数据存储装 置720构成。数据存储装置720具备语音缓存器721和预测值缓存器722,20其中语音缓存器721存储有多帧的语音,预测值缓存器722保存有对存储 在语音缓存器721中的语音进行与语音相反的方向的处理后作成的语音的 预测值。数据处理装置710具备距离计算/预测单元711和距离计算/单词 串(word string)对照单元712,该距离计算/预测单元711作成上述预测 值后,将其保存到预测值缓存器722中,距离计算/单词串对照单元71225利用语音缓存器721以及预测值缓存器722的各值来进行通常的单词对照 处理。语音识别系统700按照以下那样工作。首先,距离计算/预测单元711 如下那样工作。等待直到所输入的语音特征量的时间序列数据被存储到语 音缓存器721为止,之后与时间逆序地对该语音进行 ...
【技术保护点】
一种语音识别系统,具备: 距离计算单元,其生成依次输入的语音特征量和各声音模型之间的距离值; 预测单元,其与所述距离计算单元所进行的距离值的生成并行,采用由所述距离计算单元已生成的距离值来生成预测值;和 单词串对照单元,其与所述距离计算单元所进行的距离值的生成以及所述预测单元所进行的预测值的生成并行,采用由所述距离计算单元已生成的距离值以及由所述预测单元已生成的预测值来进行单词对照,生成识别结果。
【技术特征摘要】
【国外来华专利技术】JP 2005-1-17 008542/20051.一种语音识别系统,具备距离计算单元,其生成依次输入的语音特征量和各声音模型之间的距离值;预测单元,其与所述距离计算单元所进行的距离值的生成并行,采用由所述距离计算单元已生成的距离值来生成预测值;和单词串对照单元,其与所述距离计算单元所进行的距离值的生成以及所述预测单元所进行的预测值的生成并行,采用由所述距离计算单元已生成的距离值以及由所述预测单元已生成的预测值来进行单词对照,生成识别结果。2. 根据权利要求1所述的语音识别系统,其特征在于, 分别具备多个距离值缓存器和预测值缓存器,所述距离值缓存器储存15有由所述距离计算单元所生成的距离值,所述预测值缓存器储存有由所述 预测单元所生成的预测值,所述各距离值缓存器,进行写入来自所述距离计算单元的所述距离 值、将所述距离值读出到所述预测单元以及将所述距离值读出到所述单词 串对照单元的动作,20 所述各预测值缓存器,进行写入来自所述预测单元的所述预测值以及将所述预测值读出到所述单词串对照单元的动作,被写入来自所述距离计算单元的所述距离值的所述距离值缓存器、将所述距离值读出到所述预测单元的所述距离值缓存器和将所述距离值读出到所述单词串对照单元的所述距离值缓存器分别不同, 25 并且,被写入来自所述预测单元的所述预测值的所述预测值缓存器和将所述预测值读出到所述单词串对照单元的所述预测值缓存器分别不同。3. 根据权利要求2所述的语音识别系统,其特征在于,还具备缓存器长度决定单元,其按照使得所述距离计算单元、所述预 测单元以及所述单词对照单元的处理量均匀的方式,决定所述距离值缓存30器或所述预测值缓存器的缓存器长度。4. 根据权利要求2所述的语音识别系统,其特征在于, 具备缓存器管理单元, 所述缓存器管理单元具有下述功能对所述距离计算单元、所述预测单元以及所述单词串对照单元的动作 5进行监视;以所述距离计算单元,不需要再向所述距离值缓存器中写入所述距离 值,且所述预测单元以及所述单词串对照单元从所述距离值缓存器读出了 所有所述距离值,并且所述预测单元不需要再向所述预测值缓存器中写入 所述预测值,且所述单词串对照单元从所述预测值缓存器读出了所有所述10预测值作为条件,按照下述那样动作使所述距离计算单元在写入时采用 的所述距离值缓存器用于所述预测单元的下一次读出,使所述预测单元在 读出时采用的所述距离值缓存器用于所述单词串对照单元的下一次读出, 使所述单词串对照单元的读出时采用的所述距离值缓存器用于所述距离 计算单元的下一次写入,使所述预测单元在写入时采用的所述预测值缓存15器用于所述单词串对照单元的下一次读出,使所述单词串对照单元的读出 时采用的所述预测值缓存器用于所述预测单元的下一次写入。5. —种语音识别方法,具备距离计算步骤,生成依次输入的语音特征量和各声音模型之间的距离值; 预测步骤,与该距离计算步骤中的所述距离值的生成并行,采用由该距离计算步骤已生成的距离值来生成预测值;和单词串对照步骤,其与所述距离计算步骤中的所述距离值的生成以及 所述预测步骤中的所述预测值的生成并行,采用由所述距离计算步骤已生 成的距离值以及由所述预测步骤已生成的预测值来进行单词对照,生成识 别结果。6. 根据权利要求5所述的语音识别方法,其特征在于,分别采用多个距离值缓存器和预测值缓存器,所述距离值缓存器储存 有由所述距离计算步骤所生成的距离值,所述预测值缓存器储存有由所述 预测步骤所生成的预测值, 对所述距离值缓存器,并行运行所述距离计算步骤中的所述距离值的 写入、所述预测步骤中的所述距离值的读出和所述单词串对照步骤中的所 述距离值的...
【专利技术属性】
技术研发人员:石川晋也,山端洁,
申请(专利权)人:日本电气株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。