加权有限状态变换器解码系统以及语音识别系统技术方案

技术编号:18716814 阅读:29 留言:0更新日期:2018-08-21 23:36
本发明专利技术提供加权有限状态变换器解码系统及语音识别系统。加权有限状态变换器解码系统包括:存储器,存储加权有限状态变换器数据;以及加权有限状态变换器解码器,包括数据提取逻辑。加权有限状态变换器数据具有包括状态及弧的结构,弧具有方向性地连接各状态。加权有限状态变换器数据被压缩在存储器中。加权有限状态变换器数据包括主体数据及报头数据,报头数据包括不连续地对齐的每一个状态的状态信息。主体数据包括连续地对齐的弧的弧信息。状态信息包括弧的弧索引、弧的数目及弧的压缩信息,且数据提取逻辑使用压缩信息对加权有限状态变换器数据进行解压缩,并从存储器撷取加权有限状态变换器数据。本发明专利技术可减小存储器所需的容量以及减小带宽。

Weighted finite state converter decoding system and speech recognition system

The invention provides a weighted finite state converter decoding system and a speech recognition system. The weighted finite state converter decoding system includes: memory, storing weighted finite state converter data, and weighted finite state converter decoder, including data extraction logic. The data of the weighted finite state converter has a structure including states and arcs, which are directionally connected to each state. Weighted finite state converter data are compressed in memory. The weighted finite state converter data includes the principal data and header data, and the header data includes the state information of each state which is discontinuously aligned. The main data includes the arc information of the continuous alignment of the arc. The state information includes arc index, arc number and arc compression information, and the data extraction logic decompresses the weighted finite state converter data using compression information, and retrieves the weighted finite state converter data from memory. The invention can reduce the capacity required by the memory and reduce the bandwidth.

【技术实现步骤摘要】
加权有限状态变换器解码系统以及语音识别系统[相关申请的交叉参考]本申请主张2017年2月10日在韩国知识产权局提出申请的韩国专利申请第10-2017-0018455号的优先权以及从所述韩国专利申请衍生出的所有权利,所述韩国专利申请的内容全文并入本申请供参考。
根据本专利技术的系统、设备及方法涉及一种加权有限状态变换器(weightedfinite-statetransducer,WFST)解码系统和包括该解码系统的语音识别系统以及存储加权有限状态变换器数据的方法。
技术介绍
近来,加权有限状态变换器(WFST)被广泛用于语音识别的解码器阶段。加权有限状态变换器是指网络形式的数据结构,在所述数据结构中收集并优化在语音识别中使用的例如语法、发音等信息。由于大小的原因,加权有限状态变换器必须存储在例如动态随机存取存储器等外部存储器中,以允许例如移动接入点(accesspoint,AP)等硬件对该加权有限状态变换器进行存取。同时,由于在移动环境中外部存储器具有有限的大小,因此对加权有限状态变换器进行压缩及存储是有利的,这是因为压缩可减少所需的存储器大小并且可同时减小带宽。
技术实现思路
本专利技术一方面提供一种加权有限状态变换器解码系统,所述加权有限状态变换器解码系统用于对被压缩成小容量的加权有限状态变换器数据进行解码。本专利技术另一方面提供一种语音识别系统,所述语音识别系统使用被压缩成小容量的加权有限状态变换器数据。本专利技术再一方面提供一种存储被压缩成小容量的加权有限状态变换器数据的方法。本专利技术并非仅限于上述那些方面,且通过阅读以下说明,所属领域中的技术人员将清楚地理解除了本文所述示例性实施例之外的其他示例性实施例。根据示例性实施例的一方面,提供一种加权有限状态变换器(WFST)解码系统,所述加权有限状态变换器解码系统包括:存储器,其被配置成存储加权有限状态变换器数据;和加权有限状态变换器解码器,其包括数据提取逻辑,其中所述加权有限状态变换器数据具有包括一个或多个状态以及一个或多个弧的结构,所述一个或多个弧具有方向性地连接所述一个或多个状态,所述加权有限状态变换器数据被压缩在所述存储器中,所述加权有限状态变换器数据包括主体数据以及报头数据,所述报头数据包括不连续地对齐的所述一个或多个状态中的每一者的状态信息,所述主体数据包括连续地对齐的所述一个或多个弧的弧信息,所述状态信息包括所述一个或多个弧的弧索引、所述一个或多个弧的数目以及所述一个或多个弧的压缩信息,并且所述数据提取逻辑被配置成使用所述压缩信息对所述加权有限状态变换器数据进行解压缩,并从所述存储器撷取所述加权有限状态变换器数据。根据示例性实施例的另一方面,提供一种语音识别系统,所述语音识别系统包括:话音采样模块,其被配置成将语音采样成数字数据;和语音识别模块,其被配置成抽取所述数字数据的特征向量、对所述特征向量进行评分以形成被评分数据并通过引用加权有限状态变换器(WFST)数据来从所述被评分数据导出语句数据,其中所述语音识别模块包括加权有限状态变换器解码器,所述加权有限状态变换器解码器被配置成对所述加权有限状态变换器数据进行解压缩并从外部存储器撷取所述加权有限状态变换器数据,且所述加权有限状态变换器数据具有包括一个或多个状态以及一个或多个弧的结构,所述一个或多个弧具有方向性地连接所述一个或多个状态,所述加权有限状态变换器数据被压缩,所述加权有限状态变换器数据包括报头数据及主体数据,所述报头数据包括不连续地对齐的所述一个或多个状态中的每一者的状态信息,所述主体数据包括连续地对齐的所述一个或多个弧的弧信息,且所述状态信息包括所述一个或多个弧的弧索引、所述一个或多个弧的数目以及所述一个或多个弧的压缩信息。根据示例性实施例的另一方面,提供一种语音识别系统,所述语音识别系统包括:数据提取逻辑,其被配置成撷取加权有限状态变换器(WFST)数据,所述加权有限状态变换器数据具有包括一个或多个状态以及一个或多个弧的结构,所述一个或多个弧具有方向性地连接所述一个或多个状态,其中所述加权有限状态变换器数据包括报头数据及主体数据,所述报头数据包括不连续地对齐的所述一个或多个状态中的每一者的状态信息,所述主体数据包括连续地对齐的所述一个或多个弧的弧信息,其中所述状态信息包括所述一个或多个弧的弧索引、所述一个或多个弧的数目以及所述一个或多个弧的压缩信息,并且其中所述数据提取逻辑包括加权有限状态变换器解压缩器及地址控制逻辑,所述加权有限状态变换器解压缩器被配置成使用所述压缩信息对所述主体数据进行解压缩,所述地址控制逻辑被配置成使用所述弧索引、所述一个或多个弧的所述数目以及所述一个或多个弧的所述压缩信息来导出所述主体数据的地址;以及数据处理器,其被配置成接收被评分数据并使用从所述数据提取逻辑传送的所述加权有限状态变换器数据来形成被重新评分数据。根据示例性实施例的再一方面,提供一种存储加权有限状态变换器(WFST)数据的方法,所述加权有限状态变换器数据具有包括一个或多个状态以及一个或多个弧的结构,所述一个或多个弧具有方向性地连接所述一个或多个状态。单独地存储报头数据与主体数据。所述报头数据包括不连续地对齐的所述一个或多个状态的状态信息。所述状态信息包括使用所述状态作为起始点的所述一个或多个弧的弧索引、所述一个或多个弧的数目以及所述一个或多个弧的压缩信息。所述主体数据包括连续地对齐的所述一个或多个弧的弧信息。所述弧信息包括一个或多个要素,所述一个或多个要素包括关于下一状态、输入标签、输出标签、图表成本以及其他信息中的任意者的信息。在压缩信息中所包含的任何要素不包含在所述主体数据中。附图说明通过参照附图详细阐述本专利技术的示例性实施例,对所属领域中的普通技术人员来说,以上及其他方面将变得更显而易见,在附图中:图1是根据一些示例性实施例的语音识别系统的示例性方块图。图2是为解释图1所示语音识别系统的语音识别电路的详细配置而提供的方块图。图3是为解释图2所示语音识别电路的加权有限状态变换器解码器的详细配置而提供的方块图。图4是为解释根据一些示例性实施例的语音识别系统的加权有限状态变换器数据结构而提供的示例图。图5是为解释根据一些示例性实施例的语音识别系统及加权有限状态变换器解码系统的弧信息而提供的示例图。图6是为解释根据一些示例性实施例的语音识别系统及加权有限状态变换器解码系统中的以相同状态作为起始点的一组弧信息而提供的示例图。图7及图8是为解释根据一些示例性实施例的存储语音识别系统及加权有限状态变换器解码系统的弧信息的方法而提供的示例图。图9是为解释根据一些示例性实施例的加载语音识别系统及加权有限状态变换器解码系统中的弧信息的方法而提供的概念图。图10是为解释根据一些示例性实施例的压缩语音识别系统及加权有限状态变换器解码系统中的弧信息的方法而提供的概念图。图11是为解释根据一些示例性实施例的压缩语音识别系统及加权有限状态变换器解码系统中的弧信息的方法而提供的概念图。图12是为解释根据一些示例性实施例的压缩语音识别系统及加权有限状态变换器解码系统中的弧信息的方法而提供的概念图。图13是为解释根据一些示例性实施例的压缩语音识别系统及加权有限状态变换器解码系统中的弧信息的方法而提供的概念图。图14是为解释本文档来自技高网...

【技术保护点】
1.一种加权有限状态变换器解码系统,其特征在于,包括:存储器,其被配置成存储加权有限状态变换器数据;以及加权有限状态变换器解码器,其包括数据提取逻辑,其中所述加权有限状态变换器数据具有包括一个或多个状态以及一个或多个弧的结构,所述一个或多个弧具有方向性地连接所述一个或多个状态,所述加权有限状态变换器数据被压缩在所述存储器中,所述加权有限状态变换器数据包括主体数据以及报头数据,所述报头数据包括不连续地对齐的所述一个或多个状态中的每一者的状态信息,所述主体数据包括连续地对齐的所述一个或多个弧的弧信息,所述状态信息包括所述一个或多个弧的弧索引、所述一个或多个弧的数目以及所述一个或多个弧的压缩信息,并且所述数据提取逻辑被配置成使用所述压缩信息对所述加权有限状态变换器数据进行解压缩,并从所述存储器撷取所述加权有限状态变换器数据。

【技术特征摘要】
2017.02.10 KR 10-2017-00184551.一种加权有限状态变换器解码系统,其特征在于,包括:存储器,其被配置成存储加权有限状态变换器数据;以及加权有限状态变换器解码器,其包括数据提取逻辑,其中所述加权有限状态变换器数据具有包括一个或多个状态以及一个或多个弧的结构,所述一个或多个弧具有方向性地连接所述一个或多个状态,所述加权有限状态变换器数据被压缩在所述存储器中,所述加权有限状态变换器数据包括主体数据以及报头数据,所述报头数据包括不连续地对齐的所述一个或多个状态中的每一者的状态信息,所述主体数据包括连续地对齐的所述一个或多个弧的弧信息,所述状态信息包括所述一个或多个弧的弧索引、所述一个或多个弧的数目以及所述一个或多个弧的压缩信息,并且所述数据提取逻辑被配置成使用所述压缩信息对所述加权有限状态变换器数据进行解压缩,并从所述存储器撷取所述加权有限状态变换器数据。2.根据权利要求1所述的加权有限状态变换器解码系统,其特征在于,所述弧信息对于所述一个或多个弧中的每一者都包括一个或多个要素,并且所述一个或多个要素包括关于下一状态、输入标签、输出标签及图表成本的信息。3.根据权利要求2所述的加权有限状态变换器解码系统,其特征在于,所述压缩信息指示所述一个或多个要素中的其中一个要素将被压缩,并且所述主体数据在被压缩时省略了由所述压缩信息指示的任何要素。4.根据权利要求2所述的加权有限状态变换器解码系统,其特征在于,对于相同的状态是起始点的一个或多个弧,当所述一个或多个弧的以下要素中的至少一个要素具有相同的值时,所述至少一个要素被压缩:所述输入标签、所述输出标签和所述图表成本。5.根据权利要求2所述的加权有限状态变换器解码系统,其特征在于,对于相同的状态是起始点的一个或多个弧,当所述一个或多个弧中的所有弧的当前状态与下一状态相同时,所述下一状态被压缩。6.根据权利要求1所述的加权有限状态变换器解码系统,其特征在于,对于不同的状态是起始点的第一弧与第二弧,所述第一弧的位宽度的大小与所述第二弧的位宽度的大小彼此不同。7.根据权利要求1所述的加权有限状态变换器解码系统,其特征在于,对于相同的状态是起始点的一个或多个弧,位宽度的大小彼此相同。8.根据权利要求1所述的加权有限状态变换器解码系统,其特征在于,所述数据提取逻辑包括:加权有限状态变换器解压缩器,其被配置成对所述加权有限状态变换器数据进行解压缩;以及地址控制逻辑,其被配置成基于所述报头数据来计算所述主体数据的地址。9.根据权利要求1所述的加权有限状态变换器解码系统,其特征在于,所述加权有限状态变换器解码器还包括数据处理逻辑,所述数据处理逻辑被配置成接收由所述数据提取逻辑撷取的所述加权有限状态变换器数据,且被配置成使用输入数据导出输出数据。10.根据权利要求9所述的加权有限状态变换器解码系统,其特征在于,所述输入数据包括语音识别数据。11.一种语音识别系统,包括:话音采样模块,其被配置成将语音采样成数字数据;以及语音识别模块,其被配置成抽取所述数字数据的特征向量、对所述特征向量进行评分以形成被评分数据并通过引用加权有限状态变换器数据来从所...

【专利技术属性】
技术研发人员:尹哉盛朴峻奭
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国,KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1