加权有限状态变换器解码系统以及语音识别系统技术方案

技术编号：18716814 阅读：29 留言：0更新日期：2018-08-21 23:36

本发明专利技术提供加权有限状态变换器解码系统及语音识别系统。加权有限状态变换器解码系统包括：存储器，存储加权有限状态变换器数据；以及加权有限状态变换器解码器，包括数据提取逻辑。加权有限状态变换器数据具有包括状态及弧的结构，弧具有方向性地连接各状态。加权有限状态变换器数据被压缩在存储器中。加权有限状态变换器数据包括主体数据及报头数据，报头数据包括不连续地对齐的每一个状态的状态信息。主体数据包括连续地对齐的弧的弧信息。状态信息包括弧的弧索引、弧的数目及弧的压缩信息，且数据提取逻辑使用压缩信息对加权有限状态变换器数据进行解压缩，并从存储器撷取加权有限状态变换器数据。本发明专利技术可减小存储器所需的容量以及减小带宽。

Weighted finite state converter decoding system and speech recognition system

The invention provides a weighted finite state converter decoding system and a speech recognition system. The weighted finite state converter decoding system includes: memory, storing weighted finite state converter data, and weighted finite state converter decoder, including data extraction logic. The data of the weighted finite state converter has a structure including states and arcs, which are directionally connected to each state. Weighted finite state converter data are compressed in memory. The weighted finite state converter data includes the principal data and header data, and the header data includes the state information of each state which is discontinuously aligned. The main data includes the arc information of the continuous alignment of the arc. The state information includes arc index, arc number and arc compression information, and the data extraction logic decompresses the weighted finite state converter data using compression information, and retrieves the weighted finite state converter data from memory. The invention can reduce the capacity required by the memory and reduce the bandwidth.

全部详细技术资料下载

【技术实现步骤摘要】
加权有限状态变换器解码系统以及语音识别系统[相关申请的交叉参考]本申请主张2017年2月10日在韩国知识产权局提出申请的韩国专利申请第10-2017-0018455号的优先权以及从所述韩国专利申请衍生出的所有权利，所述韩国专利申请的内容全文并入本申请供参考。
根据本专利技术的系统、设备及方法涉及一种加权有限状态变换器(weightedfinite-statetransducer，WFST)解码系统和包括该解码系统的语音识别系统以及存储加权有限状态变换器数据的方法。
技术介绍
近来，加权有限状态变换器(WFST)被广泛用于语音识别的解码器阶段。加权有限状态变换器是指网络形式的数据结构，在所述数据结构中收集并优化在语音识别中使用的例如语法、发音等信息。由于大小的原因，加权有限状态变换器必须存储在例如动态随机存取存储器等外部存储器中，以允许例如移动接入点(accesspoint，AP)等硬件对该加权有限状态变换器进行存取。同时，由于在移动环境中外部存储器具有有限的大小，因此对加权有限状态变换器进行压缩及存储是有利的，这是因为压缩可减少所需的存储器大小并且可同时减小带宽。
技术实现思路
本专利技术一方面提供一种加权有限状态变换器解码系统，所述加权有限状态变换器解码系统用于对被压缩成小容量的加权有限状态变换器数据进行解码。本专利技术另一方面提供一种语音识别系统，所述语音识别系统使用被压缩成小容量的加权有限状态变换器数据。本专利技术再一方面提供一种存储被压缩成小容量的加权有限状态变换器数据的方法。本专利技术并非仅限于上述那些方面，且通过阅读以下说明，所属领域中的技术人员将...

【技术保护点】
1.一种加权有限状态变换器解码系统，其特征在于，包括：存储器，其被配置成存储加权有限状态变换器数据；以及加权有限状态变换器解码器，其包括数据提取逻辑，其中所述加权有限状态变换器数据具有包括一个或多个状态以及一个或多个弧的结构，所述一个或多个弧具有方向性地连接所述一个或多个状态，所述加权有限状态变换器数据被压缩在所述存储器中，所述加权有限状态变换器数据包括主体数据以及报头数据，所述报头数据包括不连续地对齐的所述一个或多个状态中的每一者的状态信息，所述主体数据包括连续地对齐的所述一个或多个弧的弧信息，所述状态信息包括所述一个或多个弧的弧索引、所述一个或多个弧的数目以及所述一个或多个弧的压缩信息，并且所述数据提取逻辑被配置成使用所述压缩信息对所述加权有限状态变换器数据进行解压缩，并从所述存储器撷取所述加权有限状态变换器数据。

【技术特征摘要】
2017.02.10 KR 10-2017-00184551.一种加权有限状态变换器解码系统，其特征在于，包括：存储器，其被配置成存储加权有限状态变换器数据；以及加权有限状态变换器解码器，其包括数据提取逻辑，其中所述加权有限状态变换器数据具有包括一个或多个状态以及一个或多个弧的结构，所述一个或多个弧具有方向性地连接所述一个或多个状态，所述加权有限状态变换器数据被压缩在所述存储器中，所述加权有限状态变换器数据包括主体数据以及报头数据，所述报头数据包括不连续地对齐的所述一个或多个状态中的每一者的状态信息，所述主体数据包括连续地对齐的所述一个或多个弧的弧信息，所述状态信息包括所述一个或多个弧的弧索引、所述一个或多个弧的数目以及所述一个或多个弧的压缩信息，并且所述数据提取逻辑被配置成使用所述压缩信息对所述加权有限状态变换器数据进行解压缩，并从所述存储器撷取所述加权有限状态变换器数据。2.根据权利要求1所述的加权有限状态变换器解码系统，其特征在于，所述弧信息对于所述一个或多个弧中的每一者都包括一个或多个要素，并且所述一个或多个要素包括关于下一状态、输入标签、输出标签及图表成本的信息。3.根据权利要求2所述的加权有限状态变换器解码系统，其特征在于，所述压缩信息指示所述一个或多个要素中的其中一个要素将被压缩，并且所述主体数据在被压缩时省略了由所述压缩信息指示的任何要素。4.根据权利要求2所述的加权有限状态变换器解码系统，其特征在于，对于相同的状态是起始点的一个或多个弧，当所述一个或多个弧的以下要素中的至少一个要素具有相同的值时，所述至少一个要素被压缩：所述输入标签、所述输出标签和所述图表成本。5.根据权利要求2所述的加权有限状态变换器解码系统，其特征在于，对于相同的状态是起始点的一个或多个弧，当所述一个或多个弧中的所有弧的当前状态与下一状态相同时，所述下一状态被压缩。6.根据权利要求1所述的加权有限状态变换器解码系统，其特征在于，对于不同的状态是起始点的第一弧与第二弧，所述第一弧的位宽度的大小与所述第二弧的位宽度的大小彼此不同。7.根据权利要求1所述的加权有限状态变换器解码系统，其特征在于，对于相同的状态是起始点的一个或多个弧，位宽度的大小彼此相同。8.根据权利要求1所述的加权有限状态变换器解码系统，其特征在于，所述数据提取逻辑包括：加权有限状态变换器解压缩器，其被配置成对所述加权有限状态变换器数据进行解压缩；以及地址控制逻辑，其被配置成基于所述报头数据来计算所述主体数据的地址。9.根据权利要求1所述的加权有限状态变换器解码系统，其特征在于，所述加权有限状态变换器解码器还包括数据处理逻辑，所述数据处理逻辑被配置成接收由所述数据提取逻辑撷取的所述加权有限状态变换器数据，且被配置成使用输入数据导出输出数据。10.根据权利要求9所述的加权有限状态变换器解码系统，其特征在于，所述输入数据包括语音识别数据。11.一种语音识别系统，包括：话音采样模块，其被配置成将语音采样成数字数据；以及语音识别模块，其被配置成抽取所述数字数据的特征向量、对所述特征向量进行评分以形成被评分数据并通过引用加权有限状态变换器数据来从所...

【专利技术属性】
技术研发人员：尹哉盛，朴峻奭，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：韩国,KR

全部详细技术资料下载我是这个专利的主人