声学处理单元制造技术

技术编号:10573917 阅读:104 留言:0更新日期:2014-10-29 09:19
本发明专利技术的具体实施例包括用于声学建模的设备、方法以及系统。本设备可包括聚类状态(senone)计分单元(SSu)控制模块、距离计算器以及加法模块。可将SSu控制模块配置成用来接收特征向量。可将距离计算器配置成用来经由宽度为至少一个高斯机率分布的数据总线,接收多个高斯(Gaussian)机率分布,并且从SSu控制模块接收特征向量。距离计算器可包括多个用于计算多个维度距离分数的算术逻辑单元以及用于合计维度距离分数的累加器以产生高斯距离分数。另外,将加法模块配置成用来合计多个高斯距离分数,以产生聚类状态分数。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】本专利技术的具体实施例包括用于声学建模的设备、方法以及系统。本设备可包括聚类状态(senone)计分单元(SSu)控制模块、距离计算器以及加法模块。可将SSu控制模块配置成用来接收特征向量。可将距离计算器配置成用来经由宽度为至少一个高斯机率分布的数据总线,接收多个高斯(Gaussian)机率分布,并且从SSu控制模块接收特征向量。距离计算器可包括多个用于计算多个维度距离分数的算术逻辑单元以及用于合计维度距离分数的累加器以产生高斯距离分数。另外,将加法模块配置成用来合计多个高斯距离分数,以产生聚类状态分数。【专利说明】声学处理单元
本专利技术的具体实施例基本上是涉及语音辨识。特别是,本专利技术的具体实施例是涉 及在专用处理单元上声学建模程序的实现。
技术介绍
实时数据模式辨识系逐渐用于在电子系统中分析数据流。语音辨识系统已在具有 超过数万字的词汇表上改良了精确度,令其成为电子系统中引人注目的特征。例如,在针对 数据模式辨识应用的消费性市场(举例如:移动装置、伺服器、汽车以及PC市场)中,语音 辨识系统越来越普遍。 尽管语音辨识系统的精确度已改良,语音辨识程序仍需大量的专用运算资源,转 而对运算系统(举例如:多用户/多程式环境)造成很大的负担。多程式运算系统并行处 理来自各个应用程式的数据,以致这些运算系统上因语音辨识程序造成的负载,影响到运 算系统能处理输入语音信号以及来自其它应用程式的数据的速度。再者,对于一般含有限 内存资源的手持式装置(相较于桌上型计算系统)而言,语音辨识应用程式不仅对手持式 装置的运算资源造成显著负担,也消耗了手持式装置很大部分的内存资源。上述语音辨识 系统在处理能力、速度以及内存资源方面的问题,因处理实时或实质接近实时输入语音信 号的需求而更加恶化。
技术实现思路
因此,有必要改善语音辨识系统对运算系统在处理能力、速度以及内存资源方面 的负载。 本专利技术的一个具体实施例包括聚类状态(senone)计分单元(SSU)。SSU可包括 SSU控制模块、距离计算器以及加法模块。可将SSU控制模块配置成用来接收特征向量。可 将距离计算器配置成用来经由宽度为至少一个高斯机率分布的数据总线(例如:768个位 (bit)),接收多个高斯(Gaussian)机率分布,并且从SSU控制模块接收特征向量。距离计 算器可包括多个算术逻辑单元(ALUs)以及累加器。可将每一个ALU都配置成用来接收至 少一个高斯机率分布的一部分,并且计算介于特征向量之维度与至少一个高斯机率分布之 对应维度之间的维度距离分数。可将累加器配置成用来合计来自多个ALUs之维度距离分 数,以产生高斯距离分数。另外,可将加法模块配置成用来合计对应于多个高斯机率分布之 多个高斯距离分数,以产生聚类状态分数。SSU还可包括特征向量矩阵模块,系配置成用来 为特征向量之维度存储比例因数。 本专利技术的另一具体实施例包括用于声学建模的方法。本方法可包括下列步骤:经 由宽度为至少一个高斯机率分布之数据总线接收多个高斯机率分布,并且从外部运算装置 接收特征向量;基于特征向量之多个维度和至少一个高斯机率分布之对应的多个维度,计 算多个维度距离分数;合计多个维度距离分数而为至少一个高斯机率分布产生高斯距离分 数;以及,合计对应于多个高斯机率分布之多个高斯距离分数以产生聚类状态分数。 本专利技术的再一具体实施例包括用于声学建模的系统。本系统可包括内存模块及聚 类状态计分单元(SSU)。可将内存模块配置成用来与外部运算装置接合以接收特征向量。 SSU可包括距离计算器及加法模块,其中距离计算器包括多个算术逻辑单元(ALUs)以及累 加器。可将每一个ALU都配置成用来接收至少一个高斯机率分布的一部分,并且计算介于 特征向量之维度与至少一个高斯机率分布之对应维度之间的维度距离分数。可将累加器配 置成用来合计来自多个ALUs之维度距离分数,以产生高斯距离分数。另外,可将加法模块 配置成用来合计对应于多个高斯机率分布之多个高斯距离分数,以产生聚类状态分数。可 将内存模块及SSU整合在相同的晶片上。 本专利技术具体实施例另外的特征和优点以及本专利技术各个具体实施例的运作是引用 附图予以在下文中详述。注意到的是,本专利技术不局限于本文所述的特定具体实施例。此等 在本文呈现的具体实施例仅供描述之用。基于本文所含的指导,另外的具体实施例对于相 关领域技术熟练者而言,将是显而易知的。 【专利附图】【附图说明】 附图合并于本文中以及形成本专利技术的说明书、描述性具体实施例的一部分,并且 连同说明进一步用于解释本专利技术的原理,以及让相关领域技术熟练者能够制作且使用本发 明。 图1描述根据本专利技术一具体实施例的语音辨识程序的示例性流程图。 图2描述现有的语音辨识系统。 图3描述现有由个别处理单元进行语音辨识程序的语音辨识系统。 图4描述由声学处理单元(APU)和中央处理单元(CPU)进行的语音辨识程序的具 体实施例。 图5描述供语音辨识系统用的周边控制器接口(PCI)总线架构的具体实施例。 图6描述供语音辨识系统用的先进周边总线(APB)架构的具体实施例。 图7描述供语音辨识系统用的低功率双倍数据速率(LPDDR)总线架构的具体实施 例。 图8描述供语音辨识系统用的系统级架构的具体实施例。 图9描述数据模式分析用方法的具体实施例。 图10描述供整合有特定应用集成电路(ASIC)和内存装置的语音辨识系统用的系 统级架构的具体实施例。 图11描述供整合有特定应用集成电路(ASIC)、易失性内存装置、以及非易失性内 存装置之语音辨识系统用的系统级架构的具体实施例。 图12描述供具有系统晶片的语音辨识系统用的系统级架构的具体实施例,此系 统晶片包括特定应用集成电路(ASIC)和中央处理单元(CPU)。 图13描述供具有系统晶片的语音辨识系统用的系统级架构的另一具体实施例, 此系统晶片包括特定应用集成电路(ASIC)和中央处理单元(CPU)。 图14描述声学处理单元(APU)的具体实施例。 图15描述供声学处理单元(APU)用的聚类状态计分单元(SSU)控制器的具体实 施例。 图16描述供声学处理单元(APU)用的距离计算器的具体实施例。 图17描述供声学处理单元(APU)用的声学建模程序的方法的具体实施例。 图18为根据本专利技术的具体实施例,描述算术逻辑单元的具体实施例。 图19为根据本专利技术的具体实施例,描述图18中所示算术逻辑单元的具体实施例。 图20为根据本专利技术的具体实施例,描述运算单元的具体实施例。 图21描述供运算一维距离分数用的方法的具体实施例。 图22和图23描述声学处理系统的具体实施例。 图24描述硬件加速器的具体实施例。 图25为描述APU软件堆栈的方块图。 图26描述并行处理的具体实施例。 图27描述声学处理方法的具体实施例。 图28描述示例计算机系统的具体实施例,可将其中本专利技术的具体实施例、或其部 分实现成计算机可读码。 【具体实施方式】 底下的详细说明提到描述与本专利技术一致的示例性具体实施例的附图。其它具体实本文档来自技高网
...

【技术保护点】
一种聚类状态计分单元(SSU),其包含:SSU控制模块,配置成用来接收特征向量;距离计算器,配置成用来经由宽度为至少一个高斯机率分布的数据总线接收多个高斯机率分布,并且从该SSU控制模块接收该特征向量,该距离计算器包含:多个算术逻辑单元(ALU),其中各该多个算术逻辑单元配置成用来接收该至少一个高斯机率分布的一部分,并且计算介于该特征向量的维度与该至少一个高斯机率分布的对应维度之间的维度距离分数;以及累加器,配置成用来合计来自该多个算术逻辑单元的所述维度距离分数,以产生高斯距离分数;以及加法模块,配置成用来合计对应于该多个高斯机率分布的多个高斯距离分数,以产生聚类状态分数。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:R·法斯托J·奥尔森S·罗哈尼
申请(专利权)人:斯班逊有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利