声学处理单元接口制造技术

技术编号:10619124 阅读:134 留言:0更新日期:2014-11-06 12:36
本发明专利技术的实施例包括一种装置,方法以及系统,用于声学建模。在一实施例中,提供一种语音识别系统。该系统包括一处理单元用以将一接收到的音频信号分割成具有个别帧向量的连续帧、一声学处理单元(APU)、一数据总线用以耦合该处理单元以及该声学处理单元。该APU包括一局部非易失性存储器用以储存多个聚类状态、一记忆缓冲器用以耦合到该存储器、以及一计分单元,该声学处理单元用以将至少一储存于该存储器中的高斯机率分布向量加载至该记忆缓冲器,该计分单元用以同时比较一加载至该记忆缓冲器的高斯机率分布向量的多个维度和一从该处理单元接收的帧向量的各别维度,并输出一对应分数至该处理单元。该APU使用一第一帧来执行一比较而该处理单元使用一对应一第二帧的分数来执行一搜寻操作,且该第二帧紧接着先前的第一帧。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】本专利技术的实施例包括一种装置,方法以及系统,用于声学建模。在一实施例中,提供一种语音识别系统。该系统包括一处理单元用以将一接收到的音频信号分割成具有个别帧向量的连续帧、一声学处理单元(APU)、一数据总线用以耦合该处理单元以及该声学处理单元。该APU包括一局部非易失性存储器用以储存多个聚类状态、一记忆缓冲器用以耦合到该存储器、以及一计分单元,该声学处理单元用以将至少一储存于该存储器中的高斯机率分布向量加载至该记忆缓冲器,该计分单元用以同时比较一加载至该记忆缓冲器的高斯机率分布向量的多个维度和一从该处理单元接收的帧向量的各别维度,并输出一对应分数至该处理单元。该APU使用一第一帧来执行一比较而该处理单元使用一对应一第二帧的分数来执行一搜寻操作,且该第二帧紧接着先前的第一帧。【专利说明】声学处理单元接口
本专利技术的实施例一般关于语音辨识。更详而言之,本专利技术的实施例有关于声学建模过程在专用处理单元上的实施。
技术介绍
即时数据模式的辨识逐渐被用于分析电子系统中的数据串流。在具有数以万字的词汇上,语音辨识系统已达到更高的精度,使其成为对于电子系统而言具吸引力的特征。举例而言,语音识别系统针对数据模式辨识的应用也越来越常见于在消费市场中,例如,行动装置,服务器,汽车,以及个人电脑的市场。 尽管在语音识别系统中有改良的精确度,显著计算资源专用于语音识别程序,依次设置显著负载于计算系统,例如,多用户/多程式环境。多程式的计算系统同时处理来自不同应用程式的数据,因此,由语音识别过程设在这些计算系统上的负载影响了该计算系统可处理传入的声音信号以及来自其他应用程式的数据的速度。此外,对于通常包括有限的存储器资源(相对于桌面计算系统)的手持装置,语音识别应用不仅设置显著负载于手持装置的计算资源上,而且消耗该手持装置的存储器资源的显著部分。上述语音识别系统的处理能力、速度和存储器资源的问题会因需要处理即时或实质上接近即时的输入声音信号而进一步恶化。
技术实现思路
因此,有必要改善语音识别系统对计算系统的处理能力、速度、以及存储器资源方面的负载。 于一实施型态中,提供一种语音辨识系统。该系统包括一处理单元用以将一接收到的音频信号分割成具有各别帧向量的连续性帧、一声学处理单元(APU)、一数据总线用以耦合该处理单元和该声学处理单元。该声学处理单元包含一局部非易失性存储器用以储存多个聚类状态、一耦合该存储器的记忆缓冲器、以及一计分单元,该声学处理单元用以将至少一储存于该存储器的高斯机率分布向量加载至该记忆缓冲器中,该计分单元用以同时比较一加载至该记忆缓冲器的高斯机率分布向量的多个维度和一从该处理单元接收的帧向量的各别维度,并输出一对应分数至该处理单元。该声学处理单元使用一第一帧来执行一比较而该处理单元使用一对应一第二帧的分数来执行一搜寻操作,该第二帧紧接着先前的该第一中贞。 于本专利技术的另一实施型态包括一声学处理方法。该方法包括使用一处理单元将一接收到的音频信号分割成多个帧,使用一声学处理单元(APU)去比较一与该多个帧中的一第一帧相关的特征向量和一高斯机率分布向量以产生一分数,以及在比较同时,使用该处理单元使用对应于与从一声学处理单元(APU)所接收到的该多个帧中的一第二帧相关的特征向量的分数进行搜寻操作,其中,该第二帧紧接着该第一帧,且其中,该处理单元与该声学处理单元耦合在一数据总线上。 进一步实施型态包括一种计算器可读取媒体,具有存于其中的由一个或多个处理器所执行的一个或多个指令中的一个或多个序列,用以执行一声学处理方法。该方法包含使用一处理单元将一接收到的音频信号分割成多个帧,输出一与该多个帧中的一第一帧相关的特征向量至一声学处理单元,其中,该声学处理单元用以比较该第一帧和一高斯机率分布向量以产生一分数,以及在比较同时,使用该处理单元使用对应于与从一声学处理单元(APU)所接收到的该多个帧中的一第二帧相关的特征向量的分数进行搜寻操作,其中,该第二帧紧接着该第一帧,且其中,该处理单元与该声学处理单元耦合在一数据总线上。 本专利技术的实施例的进一步特征与优点,以及本专利技术的不同实施例中的架构与运作,皆参照附图被加以详细描述。值得注意的是,本专利技术并不限于本文所述的具体实施例。这样的实施方案在本文中提出,仅供参考。其他的实施例对于熟习此技艺的相关领域人士而言将是显而易见的。 【专利附图】【附图说明】 在此引入附图并构成本说明书的一部分,附图示出了本专利技术的实施例,并与说明书一起,进一步用于解释本专利技术的原理,并使得该领域中熟习此技艺的人士能够实施或使用本专利技术。 图1根据本专利技术的实施例的语音识别过程的示范流程示意图。 图2为现有的语音辨识系统的示意图。 图3是现有的语音识别系统与由个别处理单元执行的语音识别过程的示意图。 图4是在由声学处理单元(APU)和中央处理单元(CPU)执行的语音识别过程的实施例示意图。 图5是语音识别系统的周边控制器接口(PCI)的总线架构的实施例示意图。 图6是语音识别系统的进阶周边总线(APB)架构的实施例示意图。 图7是语音识别系统的低功耗双倍数据速率(LPDDR)总线架构的实施例示意图。 图8是语音识别系统中的系统级架构实施例示意图。 图9是数据模式分析方法的一实施例示意图。 图10是具有集成的特定应用积体电路(ASIC)和存储器装置的语音识别系统的系统级架构实施例示意图。 图11是具有集成的特定应用积体电路(ASIC)、易失性存储器装置、以及非易失性存储器装置的语音识别系统的系统级架构实施例示意图。 图12是具有包括特定应用积体电路(ASIC)和中央处理单元(CPU)的系统晶片的语音识别系统的系统级架构实施例示意图。 图13是另一具有包括特定应用积体电路(ASIC)和中央处理单元(CPU)的系统晶片的语音识别系统的系统级架构实施例示意图。 图14是声学处理单元(APU)的实施例示意图。 图15是用于声学处理单元(APU)的聚类状态计分单元(SSU)控制器的实施例示意图。 图16是用于声学处理单元(APU)的距离计算器的实施例示意图。 图17是用于声学处理单元(APU)的声学建模过程的方法的实施例示意图。 图18是根据本专利技术的实施例所述的运算逻辑单元的实施示意图。 图19是根据本专利技术的实施例在图18所示的运算逻辑单元的实施例示意图。 图20是根据本专利技术的实施例所述的计算单元的实施示意图。 图21是用于计算一维距离分数的方法的实施例示意图。 图22与图23是声音处学系统的实施例不意图。 图24是硬件加速器的实施例示意图。 图25是APU软件堆迭的方块示意图。 图26是并行处理的实施例示意图。 图27是声学处理方法的实施例示意图。 图28是本专利技术中的实施方式中,或其部分可被实现为计算机可读取代码的示例计算机系统的实施例示意图。 【具体实施方式】 下面的详细描述参照附图,说明示例性实施例与本专利技术是一致的。其它实施例是可能的,并且可在本专利技术的精神和范围内进行实施例修正,因此,详细描述并不意味着限制本专利技术的范围,相反,本专利技术的范围由权利要求书限定。 这对一在该相关领域中熟习此技艺的人士而言将是显本文档来自技高网
...
声学处理单元接口

【技术保护点】
一种语音辨识系统,包括:处理单元,用以将一接收到的音频信号分割成具有各自的帧向量的连续帧;声学处理单元(APU),包含:局部非易失性存储器,用以储存多个聚类状态;记忆缓冲器,耦合到该存储器,其中,该声学处理单元用以将至少一储存于该存储器中的高斯机率分布向量加载至该记忆缓冲器;以及计分单元,用以同时比较一加载至该记忆缓冲器的高斯机率分布向量的多个维度和一从该处理单元接收的帧向量的各别维度,并输出一对应分数至该处理单元;其中,该声学处理单元使用一第一帧来执行一比较而该处理单元使用一对应一第二帧的分数来执行一搜寻操作,该第二帧紧接着先前的该第一帧;以及数据总线,用以耦合该处理单元和该声学处理单元。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:V·纳塔拉詹S·罗斯内
申请(专利权)人:斯班逊有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1