使用关键语句适应性地识别语音制造技术

技术编号：28758719 阅读：30 留言：0更新日期：2021-06-09 10:32

本公开涉及使用关键语句适应性地识别语音。一种用于识别语音的示例装置包括音频接收器，用于接收音频流。该装置还包括关键语句检测器，用于检测音频流中的关键语句。该装置还包括模型适配器，用于基于检测到的关键语句来动态地适配模型。该装置还包括查询识别器，用于通过经适配的模型来检测音频流中跟随在关键语句之后的声音查询。键语句之后的声音查询。键语句之后的声音查询。

全部详细技术资料下载

【技术实现步骤摘要】
使用关键语句适应性地识别语音

[0001]本公开涉及人工智能领域，更具体地，涉及使用关键语句适应性地识别语音。

技术介绍

[0002]语音识别器用于检测音频中的语句。例如，语句可以包括可用于执行一个或多个任务的命令。

技术实现思路

[0003]根据本公开的一方面，提供了一种装置。该装置包括：音频接收器，音频接收器用于接收音频流；关键语句检测器，关键语句检测器用于检测音频流中的关键语句；模型适配器，模型适配器用于基于关键语句来动态地适配模型；以及查询识别器，查询识别器用于通过该模型来检测音频流中跟随在关键语句之后的声音查询。
[0004]根据本公开的另一方面，提供了一种方法。该方法包括：经由处理器接收音频流；经由处理器检测音频流中的关键语句；经由处理器基于关键语句来动态地适配模型；以及经由处理器通过该模型来检测音频流中跟随在关键语句之后的声音查询。
[0005]根据本公开的另一方面，提供了一种计算机可读存储设备。该存储设备包括指令，所述指令当被执行时，使得一个或多个处理器至少检测音频流中的关键语句；基于关键语句来动态地适配模型；并且通过该模型来检测音频流中跟随在关键语句之后的声音查询。
[0006]根据本公开的另一方面，提供了一种设备。该设备包括：用于接收音频流的装置；用于检测音频流中的关键语句的装置；用于基于关键语句来动态地适配模型的装置；以及用于通过该模型来检测音频流中跟随在关键语句之后的声音查询的装置。
附图说明
[0007]图1是示出用于利用适应性语音识别...

【技术保护点】

【技术特征摘要】
1.一种装置，包括：音频接收器，所述音频接收器用于接收音频流；关键语句检测器，所述关键语句检测器用于检测所述音频流中的关键语句；模型适配器，所述模型适配器用于基于所述关键语句来动态地适配模型；以及查询识别器，所述查询识别器用于通过所述模型来检测所述音频流中跟随在所述关键语句之后的声音查询。2.根据权利要求1所述的装置，其中，所述关键语句检测器包括数字信号处理器。3.根据权利要求1所述的装置，其中，所述关键语句检测器和所述模型适配器包括神经网络。4.根据权利要求1-3中任一项所述的装置，其中，所述关键语句检测器包括超低功率声音唤醒单元，所述专用超低功率声音唤醒单元用于基于所述音频流中的语音特征来检测所述关键语句。5.根据权利要求1-4中任一项所述的装置，其中，所述关键语句包括唤醒语句。6.根据权利要求4或5所述的装置，还包括特征前端，所述特征前端用于基于所述音频流来计算所述语音特征。7.根据权利要求1-6中任一项所述的装置，其中，所述模型包括声学模型，所述声学模型用于生成多元音素上的概率分布。8.根据权利要求1-7中任一项所述的装置，其中，所述模型包括语言模型，所述语言模型用于计算最终字母序列。9.根据权利要求1-8中任一项所述的装置，其中，所述模型包括递归神经元网络。10.根据权利要求1-9中任一项所述的装置，其中，所述模型包括时间延迟神经元网络。11.根据权利要求1-10中任一项所述的装置，其中，所述模型适配器将各个时间步长处的误差后向传播回到初始状态。12.根据权利要求1-11中任一项所述的装置，其中，所述模型适配器在后向传递中对所述模型的多个权重进行调整。13.根据权利要求1-12中任一项所述的装置，其中，所述模型适配器通过将所述关键语句的经识别的多元音素概率分布与参考分布进行比较来计算误差。14.一种方法，包括：经由处理器接收音频流；经由所述处理器检测所述音频流中的关键语句；经由所述处理器基于所述关键语句来动态地适配模型；以及经由所述处理器通过所述模型来检测音频流中跟随在所述关键语句之后的声音查询。15.根据权利要求14所述的方法，其中，适配所述模型包括：将各个时间步长处的误差后向传播回到初始状态。16.根据权利要求14或15所述的方法，其中，适配所述模型包括：在后向传递中对所述模型的多个权重进行调整。17.根据权利要求14到16中任一项所述的方法，其中，适配所述模型包括：通过将所述关键语句的经识别的多元音素概率分布与参考分布进行比较来计算误差。18.根据权利要求14到17中任一项所述的方法，其中，适配所述模型包括：在后向传递
中对所述模型的初始状态进行调整。19.根据权利要求14到18中任一项所述的方法，其中，检测所述关键语句包括：在所述模型上执行前向传递。20.根据权利要求14到19中任一项所述的方法，其中，检测所述关键语句包括：通过超低功率唤醒语句检测器来对所...

【专利技术属性】
技术研发人员：克尔兹托夫，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人