【技术实现步骤摘要】
使用关键语句适应性地识别语音
[0001]本公开涉及人工智能领域,更具体地,涉及使用关键语句适应性地识别语音。
技术介绍
[0002]语音识别器用于检测音频中的语句。例如,语句可以包括可用于执行一个或多个任务的命令。
技术实现思路
[0003]根据本公开的一方面,提供了一种装置。该装置包括:音频接收器,音频接收器用于接收音频流;关键语句检测器,关键语句检测器用于检测音频流中的关键语句;模型适配器,模型适配器用于基于关键语句来动态地适配模型;以及查询识别器,查询识别器用于通过该模型来检测音频流中跟随在关键语句之后的声音查询。
[0004]根据本公开的另一方面,提供了一种方法。该方法包括:经由处理器接收音频流;经由处理器检测音频流中的关键语句;经由处理器基于关键语句来动态地适配模型;以及经由处理器通过该模型来检测音频流中跟随在关键语句之后的声音查询。
[0005]根据本公开的另一方面,提供了一种计算机可读存储设备。该存储设备包括指令,所述指令当被执行时,使得一个或多个处理器至少检测音频流中的关键语 ...
【技术保护点】
【技术特征摘要】
1.一种装置,包括:音频接收器,所述音频接收器用于接收音频流;关键语句检测器,所述关键语句检测器用于检测所述音频流中的关键语句;模型适配器,所述模型适配器用于基于所述关键语句来动态地适配模型;以及查询识别器,所述查询识别器用于通过所述模型来检测所述音频流中跟随在所述关键语句之后的声音查询。2.根据权利要求1所述的装置,其中,所述关键语句检测器包括数字信号处理器。3.根据权利要求1所述的装置,其中,所述关键语句检测器和所述模型适配器包括神经网络。4.根据权利要求1-3中任一项所述的装置,其中,所述关键语句检测器包括超低功率声音唤醒单元,所述专用超低功率声音唤醒单元用于基于所述音频流中的语音特征来检测所述关键语句。5.根据权利要求1-4中任一项所述的装置,其中,所述关键语句包括唤醒语句。6.根据权利要求4或5所述的装置,还包括特征前端,所述特征前端用于基于所述音频流来计算所述语音特征。7.根据权利要求1-6中任一项所述的装置,其中,所述模型包括声学模型,所述声学模型用于生成多元音素上的概率分布。8.根据权利要求1-7中任一项所述的装置,其中,所述模型包括语言模型,所述语言模型用于计算最终字母序列。9.根据权利要求1-8中任一项所述的装置,其中,所述模型包括递归神经元网络。10.根据权利要求1-9中任一项所述的装置,其中,所述模型包括时间延迟神经元网络。11.根据权利要求1-10中任一项所述的装置,其中,所述模型适配器将各个时间步长处的误差后向传播回到初始状态。12.根据权利要求1-11中任一项所述的装置,其中,所述模型适配器在后向传递中对所述模型的多个权重进行调整。13.根据权利要求1-12中任一项所述的装置,其中,所述模型适配器通过将所述关键语句的经识别的多元音素概率分布与参考分布进行比较来计算误差。14.一种方法,包括:经由处理器接收音频流;经由所述处理器检测所述音频流中的关键语句;经由所述处理器基于所述关键语句来动态地适配模型;以及经由所述处理器通过所述模型来检测音频流中跟随在所述关键语句之后的声音查询。15.根据权利要求14所述的方法,其中,适配所述模型包括:将各个时间步长处的误差后向传播回到初始状态。16.根据权利要求14或15所述的方法,其中,适配所述模型包括:在后向传递中对所述模型的多个权重进行调整。17.根据权利要求14到16中任一项所述的方法,其中,适配所述模型包括:通过将所述关键语句的经识别的多元音素概率分布与参考分布进行比较来计算误差。18.根据权利要求14到17中任一项所述的方法,其中,适配所述模型包括:在后向传递
中对所述模型的初始状态进行调整。19.根据权利要求14到18中任一项所述的方法,其中,检测所述关键语句包括:在所述模型上执行前向传递。20.根据权利要求14到19中任一项所述的方法,其中,检测所述关键语句包括:通过超低功率唤醒语句检测器来对所...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。