【技术实现步骤摘要】
【国外来华专利技术】使用神经网络模型进行选择性唤醒词检测的系统和方法相关申请的交叉引用本申请要求于2018年9月28日提交的美国专利申请No.16/145,275的优先权,其全部内容通过引用并入本文。
本技术涉及消费品,并且更具体地,涉及针对语音可控媒体回放系统或其一些方面的方法、系统、产品、特征、服务和其他元素。
技术介绍
访问和收听外放设置中的数字音频的选项是有限的,直到2003年SONOS公司申请了其首批专利申请中的一件题为“MethodforSynchronizingAudioPlaybackbetweenMultipleNetworkedDevices(用于在多个联网设备之间同步音频播放的方法)”的专利申请,并在2005年开始出售媒体回放系统。SONOS无线高保真(HiFi)系统使人们可以通过一个或多个联网回放设备体验来自许多源的音乐。通过安装在智能电话、平板计算机或计算机上的软件控制应用,人们能够在具有联网回放设备的任何房间中播放他或她期望的内容。另外,使用控制器,例如,能够将不同的歌曲流传输到具有回放设备的每个房间 ...
【技术保护点】
1.一种方法,包括:/n通过网络麦克风设备捕获声音数据;/n通过所述网络麦克风设备,使用关键词发现算法(576)来识别所述声音数据中的候选唤醒词;/n基于对所述声音数据中候选唤醒词的识别,从多个唤醒词引擎(570a、570b、571)中选择第一唤醒词引擎(570a、570b、571);/n利用所述第一唤醒词引擎(570a、570b、571),分析所述声音数据以确认检测到唤醒词;以及/n当所述第一唤醒词引擎(570a、570b、571)确认检测到所述唤醒词时,向一个或多个与语音助手服务相关联的远程计算设备发送所述声音数据的语音发声。/n
【技术特征摘要】
【国外来华专利技术】20180928 US 16/145,2751.一种方法,包括:
通过网络麦克风设备捕获声音数据;
通过所述网络麦克风设备,使用关键词发现算法(576)来识别所述声音数据中的候选唤醒词;
基于对所述声音数据中候选唤醒词的识别,从多个唤醒词引擎(570a、570b、571)中选择第一唤醒词引擎(570a、570b、571);
利用所述第一唤醒词引擎(570a、570b、571),分析所述声音数据以确认检测到唤醒词;以及
当所述第一唤醒词引擎(570a、570b、571)确认检测到所述唤醒词时,向一个或多个与语音助手服务相关联的远程计算设备发送所述声音数据的语音发声。
2.根据权利要求1所述的方法,其中,识别所述候选唤醒词包括:确定所述候选唤醒词在所述声音数据中存在的概率。
3.根据权利要求2所述的方法,其中,所述唤醒词引擎(570a、570b、571)被配置为确定所述候选唤醒词在所述声音数据中是否以比所述关键词发现算法(576)更高的精度存在。
4.根据前述权利要求中任一项所述的方法,其中,所述关键词发现算法(576)被配置为识别与多个相应语音助手服务和相应唤醒词引擎相对应的多个唤醒词。
5.根据前述权利要求中任一项所述的方法,其中,相对于所述多个唤醒词引擎(570a、570b、571),所述关键词发现算法(576)至少为以下中的一项:
在计算上不太复杂;以及
消耗更少的存储空间。
6.根据前述权利要求中任一项所述的方法,其中,所述第一唤醒词引擎(570a、570b、571)与所述候选唤醒词相关联,并且其中,所述多个唤醒词引擎(570a、570b、571)中的另一个与一个或多个附加唤醒词相关联。
7.根据前述权利要求中任一项所述的方法,其中,识别所述候选唤醒词包括:将神经网络模型(802)应用于所述声音数据。
8.根据权利要求7所述的方法,其中,所述神经网络模型(802)包括压缩神经网络模型(804)。
9.根据权利要求7或8所述的方法,其中,所述神经网络模型(802、804)被本地存储在NMD上。
10.根据权利要求8或9所述的方...
【专利技术属性】
技术研发人员:约阿希姆·范伯格,丹妮亚·贾科贝洛,克劳斯·哈顿,
申请(专利权)人:搜诺思公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。