当前位置: 首页 > 专利查询>搜诺思公司专利>正文

唤醒词检测抑制制造技术

技术编号:24254987 阅读:18 留言:0更新日期:2020-05-23 01:29
示例技术涉及确定NMD的方向。示例实现包括一种回放设备,回放设备接收表示音频内容的数据,以供回放设备进行回放。在回放设备回放音频内容之前,回放设备在音频内容中检测用于一个或多个语音服务的一个或多个唤醒词。回放设备使一个或多个联网麦克风设备在回放设备回放音频内容期间停用该一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应,并且经由一个或多个扬声器回放音频内容。在唤醒响应被启用时,给定联网麦克风设备对特定唤醒词的唤醒响应使给该定联网麦克风设备经由麦克风收听特定唤醒词之后的语音命令。

Wakeup word detection inhibition

【技术实现步骤摘要】
【国外来华专利技术】唤醒词检测抑制相关申请的交叉引用本申请要求2017年8月7日提交的美国专利申请No.15/670,361的优先权,其全部内容通过引用并入本文。
本公开涉及消费者产品,更具体地,涉及与媒体播放或者其某个方面有关的方法、系统、产品、特征、服务和其他元素。
技术介绍
访问和收听外放设置的数字音频的选项是有限的,直到2003年SONOS公司申请了其首批专利申请中的一件题为“MethodforSynchronizingAudioPlaybackbetweenMultipleNetworkedDevices”的专利申请,并在2005年开始出售媒体播放系统为止。Sonos无线高保真(HiFi)系统使人们可以通过一个或多个联网回放设备体验来自许多源的音乐。通过安装在智能电话、平板计算机或计算机上的软件控制应用,人们能够在具有联网回放设备的任何房间中播放他或她期望的内容。另外,使用控制器,例如,能够将不同的歌曲流传输到具有回放设备的每个房间,能够将房间组合在一起进行同步回放,或者可以在所有房间中同步收听相同的歌曲。鉴于对数字媒体的兴趣日益增长,仍然需要开发一种消费者易于使用的技术以进一步增强收听体验。附图说明参考以下说明书、所附权利要求和附图,可以更好地理解所公开的技术的特征、方面和优点,在附图中:图1示出可以实施某些实施例的示例媒体回放系统配置;图2示出示例回放设备的功能框图;图3示出示例控制设备的功能框图;图4示出示例控制器接口;图5示出示例处理系统;图6示出根据本文描述的方面的示例多个网络设备;图7示出根据本文描述的方面的示例网络麦克风设备的功能框图;图8示出停用一个或多个MD的唤醒响应的示例流程图;图9示出使NMD忽略唤醒词的示例消息;图10A、图10B、图10C、图10D示出了使NMD忽略唤醒词的示例指令;图11示出停用一个或多个NMD的唤醒响应的示例流程图;图12示出停用一个或多个NMD的唤醒响应的示例流程图;以及图13示出抑制唤醒响应的示例流程图。附图用于示出示例实施例的目的,但可以理解,本专利技术不限于附图中示出的布置和手段。具体实施方式I.概述联网麦克风设备(NMD)可用于使用语音控制来控制家庭。NMD可以是例如能够经由麦克风接收语音输入的司放设备、服务器或系统,或者其一部分。在一些示例中,回放设备是司放设备。另外,NMD可以是能够经由麦克风接收语音输入的另一设备、服务器或系统(例如,等),或者其一部分。2017年2月21日提交的题为“VoiceControlofaMediaPlaybackSystem”的美国申请No.15/438,749通过引用整体并入本文,其提供了启用语音的家庭架构的示例。语音控制对于“智能”家庭情况下的各种设备(例如回放设备、无线照明设备、恒温器、门锁、家庭自动化以及其他示例)可以是有益的。在一些实施方式中,由NMD检测到的语音输入被发送给语音服务以进行处理。NMD与回放设备一起可以用作到语音服务的麦克风/扬声器接口。语音输入由NMD的麦克风检测,然后传输给特定的语音服务进行处理。然后,语音服务可以返回命令或语音输入的其他结果。唤醒词的发音可以调用语音服务。例如,在查询语音服务时,用户可以说出唤醒词“Alexa”,然后进行语音输入。其他示例包括用于查询语音服务的“好,Google”和用于查询语音服务的“嘿,Siri”。存在唤醒词和语音服务的其他示例。在检测到唤醒词之后,NMD可以通过经由麦克风收听唤醒词之后的语音命令来做出响应。该响应在本文中被称为NMD的“唤醒响应”。在一些情况下,回放包括唤醒词的音频内容可能错误地触发NMD的唤醒响应。许多语音服务的唤醒词是从现有语言的词汇中选择的预先存在的词。例如,几种流行的语音服务使用给定名称作为唤醒词(例如“Alexa”和“Siri”)。因此,在一些情况下,诸如谈话节目、电影、电视节目、播客、互联网流式视频等的所记录的音频内容可能包括唤醒词或类似词。在NMD范围内回放这类音频内容可能错误地触发NMD,出于许多原因,这可能是不希望的,原因包括它可能干扰对音频内容的赏析。例如,电视可以回放针对给定语音服务的广告。在广告期间,演员可能说出语音服务的唤醒词,也许是为了演示语音服务是如何被调用的。与电视位于同一房间的NMD可能检测到来自电视的音频输入,并且当NMD检测到广告中的唤醒词时调用语音服务。这可能是不希望的。此外,由于广告可以同时在许多电视上播放,因此广告可以同时触发许多NMD,这可能导致对语音服务的请求发生不希望的激增。为了避免其广告引起误触发,语音服务的运营商可以标记其广告中包括唤醒词的部分,并对他们的NMD进行编程以忽视这些被标记的部分。例如,运营商可以将音调或其他音频标记混入语音服务的广告中,并对他们的NMD进行编程,以忽视与该音频标记一起检测到的唤醒词。该实现在有限的情况下(例如语音服务的广告,其中语音服务的运营商可以将该标记嵌入音频内容中)可能是有用的。然而,对于语音服务的运营商无法控制的绝大多数其他音频内容,该实现没有用。本文描述的示例技术可以包括:在音频内容被回放设备可听地回放之前,对要被回放设备回放的音频内容进行处理,确定音频内容是否包括一个或多个唤醒词,并且通知一个或多个NMD在该一个或多个回放设备回放唤醒词时忽略这些唤醒词。以这种方式,该技术可以帮助防止NMD的错误触发。显然,这些技术可以适用于要被回放设备回放的任何所记录的音频内容。例如,回放设备可以接收音频内容以供回放。在播放音频内容之前,回放设备将音频内容存储在存储器中(例如,在缓冲器中),并对音频内容运行唤醒词检测算法。如果在音频内容中检测到任何唤醒词,则当回放设备最终回放音频内容时,回放设备(可以是NMD本身)使一个或多个NMD忽略这些唤醒词。作为另一示例,NMD可以接收已经被指定由回放设备回放的音频内容。在回放设备回放音频内容之前,NMD可以对音频内容运行唤醒词检测算法。如果在音频内容中检测到任何唤醒词,则当唤醒词最终被回放设备回放时,NMD可以使其本身(以及可能附近的其他NMD)忽略这些唤醒词。NMD可以使用各种技术中的任一种来忽略唤醒词。在一些情况下,可以指示NMD在唤醒词被回放设备回放时不检测唤醒词,这可能通过指示NMD停止收听唤醒词,通过停用NMD的麦克风阵列一段时间,或者通过在回放设备的方向创建收听无效(NULL)等来进行。备选地,NMD可以继续最初地检测唤醒词,但是NMD被指示抑制其经编程的唤醒响应,该经编程的唤醒响应对检测到唤醒词进行响应而调用语音服务,这可能通过在某些时段期间忽略唤醒词,或者通过在某些时段期间忽略所有所记录的音频来进行。当在回放设备可听地回放音频内容之前处理音频内容时,处理设备(例如,回放设备或NMD)也可以确定所记录的音频内容的哪些部分包含唤醒词。这些部分可以由音频内容内的时间段来定义,例如唤醒词的开始本文档来自技高网...

【技术保护点】
1.一种回放设备,包括:/n网络接口;/n一个或多个处理器;/n存储有指令的有形非暂时性计算机可读介质,所述指令能够由所述一个或多个处理器执行,以使所述回放设备执行以下操作:/n经由所述网络接口接收表示音频内容的数据,以供所述回放设备回放;/n在所述回放设备回放所述音频内容之前,在所述音频内容中检测用于一个或多个语音服务的一个或多个唤醒词;/n使一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应,其中,在唤醒响应被启用时,给定联网麦克风设备对特定唤醒词的唤醒响应使所述给定联网麦克风设备经由麦克风收听所述特定唤醒词之后的语音命令;以及/n经由一个或多个扬声器回放所述音频内容。/n

【技术特征摘要】
【国外来华专利技术】20170807 US 15/670,3611.一种回放设备,包括:
网络接口;
一个或多个处理器;
存储有指令的有形非暂时性计算机可读介质,所述指令能够由所述一个或多个处理器执行,以使所述回放设备执行以下操作:
经由所述网络接口接收表示音频内容的数据,以供所述回放设备回放;
在所述回放设备回放所述音频内容之前,在所述音频内容中检测用于一个或多个语音服务的一个或多个唤醒词;
使一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应,其中,在唤醒响应被启用时,给定联网麦克风设备对特定唤醒词的唤醒响应使所述给定联网麦克风设备经由麦克风收听所述特定唤醒词之后的语音命令;以及
经由一个或多个扬声器回放所述音频内容。


2.根据权利要求1所述的回放设备,其中,所述回放设备包括所述给定联网麦克风设备,并且其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:
在回放所述音频内容的同时,经由所述麦克风记录正在回放的音频内容;以及
停用所述给定联网麦克风设备对所记录的音频内容中的所述一个或多个唤醒词的相应唤醒响应。


3.根据权利要求1所述的回放设备,其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:
经由所述网络接口向所述一个或多个联网麦克风设备发送指令,所述指令使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应。


4.根据权利要求3所述的回放设备,其中,所述一个或多个联网麦克风设备是家中的联网麦克风设备的子集,并且其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:
确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近;以及
响应于确定所述一个或多个联网麦克风在所述音频内容的可听范围附近,发送使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对所述一个或多个唤醒词的相应唤醒响应的指令。


5.根据权利要求4所述的回放设备,其中,所述一个或多个联网麦克风设备包括相应的回放设备,并且其中,确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近包括:确定所述一个或多个联网麦克风设备与所述回放设备处于同步回放配置中。


6.根据权利要求4所述的回放设备,其中,确定所述一个或多个联网麦克风设备在所述音频内容的可听范围附近包括:确定所述一个或多个联网麦克风设备在所述回放设备的可听范围附近。


7.根据权利要求1所述的回放设备,其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:
在回放所述音频内容之前,修改所述音频内容以将声学标记并入所述音频内容的表示相应唤醒词的片段中,其中,检测所述声学标记以使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应。


8.根据权利要求1所述的回放设备,其中,检测所述一个或多个唤醒词包括对所述音频内容应用多个唤醒词检测算法,其中,所述多个唤醒词检测算法包括用于第一语音服务的第一唤醒词检测算法和用于第二语音服务的第二唤醒词检测算法,并且其中,在所述回放设备回放所述音频内容之前对所述音频内容应用多个唤醒词检测算法包括:
在所述回放设备回放所述音频内容之前,对所述音频内容应用用于所述第一语音服务的第一音频检测算法,以检测用于所述第一语音服务的至少一个第一唤醒词;以及
在所述回放设备回放所述音频内容之前,对所述音频内容应用用于所述第二语音服务的第二音频检测算法,以检测用于所述第二语音服务的至少一个第二唤醒词,其中,所述第二唤醒词与所述第一唤醒词不同。


9.根据权利要求8所述的回放设备,其中,所述一个或多个联网麦克风设备包括第一联网麦克风设备和第二联网麦克风设备,并且其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:
使所述第一联网麦克风设备停用所述第一联网麦克风设备对检测到的至少一个第一唤醒词的相应唤醒响应;以及
使所述第二联网麦克风设备停用所述第二联网麦克风设备对检测到的至少一个第二唤醒词的相应唤醒响应。


10.根据权利要求1所述的回放设备,其中,在所述音频内容中检测用于一个或多个语音服务的一个或多个唤醒词包括检测特定唤醒词在所述音频内容中的多个实例,并且其中,使所述一个或多个联网麦克风设备在所述回放设备回放所述音频内容期间停用所述一个或多个联网麦克风设备对检测到的一个或多个唤醒词的相应唤醒响应包括:使所述一个或多个联网麦克风设备停用所述一个或多个联网麦克风设备的相应唤醒响应,直到每个联网麦克风设备已经检测到与在所述音频内容中检测到的所述特定唤醒词的所述多个实例的数量相等数量的唤醒词为止。


11.一种存储有指令的有形非暂时性计算机可读介质,所述指令能够由一个或多个处理器执行,以使回放设备执行以下操作:
经由网络接口接收表示音频内容的数据,以供所述回放设备回放;
在所述回放设备回放所述音频...

【专利技术属性】
技术研发人员:乔纳森·P·朗格
申请(专利权)人:搜诺思公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1