当前位置: 首页 > 专利查询>搜诺思公司专利>正文

使用噪声分类优化网络麦克风设备制造技术

技术编号:29883132 阅读:16 留言:0更新日期:2021-09-01 00:01
本文公开了用于使用噪声分类来优化网络麦克风设备的系统和方法。在一个示例中,网络麦克风设备(NMD)的各个麦克风检测声音。分析声音数据以检测触发事件,例如唤醒词。在NMD的回溯缓冲器中捕捉与声音数据相关联的元数据。在检测到触发事件之后,分析元数据以对声音数据中的噪声进行分类。基于分类的噪声,修改NMD的至少一个性能参数。

【技术实现步骤摘要】
【国外来华专利技术】使用噪声分类优化网络麦克风设备相关申请的交叉引用本申请要求于2018年12月20日提交的美国专利申请No.16/227,308的优先权,其全部内容通过引用并入本文。
本技术涉及消费品,并且更具体地,涉及针对语音可控媒体回放系统或其一些方面的方法、系统、产品、特征、服务和其他元素。
技术介绍
访问和收听外放设置的数字音频的选项是有限的,直到2003年SONOS公司申请了其首批专利申请中的一件题为“MethodforSynchronizingAudioPlaybackbetweenMultipleNetworkedDevices”的专利申请,并在2005年开始出售媒体回放系统为止。SONOS无线高保真(HiFi)系统使人们可以通过一个或多个联网回放设备体验来自许多源的音乐。通过安装在智能电话、平板计算机或计算机上的软件控制应用,人们能够在具有联网回放设备的任何房间中播放他或她期望的内容。另外,使用控制器,例如,能够将不同的歌曲流传输到具有回放设备的每个房间,能够将房间组合在一起进行同步回放,或者可以在所有房间中同步收听相同的歌曲。鉴于对数字媒体的兴趣日益增长,仍然需要开发一种消费者易于使用的技术以进一步增强收听体验。附图说明参考以下说明书、所附权利要求和附图,可以更好地理解本公开的技术的特征、方面和优点。图1A是具有根据所公开技术的各方面配置的媒体回放系统的环境的局部剖视图。图1B是图1A的媒体回放系统和一个或多个网络的示意图。图2A是示例回放设备的功能框图。图2B是图2A的回放设备的示例壳体的立体图。图3A-3E是示出了根据本公开的方面的示例回放设备配置的图。图4A是根据本公开的各方面的示例控制器设备的功能框图。图4B和图4C是根据本公开的各方面的控制器接口。图5是根据本公开的各方面的示例网络麦克风设备的某些组件的功能框图。图6A是示例语音输入的图。图6B是描绘根据本公开的各方面的示例声音样本的图。图7示出了通过主分量分析定义的坐标空间中特定噪声的分离。图8A示出了根据本公开的各方面的用于经由网络麦克风设备对噪声进行分类的示例方法。图8B和图8C是根据本公开的各方面的控制器接口。图9是根据本公开的各方面的示例噪声分类和网络麦克风设备适配的功能流程图。图10是风扇噪声在不同距离处的示例频谱图。图11是从麦克风频谱数据的主分量分析导出的基向量的示例图。图12是用于对噪声数据进行分类的重构频谱的示例图。图13是从群体网络麦克风设备捕捉的示例频谱分布图。附图是出于说明示例实施例的目的,但是应当理解的是,本专利技术不限于附图中所示的布置和手段。在附图中,相同的附图标记识别至少大致相似的元件。为了促进对任何特定元件的讨论,任何参考数字中的一个或多个最高有效位指的是首次引入该元件的附图。例如,首先参照图1A介绍和讨论元件103a。具体实施方式I.概述在“智能”家居中,语音控制可能是有益的,该“智能”家居包括连接到通信网络的智能应用和设备(例如,无线音频回放设备、照明设备和家庭自动化设备(例如,恒温器、门锁等))。在一些实施方式中,网络麦克风设备可以用于控制智能家居设备。网络麦克风设备(“NMD”)是一种联网计算设备,通常包括麦克风的布置(例如,麦克风阵列),该麦克风的布置被配置为检测NMD环境中存在的声音。检测到的声音可以包括与背景噪声(例如,回放设备输出的音乐或其他环境噪声)混合在一起的人的语音。实际上,NMD通常会过滤检测到的声音,以从人的语音中消除背景噪声,从而促进识别该语音是否包含表示语音控制的语音输入。如果是这样,则NMD可以基于这种语音输入来采取措施。NMD通常采用唤醒词引擎(通常在NMD上搭载)来识别该NMD检测到的声音是否包含包括特定唤醒词的语音输入。唤醒词引擎可以被配置为使用一种或多种识别算法来识别(即,“定位(spot)”)特定唤醒词。该唤醒词识别过程通常被称为“关键词定位”。在实践中,为了帮助促进关键词定位,NMD可以缓冲NMD的麦克风检测到的声音,然后使用唤醒词引擎来处理该缓冲的声音以确定是否存在唤醒词。当唤醒词引擎在检测到的声音中定位唤醒词时,NMD可以确定发生了唤醒词事件(即,“唤醒词触发”),这表明NMD已检测到包括潜在语音输入的声音。唤醒词事件的发生通常会使NMD执行涉及检测到的声音的附加过程。在一些实施方式中,除其他可能的附加过程之外,这些附加过程可以包括:输出指示已经识别出唤醒词的警报(例如,可听见的铃声和/或光指示器),以及从缓冲器提取检测到的声音数据。提取检测到的声音可以包括:根据特定格式读出并封装检测到的声音的流,并向适当的VAS发送该封装的声音数据以用于解释。继而,与由唤醒词引擎识别的唤醒词相对应的VAS通过通信网络从NMD接收发送的声音数据。传统上,VAS采用远程服务的形式,该远程服务是使用一个或多个配置为处理语音输入的云服务器(例如,AMAZON的ALEXA、APPLE的SIRI、MICROSOFT的CORTANA、GOOGLE的ASSISTANT等)来实施的。在某些情况下,VAS的某些组件和功能可能分布在本地设备和远程设备上。附加地或备选地,VAS可以采用在NMD或包括NMD的媒体回放系统处实现的本地服务的形式,使得语音输入或某些类型的语音输入(例如,基本命令)在本地处理而无需来自远程VAS干预。在任何情况下,当VAS接收到检测到的声音数据时,该VAS通常会处理该数据,这涉及识别语音输入并确定在该语音输入中捕捉的单词的意图。然后,VAS可以根据该确定的意图使用某指令将响应提供回NMD。根据该指令,NMD可以使一个或多个智能设备执行操作。例如,在其他示例中,根据来自VAS的指令,NMD可以使回放设备播放特定歌曲,或者使照明设备打开/关闭。在一些情况下,NMD或具有NMD的媒体系统(例如,具有配备有NMD的回放设备的媒体回放系统)可以被配置为与多个VAS交互。实际上,NMD可以基于在NMD检测到的声音中识别的特定唤醒词,选择一个VAS而不是另一个。在一些实施方式中,被配置为网络媒体回放系统的一部分的回放设备可以包括NMD的组件和功能(即,回放设备是“配备有NMD的”)。在这方面,这种回放设备可以包括麦克风,该麦克风被配置为检测存在于该回放设备环境中的声音(例如,人们说话、该回放设备本身或附近的另一回放设备正在输出的音频或其他环境噪声),还可以包括用于缓冲检测到的声音以促进唤醒词识别的组件。一些配备有NMD的回放设备可以包括内部电源(例如,可充电电池),该内部电源允许该回放设备在未物理连接至墙壁电源插座等的情况下进行操作。就这一点而言,这种回放设备在本文中可以被称为“便携式回放设备”。另一方面,被配置为依赖于来自墙壁电源插座等的电力的回放设备在本文中可以被称为“固定回放设备”,尽管这样的设备实际上可以在家庭或其他环境中移动。在实践中,人们本文档来自技高网...

【技术保护点】
1.一种方法,包括:/n经由网络麦克风设备NMD的一个或多个麦克风检测声音;/n基于所检测到的声音,在所述NMD的第一缓冲器中捕捉声音数据;/n经由所述NMD分析所述声音数据以检测触发事件;/n在所述NMD的至少第二缓冲器中捕捉与所述声音数据相关联的元数据;/n在检测到所述触发事件之后,使得分析元数据以对所述声音数据中的噪声进行分类;以及/n基于所分类的噪声,修改所述NMD的至少一个性能参数。/n

【技术特征摘要】
【国外来华专利技术】20181220 US 16/227,3081.一种方法,包括:
经由网络麦克风设备NMD的一个或多个麦克风检测声音;
基于所检测到的声音,在所述NMD的第一缓冲器中捕捉声音数据;
经由所述NMD分析所述声音数据以检测触发事件;
在所述NMD的至少第二缓冲器中捕捉与所述声音数据相关联的元数据;
在检测到所述触发事件之后,使得分析元数据以对所述声音数据中的噪声进行分类;以及
基于所分类的噪声,修改所述NMD的至少一个性能参数。


2.根据权利要求1所述的方法,其中,所述声音数据无法从所述元数据导出。


3.根据权利要求1或2所述的方法,其中,分析所述元数据以对所述声音数据中的噪声进行分类包括:将所述元数据与和已知噪声事件相关联的参考元数据进行比较。


4.根据前述权利要求中任一项所述的方法,其中,将所述元数据与参考元数据进行比较包括:将所述元数据与相应噪声事件的特征进行比较,所述特征是使用主分量分析生成的,所述主分量分析被应用于暴露于所述相应噪声事件的麦克风设备的多个频率响应。


5.根据权利要求4所述的方法,其中,所述多个频率响应包括以下各项中的至少一项:
在受控条件下捕捉的样本;以及
从用户输入获得的样本。


6.根据前述权利要求中任一项所述的方法,其中,所述元数据包括频率响应谱,并且其中,将所述元数据与参考元数据进行比较包括:将所述频率响应谱投影到对应于来自群体NMD的聚合频率响应谱的本征空间。


7.根据前述权利要求中任一项所述的方法,还包括:通过将所述声音元数据限制为在许多采样帧上平均的频域信息来从所捕捉的声音数据导出所述元数据。


8.根据前述权利要求中任一项所述的方法,还包括:
从用户接收指示所述NMD的位置的输入,以及
确定至少一个噪声事件的可能性或多或少可能基于所指示的位置。


9.根据前述权利要求中任一项所述的方法,还包括:当检测到低噪声水平时,减少被处理以分析所述声音数据的麦克风声道的数量。


10.根据权利要求9所述的方法,其中,减少所述麦克风声道的数量包括:关...

【专利技术属性】
技术研发人员:库尔特·托马斯·索托
申请(专利权)人:搜诺思公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1