语音接口设备的噪声降低制造技术

技术编号:21176930 阅读:28 留言:0更新日期:2019-05-22 12:14
一种具有一个或多个麦克风和扬声器的电子设备的方法,该电子设备被配置为通过包括基于语音的可供性(affordance)的多个可供性中的任一唤醒,包括确定电子设备周围的环境的噪声分布;确定噪声分布是否干扰基于语音的可供性;并且根据噪声分布干扰基于语音的可供性的确定,向用户呈现提示以使用多个可供性中除基于语音的可供性之外的可供性来唤醒电子设备。

Noise Reduction of Voice Interface Equipment

A method of an electronic device having one or more microphones and speakers configured to interfere with speech-based availability by determining the noise distribution of the environment around the electronic device, determining whether the noise distribution interferes with speech-based availability, and interfering with speech-based availability according to the noise distribution, by any wake-up including affordance-based availability. Availability determination, presenting prompts to users to wake up electronic devices using multiple availability in addition to voice-based availability.

【技术实现步骤摘要】
【国外来华专利技术】语音接口设备的噪声降低
所公开的实现方式一般涉及语音接口和相关设备,包括但不限于用于语音接口设备的噪声降低的方法和系统。
技术介绍
集成有麦克风的电子设备已经被广泛用于从用户收集语音输入并且根据该语音输入来实现语音激活功能。例如,许多现有技术的移动设备包括语音助理功能(例如,Siri,Google助理),其被配置为使用语音输入来发起电话呼叫、进行餐馆搜索、在地图上开始导航、创建日历事件、向社交网络添加帖子、识别歌曲、以及完成许多其他任务。位置(例如,家庭内的房间或空间)可以包括包含语音助理系统的多个设备和这中设备的一个或多个用户。由于设备尤其被配置为能够访问和呈现用户特定信息,因此期望语音助理设备能够适度地管理多个用户并且能够向适当的用户提供用户特定信息。还期望在语音助理设备当中有负责响应用户的语音输入的主导者,以便减少用户的困惑。此外,期望在语音助理设备处于嘈杂位置的情况下,语音助理设备包括噪声降低措施。
技术实现思路
因此,需要一种具有语音助理系统的电子设备和/或语音助理服务器系统,其并入了用于处理多个用户、用于多设备协调以确定主导者、以及用于噪声降低的方法和系统。设备和/或服务器系统可以被配置为基于与语音模型的比较来识别语音输入的说话者,并且个性化对所识别的说话者的响应。设备和/或服务器系统还可以被配置为在多个设备当中协商主导者(leadership)以对说话者响应。设备和/或服务器系统可以进一步被配置为检测设备周围的环境是否足够嘈杂,其中,唤醒设备的用于热词语音输入的替代方法是可取的。根据一些实现方式,一种方法包括在具有一个或多个麦克风、扬声器、一个或多个处理器以及存储用于由一个或多个处理器执行的一个或多个程序的存储器的电子设备处:接收第一自由形式的语音输入;将所述第一语音输入与语音模型的集合比较,所述语音模型的集合与关联于所述电子设备的多个用户相关联,其中,针对所述电子设备训练所述语音模型;基于所述比较,确定所述第一语音输入与所述多个用户中的第一用户相对应;以及根据所述确定呈现响应。在一些实现方式中,一种电子设备包括一个或多个麦克风、扬声器、一个或多个处理器;以及存储用于由所述一个或多个处理器执行的一个或多个程序的存储器。所述一个或多个程序包括用于执行下述操作的指令:接收第一自由形式的语音输入;将所述第一语音输入与语音模型的集合比较,所述语音模型的集合与关联于所述电子设备的多个用户相关联,其中,对所述电子设备训练所述语音模型;基于所述比较,确定所述第一语音输入与所述多个用户中的第一用户相对应;以及根据所述确定,呈现响应。在一些实现方式中,一种非瞬时计算机可读存储介质存储一个或多个程序。所述一个或多个程序包括指令,当所述指令由具有一个或多个麦克风、扬声器、以及一个或多个处理器的电子设备执行时,使所述电子设备执行包括下述的操作:接收第一自由形式的语音输入;将所述第一语音输入与语音模型的集合比较,所述语音模型的集合与关联于所述电子设备的多个用户相关联,其中,对所述电子设备训练所述语音模型;基于所述比较,确定所述第一语音输入与所述多个用户中的第一用户相对应;以及根据所述确定,呈现响应。根据一些实现方式,一种方法包括在多个电子设备中的第一电子设备处进行以下操作,多个电子设备中的每个电子设备包括一个或多个麦克风、扬声器、一个或多个处理器和存储由用于所述一个或多个处理器执行的一个或多个程序的存储器:检测语音输入,确定用于所检测的语音输入的质量评分,将所述质量评分传达给所述多个电子设备中的其他设备,接收由所述多个电子设备中的其他设备生成的用于检测由所述其他设备的语音输入的质量评分,根据由所述第一电子设备生成的质量评分在用于语音输入的所生成的质量评分和所接收的质量评分当中为最高的确定,输出对所检测的语音输入的可听和/或可视响应,其中,所述多个电子设备中的其他设备放弃输出对所检测的语音输入的可听响应,并且根据由所述第一电子设备生成的质量评分在用于由所述多个电子设备生成的语音输入的质量评分当中不是最高的确定,放弃输出对所检测的语音输入的响应。根据一些实现方式,多个电子设备中的第一电子设备包括,以及所述多个电子设备中的每一个电子设备包括,一个或多个麦克风、扬声器、一个或多个处理器和存储用于由一个或多个处理器执行的一个或多个程序的存储器。所述一个或多个程序包括用于下述的指令:检测语音输入,确定用于所检测的语音输入的质量评分,将所述质量评分传达给所述多个电子设备中的其他设备,接收由所述多个电子设备中的其他设备生成的、用于检测由所述其他设备的语音输入的质量评分,根据由所述第一电子设备生成的质量评分在所生成的质量评分和所接收的语音输入的质量评分中为最高的确定,输出对所检测的语音输入的可听和/或可视响应,其中,所述多个电子设备中的其他设备放弃输出对所检测的语音输入的可听响应,并且根据由所述第一电子设备生成的质量评分在用于由所述多个电子设备生成的语音输入的质量评分当中不是最高的确定,放弃输出对所检测的语音输入响应。根据一些实现方式,一种非瞬时计算机可读存储介质存储一个或多个程序。所述一个或多个程序包括指令,当所述指令由多个电子设备中的第一电子设备执行时,所述多个电子设备中的每一个包括一个或多个麦克风、扬声器和一个或多个处理器,所述指令使所述电子设备执行包括下述的操作:检测语音输入,确定用于所检测的语音输入的质量评分,将所述质量评分传达给所述多个电子设备中的其他设备,接收由所述多个电子设备中的其他设备生成的、用于检测由所述其他设备的语音输入的质量评分,根据由所述第一电子设备生成的质量评分在所生成的质量评分和所接收的语音输入的质量评分中为最高的确定,输出对所检测的语音输入的可听和/或可视响应,其中,所述多个电子设备中的其他设备放弃输出对所检测的语音输入的可听响应,并且根据由所述第一电子设备生成的质量评分在用于由所述多个电子设备生成的语音输入的质量评分当中不是最高的确定,放弃输出对所检测的语音输入响应。在一些实现方式中,一种方法包括在具有一个或多个麦克风、扬声器、一个或多个处理器以及存储用于由一个或多个处理器执行的一个或多个程序的存储器的电子设备处,所述电子设备被配置为通过包括基于语音的可供性的多个可供性中的任一个来唤醒:确定所述电子设备周围的环境的噪声分布;确定所述噪声分布是否干扰所述基于语音的可供性;以及根据所述噪声分布干扰所述基于语音的可供性的确定,向用户呈现提示以使用所述多个可供性中除所述基于语音的可供性之外的可供性来唤醒所述电子设备。在一些实现方式中,一种电子设备包括一个或多个麦克风、扬声器、一个或多个处理器以及存储器,该存储器存储要由一个或多个处理器执行的一个或多个程序。所述电子设备被配置为通过包括基于语音的可供性的多个可供性中的任一个来唤醒。一个或多个程序包括用于下述的指令:确定所述电子设备周围的环境的噪声分布;确定所述噪声分布是否干扰所述基于语音的可供性;以及根据所述噪声分布干扰所述基于语音的可供性的确定,向用户呈现提示以使用所述多个可供性中除所述基于语音的可供性之外的可供性来唤醒所述电子设备。一种存储一个或多个程序的非瞬时计算机可读存储介质。一个或多个程序包括指令,当所述指令由电子设备执行时,使所述电子设本文档来自技高网...

【技术保护点】
1.一种方法,包括:在具有一个或多个麦克风、扬声器、一个或多个处理器,以及存储用于由所述一个或多个处理器执行的一个或多个程序的存储器的电子设备处,所述电子设备被配置为通过包括基于语音的可供性的多个可供性中的任一个来唤醒:确定所述电子设备周围的环境的噪声分布;确定所述噪声分布是否干扰所述基于语音的可供性;以及根据所述噪声分布干扰所述基于语音的可供性的确定,向用户呈现提示以使用所述多个可供性中除所述基于语音的可供性之外的可供性来唤醒所述电子设备。

【技术特征摘要】
【国外来华专利技术】2016.10.03 US 15/284,4931.一种方法,包括:在具有一个或多个麦克风、扬声器、一个或多个处理器,以及存储用于由所述一个或多个处理器执行的一个或多个程序的存储器的电子设备处,所述电子设备被配置为通过包括基于语音的可供性的多个可供性中的任一个来唤醒:确定所述电子设备周围的环境的噪声分布;确定所述噪声分布是否干扰所述基于语音的可供性;以及根据所述噪声分布干扰所述基于语音的可供性的确定,向用户呈现提示以使用所述多个可供性中除所述基于语音的可供性之外的可供性来唤醒所述电子设备。2.如权利要求1所述的方法,其中,所述基于语音的可供性包括说出的热词。3.如权利要求2所述的方法,其中,确定所述噪声分布是否干扰所述基于语音的可供性包括:确定所述噪声分布是否负面地影响识别由所述电子设备检测到的语音输入中的所述热词。4.如权利要求3所述的方法,其中,确定所述噪声分布是否负面地影响识别语音输入中的所述热词包括:将所述噪声分布与所述电子设备相关联的热词识别过程的噪声等级阈值进行比较。5.如权利要求3所述的方法,其中,确定所述噪声分布是否负面地影响识别语音输入中的所述热词包括:将所述噪声分布与语音音量等级阈值进行比较,其中,所述语音音量等级阈值是基于距所述电子设备的预定距离来定义的。6.如权利要求3所述的方法,其中,确定所述噪声分布是否负面地影响识别语音输入中的所述热词包括:将所述噪声分布与和所述电子设备相关联的噪声分布的预定集合相比较,其中,已知所述噪声分布的预定集合中的噪声分布负面地影响由所述电子设备识别语音输入中的所述热词。7.如前述权利要求中任一项所述的...

【专利技术属性】
技术研发人员:肯尼斯·米克斯特
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1