用于为若干语音操作的用户设备生成基于音量的响应的系统和方法技术方案

技术编号:23563967 阅读:23 留言:0更新日期:2020-03-25 08:23
本文提供了用于以基于语音命令的音量级别的音量级别对语音命令做出响应的系统和方法。例如,媒体指南应用可以通过多个语音操作的用户设备中的第一语音操作的用户设备来检测用户说出的语音命令。媒体指南应用可以确定语音命令的第一音量级别。基于语音命令的音量级别,媒体指南应用可以确定所述多个语音操作的用户设备中的第二语音操作的用户设备比其它语音操作的用户设备中的任何一个都更靠近用户。媒体指南应用可以通过第二语音操作的用户设备以基于语音命令的第一音量级别设置的第二音量级别生成可听响应。

System and method for generating volume based response for user devices of several voice operations

【技术实现步骤摘要】
【国外来华专利技术】用于为若干语音操作的用户设备生成基于音量的响应的系统和方法
技术介绍
家庭包含语音操作的用户设备已变得越来越普遍。语音操作的设备可以将其响应音量调整为用户的语音命令的音量。但是,随着一个家庭中若干语音操作的用户设备变得越来越普遍,当确定哪个设备应当对查询做出响应以及以什么音量做出响应时,在若干设备之间进行协调变得越来越困难。此外,在一些情况下,使响应音量与用户语音的音量匹配可能妨碍用户听到响应。每当用户想要对语音命令的响应时手动选择设备并设置响应音量对于用户而言会是麻烦的,并且最终使设备响应的用处不大。
技术实现思路
因此,本文描述了用于基于语音命令的音量级别以音量级别响应语音命令的系统和方法。使用语音命令的音量级别来确定响应音量级别允许用户例如改变响应音量级别,而不必手动调整语音操作的用户设备。作为一个示例,在沙发的一端上可以有第一语音操作的用户设备,在沙发的另一个端上可以有第二语音操作的用户设备。第一用户可以坐在沙发的最靠近第一设备的一端,而第二用户可以坐在沙发的最靠近第二语音操作的用户设备的相对端。第一用户可以说出由第一和第二语音操作的用户设备都接收的语音命令。本文描述的系统和方法可以基于在每个语音操作的用户设备处接收到的语音命令音量级别来确定第一语音操作的用户设备距用户更近。然后,第一语音操作的用户设备可以以基于语音命令的音量级别的音量级别做出响应。例如,第一用户和第二用户可以正在观看电影(例如,“星球大战(StarWars)”)。第一用户的语音命令可以是重复电影中所说的最后一行(例如,“愿力量与你同在(MaytheForcebewithyou)”)的低声请求。第一语音操作的用户设备可以通过向用户低声说出最后一行(例如,“愿力量与你同在”)来做出响应。这些系统和方法可以由媒体指南应用实现。媒体指南应用可以连接到多个语音操作的用户设备。这多个语音操作的用户设备可以包括例如DeviceA(设备A)、DeviceB(设备B)和DeviceC(设备C)。媒体指南应用可以通过多个语音操作的用户设备中的第一语音操作的用户设备来检测由用户说出的语音命令。例如,媒体指南应用可以参考用户当前正在观看的电影通过DeviceA检测来自用户的说“重复最后一行”的语音命令。媒体指南应用可以确定语音命令的第一音量级别,其中该语音命令由第一语音操作的用户设备接收。例如,第一音量级别可以是在第一语音操作的用户设备(例如,DeviceA)处检测到的语音命令的输入音量的平均值(例如,48db)。在一些实施例中,为了确定第一音量级别,媒体指南应用可以测量语音命令的未经过滤的音量级别。例如,语音命令的未经过滤的音量级别可以是60dB。但是,这个未经过滤的音量级别可以包括一定级别的背景噪声,诸如在用户附近可听地播放电影的电视。媒体指南应用可以确定背景噪声的级别并且可以过滤语音命令以移除背景噪声的级别。例如,在电视上播放的电影可以比用户的声音具有更高的频率。媒体指南应用可以过滤掉语音命令的高频分量,以移除背景噪声。媒体指南应用然后可以计算语音命令的经过滤的音量级别。例如,语音命令的经滤波的音量级别可以是48dB,相比之下,未经滤波的音量级别是60dB。几个语音操作的用户设备可以检测来自用户的语音命令。这些设备中的每一个可以接收不同音量级别的语音命令,例如,取决于与用户的接近程度。因此,多个语音操作的用户设备中的每个语音操作的用户设备将与语音命令的多个音量级别中的音量级别相关联。媒体指南应用可以接收将多个音量级别中的每个音量级别与多个语音操作的用户设备中的相应语音操作的用户设备相关联的至少一个数据结构。例如,媒体指南应用可以从多个语音操作的用户设备中的每个语音操作的用户设备接收包含用于相应语音操作的用户设备的音量级别和语音操作的用户设备标识符的数据结构。例如,媒体指南应用可以从第二语音操作的用户设备接收包含音量级别52db和设备标识符DeviceB的数据结构。例如,媒体指南应用可以从第三语音操作的用户设备接收包含音量级别50db和设备标识符DeviceC的数据结构。在一些实施例中,媒体指南应用可以将第一音量级别与多个音量级别进行比较。例如,媒体指南应用可以将与DeviceA相关联的48dB与与DeviceB相关联的52dB以及与DeviceC相关联的50dB进行比较。在一些实施例中,媒体指南应用可以基于将第一音量级别与多个音量级别进行比较来确定多个音量级别中的最大音量级别。例如,由多个语音操作的用户设备中的任何一个接收的最大音量级别可以是52dB。多个音量级别中的最大音量级别是由多个语音操作的用户设备接收到的音量级别中最响亮的。在一些实施例中,媒体指南应用可以在至少一个数据结构中搜索与最大音量级别相关联的第二语音操作的用户设备。与最大音量相关联的用户设备将是距发出语音命令的用户最近的设备,因为设备距用户越近,来自该用户的语音命令向该设备发出的声音将越大。例如,如果最大音量级别是52dB,那么媒体指南应用可以搜索数据结构以查找与52dB音量级别相关联的语音操作的用户设备。在数据结构中,音量级别52dB可以与表示第二语音操作的用户设备的设备标识符DeviceB相关联。在这个示例中,DeviceB是距用户最近的语音操作的用户设备。在一些实施例中,媒体指南应用可以将命令传输到第二语音操作的用户设备。该命令可以指令第二语音操作的用户设备将响应级别更新为基于最大音量级别的第二音量级别。例如,媒体指南应用可以指令被识别为DeviceB的第二语音操作的用户设备将响应级别改变为音量级别52dB。例如,媒体指南应用可以代替地指令被识别为DeviceB的第二语音操作的用户设备将响应级别改变为53dB,这比最大音量级别稍大。媒体指南应用可以以这种方式稍微增加最大音量级别以确定第二音量,以考虑环境噪声。在一些实施例中,媒体指南应用可以生成对语音命令的可听响应。可以通过第二语音操作的用户设备以第二音量级别生成可听响应。例如,被识别为DeviceB的第二语音操作的用户设备可以以音量级别53dB重复用户当前正在观看的电影的最后一行(例如,“愿力量与你同在”)。在一些实施例中,第一和第二语音操作的用户设备可以是同一个设备,并且第一音量级别和第二音量可以是相同的音量级别。在一些实施例中,媒体指南应用可以确定语音操作的用户设备(例如,DeviceA、DeviceB、DeviceC)不使用相同的装备、方法或灵敏度来检测语音命令。因此,检测到的最大音量级别可以不与最靠近发出语音命令的用户的语音操作的用户设备对应。在一些实施例中,媒体指南应用可以在确定最大音量级别时考虑语音操作的用户设备中的这种差异,并在确定最大音量级别之前相应地调整多个音量级别。在一些实施例中,媒体指南应用可以使用其它因素来确定最靠近的语音操作的用户设备。这些因素可以包括例如红外(IR)检测,以测量每个语音操作的用户设备与发出语音命令的用户之间的空间。在一些实施例中,媒体指南应用可以确定除了发布语音命令的用户之外的其他用户,这些用户可能对听到对语音命令的可听响应感兴趣。在此类本文档来自技高网...

【技术保护点】
1.一种方法,包括:/n通过多个语音操作的用户设备中的第一语音操作的用户设备来检测用户说出的语音命令;/n确定语音命令的第一音量级别;/n基于语音命令的音量级别,确定所述多个语音操作的用户设备中的第二语音操作的用户设备比其它语音操作的用户设备中的任何一个都更靠近用户;以及/n通过第二语音操作的用户设备以基于语音命令的第一音量级别设置的第二音量级别生成可听响应。/n

【技术特征摘要】
【国外来华专利技术】20170602 US 15/612,5161.一种方法,包括:
通过多个语音操作的用户设备中的第一语音操作的用户设备来检测用户说出的语音命令;
确定语音命令的第一音量级别;
基于语音命令的音量级别,确定所述多个语音操作的用户设备中的第二语音操作的用户设备比其它语音操作的用户设备中的任何一个都更靠近用户;以及
通过第二语音操作的用户设备以基于语音命令的第一音量级别设置的第二音量级别生成可听响应。


2.一种用于以基于语音命令的音量级别的音量级别对语音命令做出响应的方法,所述方法包括:
通过多个语音操作的用户设备中的第一语音操作的用户设备来检测用户说出的语音命令;
确定语音命令的第一音量级别,其中语音命令由第一语音操作的用户设备接收;
接收至少一个数据结构,所述数据结构将多个音量级别中的每个音量级别与多个语音操作的用户设备中的相应语音操作的用户设备关联;
将第一音量级别与所述多个音量级别进行比较;
基于将第一音量级别与所述多个音量级别进行比较,确定所述多个音量级别中的最大音量级别;
将最大音量级别与至少一个数据结构进行比较,以确定与最大音量级别相关联的第二语音操作的用户设备;
向第二语音操作的用户设备传输命令,其中所述命令指令第二语音操作的用户设备将响应音量级别更新为第二音量级别,所述第二音量级别基于最大音量级别;以及
通过第二语音操作的用户设备以第二音量级别生成可听响应。


3.如权利要求2所述的方法,还包括:
确定与可听响应被生成之时对应的第一时间;
计算第二时间,其中所述第二时间是第一时间加上一时间段;以及
基于是否在第三时间接收到确认而通过第二语音操作的用户设备生成第二可听响应,其中第三时间在第二时间之前。


4.如权利要求3所述的方法,还包括:
确定所述时间段,其中确定所述时间段包括:
识别与用户相关联的用户简档;以及
使用用户简档来确定用于响应的平均时间。


5.如权利要求3所述的方法,其中生成第二可听响应包括:
确定第三音量级别,其中第三音量级别大于第二音量级别;以及
其中第二可听响应是以第三音量级别生成的。


6.如权利要求3所述的方法,还包括:
识别与用户相关联的用户简档;
使用用户简档来识别与用户相关联的平均讲话音量级别;
确定平均讲话音量级别与最大音量级别之间的差异;以及
其中确定第三音量级别是基于所述差异加上第二音量级别。


7.如权利要求2所述的方法,还包括:
接收来自用户的确认,其中所述确认指示用户听到了可听响应;
识别与用户相关联的用户简档;以及
响应于接收到确认,将第二音量级别存储在用户简档中。


8.如权利要求2所述的方法,还包括:
识别与用户相关联的用户简档;
使用用户简档来识别与用户相关联的多个用户音量级别;
确定所述多个用户音量级别中的最低用户音量级别;以及
其中第二音量级别还基于最低用户音量级别。


9.如权利要求2所述的方法,还包括:
确定与可听响应被生成之时对应的第一时间;
计算第二时间,其中所述第二时间是第一时间加上一时间段;
识别与用户相关联的显示设备;
生成可听响应的可视表示以供显示;以及
基于是否在第三时间接收到确认,将可视表示传输到显示设备,其中第三时间在第二时间之前。


10.如权利要求2所述的方法,还包括:
识别与用户相关联的用户简档;
使用用户简档来确定用户具有听力障碍;
识别与用户相关联的显示设备;
生成可听响应的可视表示以供显示;以及
将可视表示传输到显示设备。


11.如权利要求2所述的方法,其中确定第一音量级别包括:
测量语音命令的未经过滤的音量级别;
确定背景噪声的级别;
过滤语音命令以移除背景噪声的级别;以及
计算语音命令的经过滤的音量级别。


12.一种用于以基于语音命令的音量级别的音量级别对语音命令做出响应的系统,所述系统包括:
控制电路系统,被配置为:
通过多个语音操作的用户设备中的第一语音操作的用户设备来检测用户说出的语音命令;
确定语音命令的第一音量级别,其中语音命令由第一语音操作的用户设备接收;
接收至少一个数据结构,所述数据结构将多个音量级别中的每个音量级别与多个语音操作的用户设备中的相应语音操作的用户设备关联;
将第一音量级别与所述多个音量级别进行比较;
基于将第一音量级别与所述多个音量级别进行比较,确定所述多个音量级别中的最大音量级别;
将最大音量级别与至少一个数据结构进行比较,以确定与最大音量级别相关联的第二语音操作的用户设备;
向第二语音操作的用户设备传输命令,其中所述命令指令第二语音操作的用户设备将响应音量级别更新为第二音量级别,所述第二音量级别基于最大音量级别;以及
通过第二语音操作的用户设备以第二音量级别生成可听响应。


13.如权利要求12所述的系统,其中控制电路系统还被配置为:
确定与可听响应被生成之时对应的第一时间;
计算第二时间,其中所述第二时间是第一时间加上一时间段;以及
基于是否在第三时间接收到确认而通过第二语音操作的用户设备生成第二可听响应,其中第三时间在第二时间之前。


14.如权利要求13所述的系统,其中控制电路系统还被配置为:
确定所述时间段,其中确定所述时间段包括:
识别与用户相关联的用户简档;以及
使用用户简档来确定用于响应的平均时间。


15.如权利要求13所述的系统,其中控制电路系统被配置为通过以下操作来生成第二可听响应:
确定第三音量级别,其中第三音量级别大于第二音量级别;以及
其中第二可听响应是以第三音量级别生成的。


16.如权利要求13所述的系统,其中控制电路系统还被配置为:
识别与用户相关联的用户简档;
使用用户简档来识别与用户相关联的平均讲话音量级别;
确定平均讲话音量级别与最大音量级别之间的差异;以及
其中确定第三音量级别是基于所述差异加上第二音量级别。


17.如权利要求12所述的系统,其中控制电路系统还被配置为:
接收来自用户的确认,其中所述确认指示用户听到了可听响应;
识别与用户相关联的用户简档;以及
响应于接收到确认,将第二音量级别存储在用户简档中。


18.如权利要求12所述的系统,其中控制电路系统还被配置为:
识别与用户相关联的用户简档;
使用用户简档来识别与用户相关联的多个用户音量级别;
确定所述多个用户音量级别中的最低用户音量级别;以及
其中第二音量级别还基于最低用户音量级别。


19.如权利要求12所述的系统,其中控制电路系统还被配置为:
确定与可听响应被生成之时对应的第一时间;
计算第二时间,其中所述第二时间是第一时间加上一时间段;
识别与用户相关联的显示设备;
生成可听响应的可视表示以供显示;以及
基于是否在第三时间接收到确认,将可视表示传输到显示设备,其中第三时间在第二时间之前。


20.如权利要求12所述的系统,其中控制电路系统还被配置为:
识别与用户相关联的用户简档;
使用用户简档来确定用户具有听力障碍;
识别与用户相关联的显示设备;
生成可听响应的可视表示以供显示;以及
将可视表示传输到显示设备。


21.如权利要求12所述的系统,其中控制电路系统被配置为通过以下操作来确定第一音量级别:
测量语音命令的未经过滤的音量级别;
确定背景噪声的级别;
过滤语音命令以移除背景噪声的级别;以及
计算语音命令的经过滤的音量级别。


22.一种用于以基于语音命令的音量级别的音量级别对语音命令做出响应的系统,所述系统包括:
用于通过多个语音操作的用户设备中的第一语音操作的用户设备来检测用户说出的语音命令的装置;
用于确定语音命令的第一音量级别的装置,其中语音命令由第一语音操作的用户设备接收;
用于接收至少一个数据结构的装置,所述数据结构将多个音量级别中的每个音量级别与多个语音操作的用户设备中的相应语音操作的用户设备关联;
用于将第一音量级别与所述多个音量级别进行比较的装置;
用于基于将第一音量级别与所述多个音量级别进行比较,确定所述多个音量级别中的最大音量级别的装置;
用于将最大音量级别与至少一个数据结构进行比较,以确定与最大音量级别相关联的第二语音操作的用户设备的装置;
用于向第二语音操作的用户设备传输命令的装置,其中所述命令指令第二语音操作的用户设备将响应音量级别更新为第二音量级别,所述第二音量级别基于最大音量级别;以及
用于通过第二语音操作的用户设备以第二音量级别生成可听响应的装置。


23.如权利要求22所述的系统,还包括:
用于确定与可听响应被生成之时对应的第一时间的装置;
用于计算第二时间的装置,其中所述第二时间是第一时间加上一时间段;以及
用于基于是否在第三时间接收到确认而通过第二语音操作的用户设备生成第二可听响应的装置,其中第三时间在第二时间之前。


24.如权利要求23所述的系统,还包括:
用于确定所述时间段的装置,其中确定所述时间段包括:
用于识别与用户相关联的用户简档的装置;以及
用于使用用户简档来确定用于响应的平均时间的装置。


25.如权利要求23所述的系统,其中用于生成第二可听响应的装置包括:
用于确定第三音量级别的...

【专利技术属性】
技术研发人员:M·麦卡蒂G·E·罗
申请(专利权)人:乐威指南公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1