基于用户识别的语音激活制造技术

技术编号:33845059 阅读:13 留言:0更新日期:2022-06-18 10:29
一种用于语音激活的设备包括一个或多个处理器。一个或多个处理器被配置为经由一个或多个麦克风接收由第一用户说出的关键字和第一命令。一个或多个处理器还被配置为在接收第一命令之后,在没有间断地收到关键字的情况下,经由一个或多个麦克风接收第二命令。一个或多个处理器还被配置为至少部分地基于确定第二命令是由同一第一用户说出的,选择性地处理第二命令。理第二命令。理第二命令。

【技术实现步骤摘要】
【国外来华专利技术】基于用户识别的语音激活
[0001]根据美国法典第35编第119条要求优先权
[0002]本专利申请要求于2019年11月15日提交的题为“VOICE ACTIVATION BASED ON USER RECOGNITION”的非临时申请第16/685,825号的优先权,该申请已转让给本申请的受让人,并就此通过引用明确并入本文。


[0003]本公开一般涉及基于用户识别的语音激活。

技术介绍

[0004]技术的进步已导致更小且更强大的计算设备。例如,目前存在各种便携式个人计算设备,包括体积小、重量轻且易于用户携带的诸如移动电话和智能电话的无线电话、平板计算机和膝上型计算机。这些设备可以在无线网络上通信传送语音和数据分组。此外,许多这样的设备结合了附加功能,诸如数码照相机、数码摄像机、数码记录器和音频文件播放器。此外,此类设备可以处理可执行指令,包括可用于访问互联网的软件应用,诸如网络浏览器应用。因此,这些设备可以包括重要的计算能力。
[0005]计算设备可以与用户交互以执行口述(spoken)命令,诸如播放歌曲、增加音量、打开灯等。通常,用户必须在说出命令之前说出预定的关键字以使计算设备能够区分来自其他用户语音的命令。在许多情况下,用户一个接一个地向计算设备发出多个命令。在说出每个命令之前说出预定的关键字需要较长的时间并且不利地影响用户体验。此外,每次检测关键字都占用计算资源。

技术实现思路

[0006]在特定方面,一种用于语音激活的设备包括一个或多个处理器。一个或多个处理器被配置为经由一个或多个麦克风接收由第一用户说出的关键字和第一命令。一个或多个处理器还被配置为在接收第一命令之后,在没有间断地收到关键字的情况下,经由一个或多个麦克风接收第二命令。一个或多个处理器还被配置为至少部分地基于确定第二命令是由同一第一用户说出的,选择性地处理第二命令。
[0007]在另一个特定方面,一种用于语音激活的方法包括:经由一个或多个麦克风接收由第一用户说出的关键字和第一命令。该方法还包括在接收第一命令之后,在没有间断地收到关键字的情况下,经由一个或多个麦克风接收第二命令。该方法还包括至少部分地基于确定第二命令是由同一第一用户说出的,选择性地处理第二命令。
[0008]在另一个特定方面,一种计算机可读存储设备,存储指令,该指令在由一个或多个处理器执行时使一个或多个处理器经由一个或多个麦克风接收由第一用户说出的关键字和第一命令。指令在由一个或多个处理器执行时,还使一个或多个处理器在接收第一命令之后,在没有间断地收到关键字的情况下,经由一个或多个麦克风接收第二命令。指令在由一个或多个处理器执行时,还使一个或多个处理器至少部分地基于确定第二命令由同一第
一用户说出,选择性地处理第二命令。
[0009]在另一个特定方面,一种装置包括用于接收与语音对应的音频信号的部件。该装置还包括用于确定音频信号包括由第一用户说出的关键字和第一命令并且包括在没有关键字位于第一命令和第二命令之间的情况下在第一命令之后的第二命令的部件。该装置还包括用于至少部分地基于确定第二命令是由同一第一用户说出的来选择性地处理第二命令的部件。
[0010]本公开的其他方面、优点和特征将在审阅包括以下部分的整个申请后变得明确:附图说明、具体实施方式和权利要求书。
附图说明
[0011]图1是可操作为基于用户识别执行语音激活的系统的特定说明性方面的框图;
[0012]图2是可以由图1的系统执行的操作的说明性示例;
[0013]图3是说明基于用户识别执行语音激活的方法的流程图;以及
[0014]图4是结合了图1的系统的方面的车辆的说明性示例;
[0015]图5A是结合了图1的系统的方面的虚拟现实或增强现实头戴式设备(headset)的图;
[0016]图5B是结合了图1的系统的方面的可穿戴电子设备的图;
[0017]图6是结合了图1的系统的方面的语音受控扬声器系统的说明性示例;以及
[0018]图7是可操作为基于用户识别执行语音激活的设备的特定说明性示例的框图。
[0019]具体实施方式
[0020]公开了基于用户识别的语音激活的系统和方法。计算设备接收由用户说出的关键字(例如,“你好助理”)和第一命令(例如,“播放我的音乐”)。计算设备在接收第一命令(例如,“播放我的音乐”)之后接收第二命令(例如,“音量七”)。例如,计算设备在处理第一命令之前、期间或之后接收第二命令。计算设备选择性地处理第二命令。例如,如果第二命令(例如,“第七音量”)由说出关键字(例如,“你好助理”)的同一用户说出并且第二命令在接收第一命令(例如,“播放我的音乐”)的阈值持续时间内接收,则计算设备处理第二命令(例如,将音量设置到7)。计算设备还可以执行由同一用户在彼此的阈值持续时间内说出的一个或多个附加命令。多个命令在无需用户必须多次说出关键字(例如,“你好助理”)的情况下被处理。在特定示例中,另一用户可以通过说出关键字(例如,“你好助理”)在任何时间开始与计算设备交互。计算设备选择性地处理由最近说出关键字的同一用户说出的命令。
[0021]下面参考附图描述本公开的特定方面。在描述中,共同的特征由共同的附图标记表示。如本文所使用的,各种术语仅用于描述特定实现方式的目的,并不旨在限制实现方式。例如,除非上下文另有明确指示,否则单数形式“一”、“一个”和“该”也旨在包括复数形式。此外,本文描述的一些特征在一些实现方式中是单数的并且在其他实现方式中是复数的。为了说明,图1描绘了包括一个或多个处理器(图1中的“处理器”108)的设备102,这指示在一些实现方式中,设备102包括单个处理器108,而在其他实现方式中,设备102包括多个处理器108。为了在本文中便于参考,除非正在描述与多个特征相关的方面,否则这些特征一般作为“一个或多个”特征被引入,并且随后以单数形式提及。
[0022]可以进一步理解,术语“包括(comprise)”、“包括(comprises)”和“包括
(comprising)”可以与“包括(include)”“、包括(includes)”或“包括(including)”互换使用。此外,应当理解,术语“其中(wherein)”可以与“其中(where)”互换使用。如本文所使用的,“示例性”可以指示示例、实现方式和/或方面,并且不应被解释为限制或指示偏好或优选实现方式。如本文所使用的,用于修饰诸如结构、组件、操作等的元素的序数术语(例如,“第一”、“第二”、“第三”等)本身并不表示元素相对于另一个元素的任何优先级或顺序,而只是将该元素与(除了使用序数术语外)具有相同名称的另一个元素区分开。如本文所使用的,术语“集”是指一个或多个特定元素,而术语“多个”是指多个(例如,两个或更多)特定元素。
[0023]如本文所使用的,“耦接”可以包括“通信耦接”、“电耦接”或“物理耦接”,并且还可以(或可替代地)包括它们的任何组合。两个设备(或组件)可以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于语音激活的设备,所述设备包括:一个或多个处理器,被配置为:经由一个或多个麦克风接收由第一用户说出的关键字和第一命令;在接收所述第一命令之后,在没有间断地收到所述关键字的情况下,经由所述一个或多个麦克风接收第二命令;以及至少部分地基于确定所述第二命令是由同一所述第一用户说出的,选择性地处理所述第二命令。2.根据权利要求1所述的设备,其中,所述一个或多个处理器被配置为至少部分地基于确定会话模式被启用,来处理所述第二命令。3.根据权利要求1所述的设备,其中,所述一个或多个处理器被配置为至少部分地基于确定所述第二命令是在接收所述第一命令的阈值持续时间内接收的,来处理所述第二命令。4.根据权利要求1所述的设备,其中,所述一个或多个处理器被配置为:在接收所述第二命令之后,经由所述一个或多个麦克风接收由第二用户说出的所述关键字;经由所述一个或多个麦克风接收由所述第一用户说出的第三命令;以及基于确定由所述第一用户说出的所述第三命令是在没有间断地收到由所述第一用户说出的所述关键字的情况下在接收由所述第二用户说出的所述关键字之后接收的,制止处理所述第三命令。5.根据权利要求1所述的设备,其中,所述一个或多个处理器被配置为基于语音识别、面部识别或其他生物特征识别来确定所述关键字是由所述第一用户说出的。6.根据权利要求1所述的设备,其中,所述一个或多个处理器被配置为基于确定所述关键字是由所述一个或多个麦克风从与所述第一用户相关联的位置接收的,来确定所述关键字是由所述第一用户说出的。7.根据权利要求1所述的设备,其中,所述一个或多个处理器被配置为响应于确定所述第二命令由所述第一用户说出的并且所述第一用户将所述第二命令指向所述一个或多个麦克风,来处理所述第二命令。8.根据权利要求7所述的设备,其中,所述一个或多个处理器被配置为响应于确定所述第一用户在说出所述第二命令的同时看向所述一个或多个麦克风中的至少一个,所述第一用户在说出所述第二命令的同时位于所述一个或多个麦克风中的至少一个的阈值距离内,或两者兼有,来确定所述第一用户将所述第二命令指向所述一个或多个麦克风。9.根据权利要求1所述的设备,还包括耦接到所述一个或多个处理器的生物特征传感器,其中,所述一个或多个处理器还被配置为:从所述生物特征传感器接收生物特征输入;以及基于所述生物特征输入确定所述关键字是由所述第一用户说出的。10.根据权利要求1所述的设备,其中,所述一个或多个处理器被包括在集成电路中。11.根据权利要求1所述的设备,其中,所述一个或多个处理器被包括在车辆中。12.根据权利要求1所述的设备,其中,所述一个或多个处理器实现在音频设备中,并且其中,所述音频设备包括无线扬声器和具有集成助理应用的由语音激活的设备。
13.一种语音激活的方法,所述方法包括:经由一个或多个麦克风接收由第一用户说出的关键字和第一命令;在接收所述第一命令之后,在没有间断地收到所述关键字的情况下,经由所述一个或多个麦克风接收第二命令;以及至少部分地基于确定所述第二命令是由同一所述第一用户说出的,选择性地处理所述第二命令。14.根据权利要求13所述的方法,还包括:从所述一个或多个麦克风接收音频信号;确定所述音频信号的第一部分对应于由所述第一用户说出的所述关键字;以及确定所述音频信号的第二部分对应于由所述第一用户说出的所述第一命令。15.根据权利要求14所述的方法,还包括:确定由所述音频信号的所述第一部分指示的第一语音特性;以及基于所述第一语音特性生成与所述第一用户相关联的语音模型。16.根据权利要求14所述的方法,还包括:确定由所述音频信号的所述第一部分指示的第一语音特性;以及响应于确定所述第一语音特性匹配与所述第一用户相关联的语音模型,确定所述关键字是由所述第一用户说出的。17.根据权利要求14所述的方法,还包括:确定所述音频信号的第三部分对应于第二命令;确定由所述音频信号...

【专利技术属性】
技术研发人员:AK辛哈P卡尔瓦科塔D博米克
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1