【技术实现步骤摘要】
【国外来华专利技术】基于用户识别的语音激活
[0001]根据美国法典第35编第119条要求优先权
[0002]本专利申请要求于2019年11月15日提交的题为“VOICE ACTIVATION BASED ON USER RECOGNITION”的非临时申请第16/685,825号的优先权,该申请已转让给本申请的受让人,并就此通过引用明确并入本文。
[0003]本公开一般涉及基于用户识别的语音激活。
技术介绍
[0004]技术的进步已导致更小且更强大的计算设备。例如,目前存在各种便携式个人计算设备,包括体积小、重量轻且易于用户携带的诸如移动电话和智能电话的无线电话、平板计算机和膝上型计算机。这些设备可以在无线网络上通信传送语音和数据分组。此外,许多这样的设备结合了附加功能,诸如数码照相机、数码摄像机、数码记录器和音频文件播放器。此外,此类设备可以处理可执行指令,包括可用于访问互联网的软件应用,诸如网络浏览器应用。因此,这些设备可以包括重要的计算能力。
[0005]计算设备可以与用户交互以执行口述(spoken)命令,诸如播放歌曲、增加音量、打开灯等。通常,用户必须在说出命令之前说出预定的关键字以使计算设备能够区分来自其他用户语音的命令。在许多情况下,用户一个接一个地向计算设备发出多个命令。在说出每个命令之前说出预定的关键字需要较长的时间并且不利地影响用户体验。此外,每次检测关键字都占用计算资源。
技术实现思路
[0006]在特定方面,一种用于语音激活的设备包括一个或多个处理器。一个或多个处理器被配 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于语音激活的设备,所述设备包括:一个或多个处理器,被配置为:经由一个或多个麦克风接收由第一用户说出的关键字和第一命令;在接收所述第一命令之后,在没有间断地收到所述关键字的情况下,经由所述一个或多个麦克风接收第二命令;以及至少部分地基于确定所述第二命令是由同一所述第一用户说出的,选择性地处理所述第二命令。2.根据权利要求1所述的设备,其中,所述一个或多个处理器被配置为至少部分地基于确定会话模式被启用,来处理所述第二命令。3.根据权利要求1所述的设备,其中,所述一个或多个处理器被配置为至少部分地基于确定所述第二命令是在接收所述第一命令的阈值持续时间内接收的,来处理所述第二命令。4.根据权利要求1所述的设备,其中,所述一个或多个处理器被配置为:在接收所述第二命令之后,经由所述一个或多个麦克风接收由第二用户说出的所述关键字;经由所述一个或多个麦克风接收由所述第一用户说出的第三命令;以及基于确定由所述第一用户说出的所述第三命令是在没有间断地收到由所述第一用户说出的所述关键字的情况下在接收由所述第二用户说出的所述关键字之后接收的,制止处理所述第三命令。5.根据权利要求1所述的设备,其中,所述一个或多个处理器被配置为基于语音识别、面部识别或其他生物特征识别来确定所述关键字是由所述第一用户说出的。6.根据权利要求1所述的设备,其中,所述一个或多个处理器被配置为基于确定所述关键字是由所述一个或多个麦克风从与所述第一用户相关联的位置接收的,来确定所述关键字是由所述第一用户说出的。7.根据权利要求1所述的设备,其中,所述一个或多个处理器被配置为响应于确定所述第二命令由所述第一用户说出的并且所述第一用户将所述第二命令指向所述一个或多个麦克风,来处理所述第二命令。8.根据权利要求7所述的设备,其中,所述一个或多个处理器被配置为响应于确定所述第一用户在说出所述第二命令的同时看向所述一个或多个麦克风中的至少一个,所述第一用户在说出所述第二命令的同时位于所述一个或多个麦克风中的至少一个的阈值距离内,或两者兼有,来确定所述第一用户将所述第二命令指向所述一个或多个麦克风。9.根据权利要求1所述的设备,还包括耦接到所述一个或多个处理器的生物特征传感器,其中,所述一个或多个处理器还被配置为:从所述生物特征传感器接收生物特征输入;以及基于所述生物特征输入确定所述关键字是由所述第一用户说出的。10.根据权利要求1所述的设备,其中,所述一个或多个处理器被包括在集成电路中。11.根据权利要求1所述的设备,其中,所述一个或多个处理器被包括在车辆中。12.根据权利要求1所述的设备,其中,所述一个或多个处理器实现在音频设备中,并且其中,所述音频设备包括无线扬声器和具有集成助理应用的由语音激活的设备。
13.一种语音激活的方法,所述方法包括:经由一个或多个麦克风接收由第一用户说出的关键字和第一命令;在接收所述第一命令之后,在没有间断地收到所述关键字的情况下,经由所述一个或多个麦克风接收第二命令;以及至少部分地基于确定所述第二命令是由同一所述第一用户说出的,选择性地处理所述第二命令。14.根据权利要求13所述的方法,还包括:从所述一个或多个麦克风接收音频信号;确定所述音频信号的第一部分对应于由所述第一用户说出的所述关键字;以及确定所述音频信号的第二部分对应于由所述第一用户说出的所述第一命令。15.根据权利要求14所述的方法,还包括:确定由所述音频信号的所述第一部分指示的第一语音特性;以及基于所述第一语音特性生成与所述第一用户相关联的语音模型。16.根据权利要求14所述的方法,还包括:确定由所述音频信号的所述第一部分指示的第一语音特性;以及响应于确定所述第一语音特性匹配与所述第一用户相关联的语音模型,确定所述关键字是由所述第一用户说出的。17.根据权利要求14所述的方法,还包括:确定所述音频信号的第三部分对应于第二命令;确定由所述音频信号...
【专利技术属性】
技术研发人员:AK辛哈,P卡尔瓦科塔,D博米克,
申请(专利权)人:高通股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。