音频外围设备制造技术

技术编号:24617174 阅读:33 留言:0更新日期:2020-06-24 03:12
在包括一个或多个麦克风的外围设备中提供了一种方法。外围设备经由数字连接能连接至主机设备。该方法包括:从一个或多个麦克风接收与来自用户的话语有关的音频数据流,该音频数据流包括数据段流;以及,响应于在音频数据流的一个或多个第一数据段中检测到触发短语:实现数字连接的激活;以及,经由所述数字连接将从一个或多个第一数据段所提取的一个或多个生物测定特征传输至主机设备,以用于语音生物测定认证过程。

Audio peripherals

【技术实现步骤摘要】
【国外来华专利技术】音频外围设备
本公开内容的实施方案涉及语音生物测定认证(voicebiometricauthentication),特别涉及一种用于在使用外围设备捕获音频输入时减少语音生物测定认证的延时的方法和装置。
技术介绍
设置语音用户接口,以允许用户使用他们的语音与系统交互。例如,在诸如智能电话、平板计算机等设备中,此的一个优点是允许用户以免提的方式操作该设备。在一个典型的系统中,用户通过说出一个触发短语(可能地跟随有一个或多个命令短语)来将语音用户接口从低功率待机模式中唤醒。话语(speech)识别技术用于检测已说出触发短语且标识在一个或多个命令短语中所请求的动作。触发短语可以由系统预限定(例如,通过先前的注册短语),使得检测触发短语所需的处理比一般话语识别所需的处理明显简单且计算强度低。此使得电子设备能够处于低功率状态,同时持续监测来自一个或多个麦克风的输入信号是否存在触发短语。触发短语的公知示例包括“HeySiri”(RTM)和“OKGoogle”(RTM)。然后可以将说话人识别技术应用于话语,以确定用户是否为授权用户,以及是否应执行受限动作(例如,设备是否应从其待机模式中唤醒,或者是否应执行所请求的动作)。用户越来越多地使用外围设备及其主机设备来通过麦克风捕获音频。这样的外围设备的实施例包括头戴式受话器和智能手表或其他可穿戴设备,例如智能眼镜。这样的外围设备对他们的用户或佩戴者而言是个人的;然而,已知的是,其他的外围设备对于任何一个特定用户都不是个人的。例如,家庭辅助设备变得越来越流行,且可以包括一个或多个远程单元,用于捕获待由中央集线器设备所处理的音频。这样的外围设备可以经由有线或无线数字连接而被连接至主机设备(例如,智能电话、平板计算机、家庭辅助集线器等)。有线连接的实施例包括USB连接器,而无线连接的实施例包括蓝牙(RTM)及其变体以及其他短距离无线协议。为了节约外围设备以及主机设备中的功率,可以在不需要时将数字连接置于低功率状态。低功率状态的合适实施例包括睡眠状态或完全停用连接。在一段时间不活动之后,或者按照合适的用户命令将外围设备和主机设备中的一个或两个置于类似的低功率状态之后,可以将数字连接置于这种低功率状态。然而,此可能具有一些缺点,因为在用户说出旨在唤醒系统的触发短语的时刻,数字连接不可用。本公开内容的实施方案寻求解决这些和其他问题。
技术实现思路
在一方面,提供了一种在包括一个或多个麦克风的外围设备中的方法。该外围设备经由数字连接能连接至主机设备。该方法包括:从一个或多个麦克风接收与来自用户的话语有关的音频数据流,该音频数据流包括数据段流(astreamofdatasegments);以及,响应于在音频数据流的一个或多个第一数据段中检测到触发短语:实现所述数字连接的激活;以及,经由数字连接将从一个或多个第一数据段所提取的一个或多个生物测定特征(biometricfeature)传输至主机设备,以用于语音生物测定认证过程。本公开内容的另一方面提供了一种用于外围设备的音频传输设备。该外围设备包括一个或多个麦克风,且经由数字连接能连接至主机设备。该音频传输设备包括:第一输入,用于从所述一个或多个麦克风接收与来自用户的话语有关的音频数据流,该音频数据流包括数据段流;以及,触发短语检测电路,被配置为检测该音频数据流的一个或多个第一数据段中的触发短语;以及,接口电路,被配置为:响应于检测到触发短语,实现所述数字连接的激活;以及,经由所述数字连接将从所述一个或多个第一数据段所提取的一个或多个生物测定特征传输至所述主机设备,以用于语音生物测定认证过程。本公开内容的其他方面提供了一种外围设备,包括多个麦克风中的一个麦克风,以及如上所述的音频传输设备;以及,这种外围设备和包括语音生物测定认证模块的主机设备的组合。该语音生物测定认证模块被配置为接收一个或多个生物测定特征,且使用所述一个或多个生物测定特征来执行语音生物测定认证算法,以确定用户是否为授权用户。附图说明为了更好地理解本公开内容的实施例,且为了更清楚地示出如何执行所述实施例,现在将仅借助于实施例参考下面的附图,在附图中:图1是示出外围设备和主机设备之间的常规音频数据传送的时序图。图2是示出根据本公开内容的实施方案的外围设备和主机设备的示意图。图3是示出根据本公开内容的实施方案的外围设备和主机设备之间的音频数据传输的时序图;以及图4是根据本公开内容的实施方案的方法的流程图。具体实施方式为了清楚起见,在此应注意,这里的描述涉及说话人识别和话语识别,说话人识别和话语识别旨在具有不同的含义。说话人识别是指提供关于说话人的身份信息的技术。例如,出于标识或认证的目的,说话人识别可以从一组先前注册的个人中确定说话人的身份,或者可以提供指示说话人是否是特定个人的信息。话语识别是指一种用于确定所讲的内容和/或含义而非识别正在说话的人的技术。根据本公开内容的实施方案,外围设备本身包括用于检测用户说出的触发短语的设备。一旦检测到触发短语,外围设备内的接口电路就实现与主机设备的数字连接的激活。因此,通过在外围设备内提供触发短语检测模块或设备,用户可以利用外围设备将电子设备从低功率睡眠状态唤醒。此外,主机设备(至主机设备的数字连接)在不使用时可以进入低功率状态,从而节约了主机设备和外围设备中的电池资源。然而,当在话语识别过程和说话人识别过程的上下文中使用外围设备捕获音频时,此低功耗状态可能会具有一些缺点。图1是说明该问题的时序图。出于图1的目的,我们假设外围设备包括用于检测来自用户的话语中的触发短语的电路或模块,但不具有任何执行生物测定说话人识别过程的能力,替代地执行生物测定说话人识别过程的能力被设置在主机设备上。进一步假定外围设备及其关联的主机设备之间的数字连接最初处于低功耗状态。因此,用户可以说出触发短语,且可选地跟随有一个或多个包含待执行一个或多个动作的指令或请求的命令。命令短语由顺序命令数据段(CMD1、CMD2和CMD3)表示,但应注意,每一数据段可能仅包含单个命令或多个命令的一部分。当在外围设备所捕获的话语中检测到触发短语时,触发短语检测模块生成检测事件且激活与主机设备的数字连接。一旦激活,音频数据就可以经由数字连接传输至主机设备。此方法的问题在于,所引入的延时近似等于用户说出触发短语所花费的时间量。在检测到触发短语且激活数字连接之前,数据不会且也不能被传输至主机设备。典型的触发短语可能会在近似一秒钟内说出,这意味着主机设备在用户讲话之后一秒,才接收到音频信号。因此,主机设备中利用该音频数据的过程(例如,话语识别过程和说话人识别过程)被延迟。为了解决外围设备与主机设备之间的音频数据传输中的延时的问题,本公开内容的其他实施方案提供了方法和装置,由此,在检测到触发短语时,从触发短语中提取生物测定特征,且生物测定特征而非触发短语音频本身从外围设备被传输至主机设备。以这种方式,可以在比其他情况本文档来自技高网
...

【技术保护点】
1.一种在包括一个或多个麦克风的外围设备中的方法,该外围设备经由数字连接能连接至主机设备,该方法包括:/n从所述一个或多个麦克风接收与来自用户的话语有关的音频数据流,该音频数据流包括数据段流;以及/n响应于在所述音频数据流的一个或多个第一数据段中检测到触发短语:/n实现所述数字连接的激活;以及/n经由所述数字连接向所述主机设备传输从所述一个或多个第一数据段所提取的一个或多个生物测定特征,以用于语音生物测定认证过程。/n

【技术特征摘要】
【国外来华专利技术】20171207 GB 1720418.1;20171113 US 62/585,0851.一种在包括一个或多个麦克风的外围设备中的方法,该外围设备经由数字连接能连接至主机设备,该方法包括:
从所述一个或多个麦克风接收与来自用户的话语有关的音频数据流,该音频数据流包括数据段流;以及
响应于在所述音频数据流的一个或多个第一数据段中检测到触发短语:
实现所述数字连接的激活;以及
经由所述数字连接向所述主机设备传输从所述一个或多个第一数据段所提取的一个或多个生物测定特征,以用于语音生物测定认证过程。


2.根据权利要求1所述的方法,还包括经由所述数字连接将所述音频数据流的一个或多个第二数据段传输至所述主机设备,所述一个或多个第二数据段不包括所述一个或多个第一数据段。


3.根据权利要求2所述的方法,其中所述数字连接包括第一数据信道和第二数据信道,其中所述一个或多个生物测定特征通过所述第一数据信道传输,且所述一个或多个第二数据段通过所述第二数据信道传输。


4.根据权利要求3所述的方法,其中所述第一数据信道的带宽比所述第二数据信道的带宽更低。


5.根据权利要求3或4所述的方法,其中所述第一数据信道包括异步数据信道。


6.根据权利要求3至5中的任一项所述的方法,其中所述第一数据信道包括经编码的音频信道。


7.根据权利要求6所述的方法,其中,所述经编码的音频信道是超声的,或者其中所述经编码的音频信道处于高于所传输的第二数据段的音频带宽的频率。


8.根据权利要求3至7中的任一项所述的方法,其中所述第二数据信道包括等时音频信道。


9.根据权利要求3至8中的任一项所述的方法,其中所述一个或多个第二数据段包括由用户说出的一个或多个命令短语。


10.根据前述权利要求中的任一项所述的方法,还包括:对所述一个或多个生物测定特征进行加密签名或加密,且其中传输所述一个或多个生物测定特征包括传输所述一个或多个经加密签名的生物测定特征或经加密的生物测定特征。


11.根据前述权利要求中的任一项所述的方法,其中所述一个或多个生物测定特征包括以下项中的一项或多项:梅尔频率倒谱系数、感知线性预测系数、线性预测编码系数、基于深度神经网络的参数和i向量。


12.根据前述权利要求中的任一项所述的方法,还包括:将来自所述一个或多个麦克风的一个或多个音频输入信号存储在所述外围设备的缓冲存储器中。


13.根据权利要求12所述的方法,其中所述缓冲存储器是环形的。


14.根据权利要求12或13所述的方法,其中响应于检测到所述触发短语,从所述缓冲存储器的内容中提取所述一个或多个生物测定特征。


15.根据权利要求12至14中的任一项所述的方法,其中基于所述缓冲存储器的内容来检测所述触发短语。


16.根据权利要求12至14中的任一项所述的方法,其中基于从所述一个或多个麦克风所接收的音频输入信号来检测所述触发短语。


17.根据前述权利要求中的任一项所述的方法,其中所述数字连接包括至所述主机设备的有线连接或无线连接。


18.根据前述权利要求中的任一项所述的方法,其中实现所述数字连接的激活的步骤包括激活所述数字连接。


19.根据权利要求1至17中的任一项所述的方法,其中实现所述数字连接的激活的步骤包括改变所述外围设备的轮询状态。


20.一种用于外围设备的音频传输设备,所述外围设备包括一个或多个麦克风,所述外围设备经由数字连接能连接至主机设备,所述音频传输设备包括:
第一输入,用于从所述一个或多个麦克风接收与来自用户的话语有关的音频数据流,该音频数据流包括数据段流;
触发短语检测电路,被配置为检测所述音频数据流的一个或多个第一数据段中的触发短语;
接口电路,被配置为:
响应于检测到所述触发短语,实现所述数字连接的激活;以及
经由所述数字连接将从所述一个或多个第一数据段中所提取的一个或多个生物测定特征传输至所述主机设备,以用于语音生物测定认证过程。


21.根据权利要求20所述的音频传输设备,其中所述接口电路还被配置为经由所述数字连接将所述音频数据流的一...

【专利技术属性】
技术研发人员:M·佩奇T·哈维
申请(专利权)人:思睿逻辑国际半导体有限公司
类型:发明
国别省市:英国;GB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1