安全语音生物测定认证制造技术

技术编号:24335098 阅读:68 留言:0更新日期:2020-05-29 21:57
一方面提供了一种音频数据传输模块中的方法。该方法包括:获得包括来自待认证用户的话语的音频数据流,该音频数据流包含多个数据段;获得语音生物测定认证结果,所述语音生物测定认证结果与音频数据流的一个或多个第一数据段中的话语有关;针对音频数据流的一个或多个第二数据段生成数据认证数据;生成一个或多个经加密签名的包,所述一个或多个经加密签名的包包括该语音生物测定认证结果和该数据认证数据;以及,输出一个或多个经加密签名的包。

Secure voice biometric authentication

【技术实现步骤摘要】
【国外来华专利技术】安全语音生物测定认证
本公开内容的实施方案涉及语音生物测定认证(voicebiometricauthentication),且具体地涉及用于提高在受限动作(restrictedaction)的批准中所使用的语音生物测定认证过程的安全性的方法和装置。
技术介绍
语音用户界面被设置以允许用户使用他们的语音与系统交互。此一个优点是,例如在诸如智能电话、平板电脑等设备中,它允许用户以免提的方式操作该设备。在一个典型的系统中,用户通过说出触发短语(可能地跟随有一个或多个命令短语)将语音用户界面从低功率待机模式中唤醒。话语识别技术(speechrecognitiontechnique)用于检测触发短语已说出,且标识已在一个或多个命令短语中请求的动作。越来越多地应用生物测定技术来提高用户与电子设备交互的安全性。例如,在上文所描述的语音用户界面的情况下,可对触发短语(以及可能地还有命令短语)执行说话人识别过程(speakerrecognitionprocess),以确定请求方(即,说话人)是否为设备的授权用户。说话人识别过程可独立于话语识别过程以及可与话语识别过程并行地执行。取决于说话人识别过程的结果以及在语音用户界面中所应用的安全水平,电子设备可执行或被阻止执行一个或多个受限动作。例如,如果说话人识别过程失败(例如,说话人不是授权用户),电子设备不会唤醒,或响应于检测到触发短语,电子设备变成解锁。在其他实施例中,如果说话人识别过程失败,则不会执行命令短语中所请求的一个或多个动作。语音用户界面可受到恶意第三方的攻击,所述恶意第三方试图欺骗(spoof)说话人识别过程且不经授权用户的批准而获得受限动作的访问权限。预期这一攻击方法为“中间人”攻击,其中通过例如在设备的处理电路上安装恶意软件通过欺骗数据来拦截和/或替换电子设备内的模块或电路之间的数据传递。例如,在用户话语包括跟随有一个或多个命令短语的触发短语的情况下,第三方可试图用一个或多个对第三方有利的替代命令(例如,将资金转移至第三方的财务指令等)来替换说出的命令短语。如果说话人识别过程在触发短语方面是成功的(即,说话人被认证为授权用户),则电子设备可执行与替换命令短语相对应的动作,而不执行与用户实际说出的那些命令短语相对应的动作。本公开内容的实施方案试图解决这些问题和其他问题。
技术实现思路
一方面,提供了一种音频数据传输模块中的方法。该方法包括:获得包括来自待认证用户的话语的音频数据流,该音频数据流包括多个数据段;获得语音生物测定认证结果,该语音生物测定认证结果与该音频数据流的一个或多个第一数据段中的话语有关;针对该音频数据流的一个或多个第二数据段生成数据认证数据(data-authenticationdata);生成一个或多个经加密签名的包,所述一个或多个经加密签名的包包括该语音生物测定认证结果和该数据认证数据;以及,输出所述一个或多个经加密签名的数据包。另一方面,提供了一种音频传输设备,包括:第一输入,用于获得与来自待认证用户的话语有关的音频数据流,该音频数据流包括多个数据段;第二输入,用于获得语音生物测定认证结果,该语音生物测定认证结果与该音频数据流的一个或多个第一数据段中的话语有关;数据认证模块,被配置为针对该音频数据流的一个或多个第二数据段生成数据认证数据;加密模块,被配置为生成一个或多个经加密签名的包,所述一个或多个经加密签名的包包括该语音生物测定认证结果和该数据认证数据;以及,输出,用于输出所述一个或多个经加密签名的数据包。本公开内容的另一方面提供了一种音频数据接收模块中的方法。该方法包括:接收来自音频数据传输模块的音频数据流,该音频数据流与来自请求生物测定认证的用户的话语有关,该音频数据流包括多个数据段;接收来自该音频数据传输模块的一个或多个经加密签名的包,所述一个或多个经加密签名的包包括:与所述话语有关的语音生物测定认证结果,以及,用于该音频数据流的一个或多个数据段的数据认证数据;针对所接收的音频数据流中的一个或多个数据段生成数据认证数据;将所生成的数据认证数据与所接收的数据认证数据进行比较;以及,基于比较来确定是否将用户认证为授权用户。另一方面提供一种音频接收模块,所述音频接收模块包括:第一输入,用于接收来自音频数据传输模块的音频数据流,该音频数据流与来自请求生物测定认证的用户的话语有关,该音频数据流包括多个数据段;第二输入,用于接收来自所述音频数据传输模块的一个或多个经加密签名的包,所述一个或多个经加密签名的包包括:与所述话语有关的语音生物测定认证结果以及用于所述音频数据流的一个或多个数据段的数据认证数据;数据认证模块,用于针对所接收的音频数据流中的一个或多个数据段生成数据认证数据;以及,用户认证模块,用于将所生成的数据认证数据与所接收的数据认证数据进行比较,且基于所述比较来确定是否将该用户认证为授权用户。附图说明为了更好地理解本公开内容的实施例,且为了更清楚地示出如何实施所述实施例,现在将仅通过实施例的方式参考下面的附图,在附图中:图1示出了根据本公开内容的实施方案的电子设备;图2示出了根据本公开内容的实施方案的音频传输设备。图3示出了根据本公开内容的实施方案的音频接收设备;且图4a、4b、4c和4d是示出根据本公开内容的实施方案的音频数据流的处理的示意图。具体实施方式为了清楚起见,将注意,此说明书涉及说话人识别和话语识别,说话人识别和话语识别旨在具有不同的含义。说话人识别是指提供有关说话人身份信息的技术。例如,出于标识或认证的目的,说话人识别可从一组先前注册的个人中确定说话人的身份,或者可提供指示说话人是否为特定个人的信息。话语识别是指用于确定所说的内容和/或含义而非识别说话人的技术。图1示出了根据本公开内容的一个方面的电子设备100。该设备可以是任何合适类型的设备,如移动计算设备(例如,笔记本电脑或平板电脑)、游戏控制台、远程控制设备、家庭自动化控制器或包括家用温度或照明控制系统的家用电器、玩具、机器(如,机器人)、音频播放器、视频播放器等,但是在此例示性实施例中,该设备是移动电话,且特别是智能手机100。智能手机100可通过适当的软件用作控制另一设备或系统的控制界面。设备100包括一个或多个可操作以检测用户的语音的麦克风102。麦克风102被耦合至认证设备104,认证设备104转而被耦合至处理电路系统106。在所例示的实施方案和下文的讨论中,处理电路系统106被描述为应用处理器(AP)。通常,处理电路系统106可以是任何合适的处理器(如,中央处理单元(CPU))或处理电路系统。在使用中,用户对着一个或多个麦克风102讲话,在麦克风102中检测到话语且生成包括该话语的音频数据流。该音频数据流被输出至认证设备104,认证设备104可被实施为分立的集成电路。在此,应注意,由麦克风102所输出的音频数据流可以是数字的或模拟的。在模拟音频数据流的情况下,认证设备104可包括模数转换器(ADC),所述模数转换本文档来自技高网
...

【技术保护点】
1.一种音频传输设备,包括:/n第一输入,用于获得与来自待认证用户的话语有关的音频数据流,该音频数据流包括多个数据段;/n第二输入,用于获得语音生物测定认证结果,所述语音生物测定认证结果与该音频数据流的一个或多个第一数据段中的话语有关;/n数据认证模块,被配置成针对该音频数据流的一个或多个第二数据段生成数据认证数据;/n加密模块,被配置成生成一个或多个经加密签名的包,所述一个或多个经加密签名的包包括该语音生物测定认证结果和该数据认证数据;以及/n输出,用于输出所述一个或多个经加密签名的包。/n

【技术特征摘要】
【国外来华专利技术】20180209 GB 1802193.1;20171020 US 62/575,0071.一种音频传输设备,包括:
第一输入,用于获得与来自待认证用户的话语有关的音频数据流,该音频数据流包括多个数据段;
第二输入,用于获得语音生物测定认证结果,所述语音生物测定认证结果与该音频数据流的一个或多个第一数据段中的话语有关;
数据认证模块,被配置成针对该音频数据流的一个或多个第二数据段生成数据认证数据;
加密模块,被配置成生成一个或多个经加密签名的包,所述一个或多个经加密签名的包包括该语音生物测定认证结果和该数据认证数据;以及
输出,用于输出所述一个或多个经加密签名的包。


2.根据权利要求1所述的音频传输设备,其中该音频数据流包括第n个数据段,其中n是整数,且其中第一输入被配置成针对第n个数据段获得与包括第n个数据段的一个或多个第一数据段中的话语有关的语音生物测定认证结果,且其中该数据认证模块被配置成针对第n个数据段生成用于包括第n个数据段的一个或多个第二数据段的数据认证。


3.根据权利要求2所述的音频传输设备,其中针对第n个数据段,该一个或多个第一数据段附加地包括音频数据流中位于第n个数据段之前的一个或多个数据段。


4.根据权利要求2或3所述的音频传输设备,其中针对第n个数据段,一个或多个第二数据段仅包括第n个数据段。


5.根据权利要求1至4中的任一项所述的音频传输设备,其中该加密模块被配置成关于音频数据流中的连续数据段生成一个或多个经加密签名的包。


6.根据权利要求1至5中的任一项所述的音频传输设备,其中该数据认证数据包括用于所述一个或多个第二数据段的散列值。


7.根据权利要求1至6中的任一项所述的音频传输设备,其中该数据认证数据包括所述一个或多个第二数据段中的音频的声学指纹。


8.根据权利要求7所述的音频传输设备,其中所述声学指纹包括以下中的一个或多个:平均过零率;平均频谱;频谱平坦度;一个或多个频带中的突出音调;音频数据中的时频表示中的峰值位置;信号功率;信号包络;前述参数中的任一个的变化率;以及,音频音素类。


9.根据权利要求1至8中的任一项所述的音频传输设备,其中一个或多个经加密签名的包还包括对数据认证数据所基于的音频数据流中的起点和终点中的一个或多个的指示。


10.根据权利要求1至9中的任一项所述的音频传输设备,其中该加密模块被配置成通过将私有-公共密钥对的私有密钥应用至该语音生物测定认证结果和该数据认证数据中的一个或多个来生成所述一个或多个经加密签名的包。


11.根据权利要求1至10中的任一项所述的音频传输装置,所述音频传输装置还包括用于输出至少所述一个或多个第二数据段的第二输出。


12.根据权利要求1至11中的任一项所述的音频传输设备,其中所述一个或多个第一数据段与由用户所说出的触发短语有关。


13.根据权利要求1至12中的任一项所述的音频传输设备,其中一个或多个第二数据段与由用户所说出的命令短语有关。


14.根据权利要求1至13中的任一项所述的音频传输设备,其中所述加密模块被配置成生成一个经加密签名的包,所述经加密签名的包包括该语音生物测定认证结果和该数据认证数据。


15.一种电子设备,该电子设备包括:
根据权利要求1至14中的任一项所述的音频传输设备。


16.一种音频数据传输模块中的方法,该方法包括:
获得包括来自待认证用户的话语的音频数据流,该音频数据流包含多个数据段;
获得语音生物测定认证结果,所述语音生物测定认证结果与该音频数据流的一个或多个第一数据段中的话语有关;
针对音频数据流的一个或多个第二数据段生成数据认证数据;
生成一个或多个经加密签名的包,所述一个或多个经加密签名的包包括该语音生物测定认证结果和该数据认证数据;以及
输出所述一个或多个加密签名的包。


17.一种计算机程序产品,该计算机程序产品包括计算机可读有形介质以及用于执行根据权利要求16所述的方法的指令。


...

【专利技术属性】
技术研发人员:R·罗伯茨M·佩奇
申请(专利权)人:思睿逻辑国际半导体有限公司
类型:发明
国别省市:英国;GB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1