通过使用互连语音验证系统实现互操作性的系统和方法技术方案

技术编号:33702985 阅读:66 留言:0更新日期:2022-06-06 08:18
本申请涉及通过使用互连语音验证系统实现互操作性的系统和方法。公开了一种用于通过互连的语音验证系统实现互操作性和对个人扩展知识/偏好数据库(PEKD)的访问的系统和方法。来自各种不同公司和系统的设备可以链接到语音验证系统(VVS)。用户也可以进行与VSS的注册,以便VSS可以通过个人唤醒短语对用户进行认证。此后,用户可以通过说出他们的唤醒短语来从不具有所有权的设备访问他们的PEKD。来从不具有所有权的设备访问他们的PEKD。来从不具有所有权的设备访问他们的PEKD。

【技术实现步骤摘要】
通过使用互连语音验证系统实现互操作性的系统和方法

技术介绍

[0001]语音作一种人机接口正在腾飞。各大公司提供语音虚拟助手,诸如,谷歌助手、亚马逊Alexa、苹果Siri、微软Cortana、声音猎手Hound、阿里巴巴天猫精灵、腾讯小微、小米小爱、百度DuerOS、华为Celia、三星Bixby、Naver Clova以及Mycroft(迈克罗夫特)等。其中许多助手可以控制嵌入式系统(IoT设备)。对于每一个助手,用户都必须创建帐户。如此操作之后,用户可以与虚拟助手及其可以控制的设备互动。这些构成了由语音助手控制的专有生态系统。提供语音助手的公司使用有关用户在创建帐户时的信息以及在使用过程中收集的数据,以提供有用的功能和服务。但是,每家公司都会在自己的生态系统中获取用户的个人信息。如果不重新创建新帐户并重新提供个人信息,用户就无法从另一家公司的改进服务中受益。这有利于现有的提供商阻挡可能提供有用的新服务的创新的颠覆性公司,但会阻碍用户在服务提供商之间切换。所有这些都对消费者不利。

技术实现思路

[0002]以下说明书描述了一种验证系统,其包括存储与个人扩展知识/偏好数据库(PEKD)和注册的签名独特关联的唤醒短语,接收语音音频,识别语音音频中的独特唤醒短语,从语音音频中提取签名,将提取的签名与和独特唤醒短语相关联的注册的签名进行比较以对用户进行认证,以及允许用户访问相关联的PEKD。
[0003]这样的系统可以将PEKD存储在用户拥有的设备中,存储在公共分布式账本(ledger)中(由允许第三方访问的服务提供商存储),或存储在其他适当的数据库中。
[0004]用户的识别和认证可以通过与短语无关的自动语音识别来进行。可能实现这一点的一种方式是使用经训练的模型提取和计算语音特征向量。特征向量可以在习得的嵌入空间内。在这种情况下,可以通过计算向量之间的距离来完成已接收向量与用户简档存储向量的比较。另一种方式是使用基于唤醒短语训练过的短语侦测器(spotter)。语音认证可以是基于独特唤醒短语的与短语有关的,或者是基于说出其他单词的与短语无关的。
[0005]说明书还描述了一种用户认证方法,包括接收来自用户的个人数据,接收来自服务提供商的访问数据的请求,请求用户的授权,接收来自用户的响应,以及向服务提供商提供以响应为条件的数据副本的访问权。
[0006]这种认证还可能包括存储注册生物特征签名,将其与请求中的生物特征签名进行比较,以及根据签名之间的相似度调整响应。此生物特征签名可以是机器习得的嵌入空间中的特征向量,且相似度可以用向量之间的距离来计算。可以使用多种类型的生物特征识别技术,其中一种方式是从语音音频中提取签名。
[0007]说明书还描述了一种计算机实现的数据库管理方法,所述方法包括:从客户端设备接收对PEKD的数据库操作的API请求,其中所述请求是由客户端设备的用户发起的;根据请求确定要访问的用户个人数据的一部分、要删除或获取的数据的类型;根据数据类型确定存储此类型数据的适当的服务器;向该适当的服务器发送操作请求;接收来自服务器的响应;以及向设备发送响应。
[0008]对于这种方法,响应可以是DELETE(删除)确认、包括PEKD的GET(获取)响应,或其他类型的响应。访问数据库进行管理可包括对请求的auth代理授权,这可以使用相互认证协议。可以将数据库操作请求发送到Kafka队列。此外,数据库请求可以分配给多个MapReduce集群。
附图说明
[0009]图1示出了虚拟助手生态系统。
[0010]图2示出了虚拟助手生态系统的框图。
[0011]图3示出了用户与酒店客房虚拟助手的互动。
[0012]图4示出了通过语音验证来对用户进行认证的设备。
[0013]图5示出了在语音验证系统中注册用户的方法。
[0014]图6示出了语音指纹。
[0015]图7示出了通过语音指纹进行语音认证的图示。
[0016]图8示出了与销售点设备的语音互动。
[0017]图9示出了注册用户用于双重认证的方法。
[0018]图10示出了通过与短语无关的语音指纹进行验证的方法。
[0019]图11示出了通过语音变化检测进行验证的方法。
[0020]图12示出了与自动售货机的语音互动。
[0021]图13示出了与楼宇安防系统的语音互动。
[0022]图14示出了使用边缘处理的语音验证。
[0023]图15示出了结合被认证数据访问的虚拟助手平台。
[0024]图16示出了结合被认证访问和请求排队的虚拟助手平台。
[0025]图17A示出了非暂时性计算机可读介质。
[0026]图17B示出了另一种类型的非暂时性计算机可读介质。
[0027]图18A示出了片上系统。
[0028]图18B示出了片上系统的框图。
[0029]图19A示出了机架服务器。
[0030]图19B示出了服务器的框图。
具体实施方式
[0031]下文描述通过互连的语音验证系统实现互操作性的过程步骤系统和机器和部件系统。一些实现方式使用执行存储在非暂时性计算机可读介质上的软件指令的计算机。下文的示例示出了此类系统各个方面的设计选择。总体而言,不同方面的设计选择是独立的,可以按任意组合进行协作。
[0032]PEKD
[0033]个人扩展知识/偏好数据库(PEKD)是一种个人数据库。它有助于扩展个人的个人知识/智力/偏好/意识。PEKD由个人数据服务提供商的服务器存储和维护。用户可以使用语音和其他输入来构建和访问PEKD及其存储的部分个人数据。请注意,为了简单起见,在本申请中,提供商的服务器也可以称为提供商。
[0034]图1示出了通过使用用户PEKD的互连系统来实现互操作性的示例系统。用户11使用语音来调用智能扬声器12,与其互动、控制它,并使用它来控制其他兼容设备。智能扬声器通过云网络(诸如,互联网)与虚拟助手平台13进行通信。它可以执行语音识别、自然语言理解、通过网络API请求信息或动作,并向智能扬声器提供响应。虚拟助手平台存储PEKD信息14,并使用它来提供适合用户的响应以及访问信息和动作。在某些系统中,一家公司同时提供虚拟助手平台和智能扬声器。然而,在所示系统中,智能扬声器12还可以与提供智能扬声器的独立公司15通信。智能扬声器供应商还可以存储PEKD信息16,并且使用它来向智能扬声器提供服务或附加功能。智能扬声器还可以与第三方设备和服务的提供商通信,这些提供商可以独立于虚拟助手平台和智能扬声器供应商运行。此类提供商通常是商品和服务的商业提供商。一些此类第三方出于确保用户隐私等原因或仅仅因为他们不需要而不存储PEKD信息。许多类型的消费设备都可以成为这种开放生态系统17的一部分,包括,例如,智能手机、家用电器或汽车供应商。这样的系统允许不同的公司访问他们需要的至少一部分PEKD信息,同时用户可以自由访问他们希望的各种设备和服务。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种通过语音对用户进行认证的系统,所述系统包括:个人数据服务提供商,包括:个人数据库,包括:多个用户的个人数据,其中,所述个人数据服务提供商能够通过一个或多个网络与第一商业提供商和第二商业提供商进行通信;其中,所述第一商业提供商与第一支持语音功能的设备相关联,并且所述第二商业提供商与第二支持语音功能的设备相关联;并且其中,作为语音验证服务器使用所述第一支持语音功能的设备对用户进行认证的结果,所述个人数据服务提供商能够向所述第一商业提供商授予对用户的个人数据的至少一部分的访问权,并且,作为所述语音验证服务器使用所述第二支持语音功能的设备对所述用户进行认证的结果,所述个人数据服务提供商能够向所述第二商业提供商授予对所述用户的个人数据的至少一部分的访问权。2.根据权利要求1所述的系统,其中,所述多个用户的个人数据被存储在公共分布式账本中。3.根据权利要求1所述的系统,其中,所述多个用户的个人数据被存储在数据库中。4.根据权利要求1所述的系统,其中,所述语音验证服务器的认证包括计算机器习得的嵌入空间中的语音特征向量。5.根据权利要求1所述的系统,其中,所述语音验证服务器的认证包括识别特定于所述用户的唤醒短语。6.根据权利要求1所述的系统,其中,所述系统是分布式的。7.一种语音认证且支持语音功能的设备,包括:麦克风,能够接收来自用户的语音查询;和网络连接,其中,所述语音认证且支持语音功能的设备能够将所述语音查询发送到语音验证服务器;并且其中,所述语音认证且支持语音功能的设备能够响应于数据服务提供商授予访问权而接收所述用户的个人数据的至少一部分,所述数据服务提供商响应于所述语音验证服务器的认证而授予访问权。8.根据权利要求7所述的设备,其中,所述用户的个人数据的所述一部分是从公共分布式账本接收的。9.根据权利要求7所述的设备,其中,所述用户的个人数据的所述一部分是从数据库接收的。10.根据权利要求7所述的设备,其中,所述语音认证且支持语音功能的设备响应于识别到唤醒短语而向所述语音验证服务器发送所述语音查询。11.一种用于通过语音识别用户的计算机实现的方法,所述方法包括:接收来自第一支持语音功能的设备的、访问用户的个人数据的至少一部分的请求,所述请求包括来自所述用户的第一语音查询;将所述第一语音查询发送到语音验证服务器;
从所述语音验证服务器接收第一认证消息;将所述用户的个人数据的所述...

【专利技术属性】
技术研发人员:莫轲文贺华伦
申请(专利权)人:声音猎手公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1