用于智能助理计算机的用户注册制造技术

技术编号:22269161 阅读:43 留言:0更新日期:2019-10-10 18:09
向智能助理计算机注册人包括获得经由一个或多个相机捕捉的描绘最初未注册人的一个或多个图像帧。该最初未注册人的面部识别数据从该一个或多个图像帧中提取。注册该最初未注册人的口述命令经由一个或多个话筒被接收。在确定该口述命令源自具有预建立的注册特权的注册人之际,通过在新注册人的人员简档中将一个或多个附加特权与该面部识别数据相关联来将该最初未注册人注册为新注册人。

User Registration for Intelligent Assistant Computer

【技术实现步骤摘要】
【国外来华专利技术】用于智能助理计算机的用户注册背景智能助理计算机可以向用户提供语音交互、音乐回放、天气或新闻信息、和搜索界面,仅举数例。智能助理计算机可以向家庭或工作场所的多个人提供对一些信息的访问。然而,由智能助理计算机提供的其他信息可以是特定个人私有的,诸如举例而言入站通信。概述提供本概述以便以简化的形式介绍以下在详细描述中进一步描述的概念的选集。本概述并不旨在标识所要求保护的主题的关键特征或必要特征,亦非旨在用于限制所要求保护的主题的范围。此外,所要求保护的主题不限于解决在本公开的任一部分中提及的任何或所有缺点的实现。向智能助理计算机注册人包括获得经由一个或多个相机捕捉的描绘最初未注册人的一个或多个图像帧。最初未注册人的面部识别数据从该一个或多个图像帧中提取。注册最初未注册人的口述命令经由一个或多个话筒被接收。在确定该口述命令源自具有预建立的注册特权的注册人之际,通过在新注册人的人员简档中将一个或多个附加特权与该面部识别数据相关联来将该最初未注册人注册为新注册人。这些附加特权可以准许新注册人发起由智能助理计算机执行的一项或多项操作,这些操作先前在注册之前是不被准许的。附图简述图1描绘了智能助理计算系统的示例使用环境。图2是描绘示例智能助理计算系统的示意图。图3是描绘用于向智能助理计算机注册人的示例方法的流程图。图4描绘了其中在由智能助理计算系统捕捉到最初未注册人的图像和/或音频数据之后发起并执行该最初未注册人的注册的示例实现的时间线。图5描绘了其中发起最初未注册人的注册并且作为注册操作的一部分由智能助理计算系统捕捉该最初未注册人的图像和/或音频数据的另一示例实现的时间线。图6示意性地示出了根据本公开的一示例的可由话音监听器利用的语音识别程序。图7示出了根据本公开的一示例的意图模板。图8示意性地示出了根据本公开的一示例的处理对话的一部分的解析器和意图处理器。图9示意性地示出了根据本公开的各示例的可确定一个或多个实体的身份、位置和/或当前状态的实体跟踪器。图10示意性地示出了根据本公开的各示例的实现智能助理计算系统的一体化计算设备。图11示意性地示出了根据本公开的各示例的其中一个或多个远程服务用个体场所内(on-premises)计算设备执行智能助理计算系统的功能的示例实现。图12示意性地示出了根据本公开的各示例的其中一个或多个远程服务结合多个独立场所内传感器和/或设备执行智能助理计算系统的功能的另一示例实现。图13示意性地示出了根据本公开的各示例的其中一个或多个远程服务利用设备选择器的另一示例实现。图14示意性地示出了其中在检测到一个或多个口述关键词之际激活智能助理计算系统的一个或多个功能的示例实现。图15示意性地示出了根据本公开的各示例的其中响应于语音激活而选择(诸)传感器和(诸)输出设备的多设备环境的示例实现。图16示意性地示出了根据本公开的各示例的计算系统。详细描述图1描绘了智能助理计算系统100的示例使用环境。在该示例中,第一人120通过大声说出由计算系统100经由话筒捕捉的短语来向该计算系统介绍第二人122。例如,图1中描绘了第一人120正说出短语:“嘿计算机,这是我的朋友Tom(HeyComputer,thisismyfriendTom)”,这是指第二人122。由第一人120进行的这种介绍可被用于发起第二人122关于计算系统100的注册。利用传统计算系统来注册用户对于一些用户而言可能是麻烦且令人沮丧的。通常,管理用户的任务是在图形用户界面内导航计算机程序的非直观菜单和设置。由本文公开的智能助理计算系统支持的自然语言界面使用户能够通过使用直观的人对人介绍向该计算系统介绍新用户来注册那些新用户。例如,可以通过口述短语向计算系统宣告新人的姓名和/或与注册人的关系状态以注册新人。以此方式,用户可以按更类似于基于人类的交互的直观方式来与计算系统对话。在该示例中,第一人120向计算系统100注册,并且可被称为关于该计算系统的注册人或用户。例如,第一人120可以是计算系统100的所有者、主用户或管理用户,其先前已参与关于该计算系统的注册操作。向计算系统100注册的人可以获得关于该计算系统的附加特权,如将在本文中进一步详细地描述的。相反,第二人122最初未向计算系统100注册,并且可被称为关于该计算系统的最初未注册人或用户。例如,第二人122可以是在由计算系统100监视的位置130处访问第一人120的访客。在该示例中,位置130是第一人120的住所内的起居室。智能助理计算系统100包括提供智能助理服务的一个或多个计算设备。因此,计算系统100至少包括提供智能助理服务的智能助理计算设备110,即智能助理计算机。在至少一些实现中,计算设备110可以采用场所内一体化智能助理计算设备的形式。计算设备110可包括与该计算设备或其外壳集成和/或板载地位于其上的一个或多个图形显示设备、一个或多个音频扬声器、一个或多个话筒、一个或多个相机等。然而,在至少一些实现中,计算设备110可以是智能助理计算系统100的多个组件之一。例如,除了计算设备110之外,计算系统100还可包括一个或多个其他计算设备、图形显示设备、音频扬声器、话筒、相机等。图1描绘了计算系统100的图形显示设备112、音频扬声器114和116、以及相机118的示例,其相对于位置130位于场所内,但在物理上与计算设备110分开。计算系统100可包括位于同一场所的不同位置处和/或位于远离场所(例如,基于云的服务器)的一个或多个计算设备。计算设备110可以使用有线和/或无线连接来与一个或多个其他设备可操作地连接。例如,计算设备110可以使用任何合适的有线和/或无线通信协议集经由通信网络通信地耦合到一个或多个其他计算设备、传感器设备或受控设备。如本文进一步详细描述的,计算系统100可被配置成检测被监视区域内的人的存在,单独地跟踪那些人的空间位置,与那些人通信,使用经由一个或多个相机捕捉的图像数据和/或经由一个或多个话筒捕捉的音频数据以及其他传感器输入来单独地标识那些人。计算系统100可被配置成接收并处理自然语言输入,诸如举例而言口述短语。扮演用户角色的人可以利用由计算系统100支持的智能助理特征来实现大量功能。例如,用户可以提供自然语言输入(例如,口述命令)以命令计算系统100执行各种操作,诸如提供对查询的信息响应、发送或呈现通信消息、呈现音频/视频内容、捕捉和存储图像或音频内容、从一个设备向另一设备传递用户会话的实例、或者控制其他设备,仅举数例。这些各种操作中的一些或全部可以与并非对所有用户(诸如举例而言,未注册人)可用的特权相关联。例如,用户可向计算系统100询问有关各种各样的主题的信息,诸如天气、个人日历事件、电影放映时间等。作为另一示例,用户可以经由计算系统100来控制其他设备,诸如图形显示设备112、音频扬声器114和116、燃气壁炉140或电动窗帘142。作为又一示例,计算系统100可被用于接收和存储将在适当的将来时间被递送的消息和/或提醒。图2是描绘提供智能助理服务的示例智能助理计算系统200的示意图。计算系统200是图1的计算系统100的非限制性示例。计算系统200能够识别和响应自然语言输入。如参考图1的计算系统100类似地描述的,计算系统200可本文档来自技高网...

【技术保护点】
1.一种由计算系统执行的用于向智能助理计算机注册人的方法,所述方法包括:获得经由一个或多个相机捕捉的描绘最初未注册人的一个或多个图像帧;从所述一个或多个图像帧中提取所述最初未注册人的面部识别数据;经由一个或多个话筒接收注册所述最初未注册人的口述命令;确定所述口述命令源自具有预建立的注册特权的注册人;以及在确定所述口述命令源自具有所述预建立的注册特权的所述注册人之际,通过在新注册人的人员简档中将一个或多个附加特权与所述面部识别数据相关联来将所述最初未注册人注册为新注册人。

【技术特征摘要】
【国外来华专利技术】2017.02.14 US 62/459,020;2017.04.05 US 62/482,165;1.一种由计算系统执行的用于向智能助理计算机注册人的方法,所述方法包括:获得经由一个或多个相机捕捉的描绘最初未注册人的一个或多个图像帧;从所述一个或多个图像帧中提取所述最初未注册人的面部识别数据;经由一个或多个话筒接收注册所述最初未注册人的口述命令;确定所述口述命令源自具有预建立的注册特权的注册人;以及在确定所述口述命令源自具有所述预建立的注册特权的所述注册人之际,通过在新注册人的人员简档中将一个或多个附加特权与所述面部识别数据相关联来将所述最初未注册人注册为新注册人。2.根据权利要求1所述的方法,其特征在于,在接收到注册所述最初未注册人的所述口述命令之后捕捉所述一个或多个图像帧。3.根据权利要求2所述的方法,其特征在于,进一步包括:响应于接收到注册所述最初未注册人的所述口述命令而引导所述最初未注册人将其面部定位在所述一个或多个相机的视野内以捕捉用于面部识别的所述一个或多个图像帧。4.根据权利要求3所述的方法,其特征在于,引导所述最初未注册人包括经由音频扬声器输出听觉引导和/或经由图形显示设备输出视觉引导中的一者或多者。5.根据权利要求1所述的方法,其特征在于,进一步包括:响应于接收到注册所述最初未注册人的所述口述命令而引导所述最初未注册人说出一个或多个单词或短语;获得经由一个或多个话筒捕捉的包括由所述最初未注册人说出的所述一个或多个单词或短语的一个或多个音频片段;从所述一个或多个音频片段中提取所述最初未注册人的发言者识别数据;以及将所述发言者识别数据与所述新注册人的人员简档相关联。6.根据权利要求1所述的方法,其特征在于,在经由所述一个或多个相机捕捉到所述一个或多个图像帧之后接收注册所述最初未注册人的所述口述命令。7.根据权利要求6所述的方法,其特征在于,进一步包括:在接收注册所述最初未注册人的所述口述命令之前在数据存储系统中存储所述一个或多个图像帧;从所述数据存储系统中检索所述一个或多个图像帧;经由图形显示设备呈现所述一个或多个图像帧以供所述注册人审查;以及其中所述口述命令在呈现所述一个或多个图像帧期间或之后被接收。8.根据权利要求7所述的方法,其特征在于,在所述最初未注册人离开所述一个或多个相机的视野之后呈现所述一个或多个图像帧。9.根据权利要求7所述的方法,...

【专利技术属性】
技术研发人员:M·L·霍特曼
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1