管理用户与机器人之间的会话制造技术

技术编号：35893778 阅读：16 留言：0更新日期：2022-12-10 10:26

示例性实施方式可以：从一个或多个输入模态接收包括关于物理环境的参数或测量值的一个或多个输入；基于分析从该一个或多个输入模态接收的输入来识别用户；通过分析用户的身体动作、视觉动作和/或音频动作来确定该用户是否表现出参与或有兴趣建立交流交互的迹象，该用户的身体动作、视觉动作和/或音频动作是至少部分地基于从一个或多个输入模态接收的一个或多个输入来确定的；以及通过使用显示设备创建该机器人计算设备的视觉动作或通过生成要由一个或多个扬声器再现的一个或多个音频文件来确定该用户是否对与该机器人计算设备的扩展交流交互感兴趣。的扩展交流交互感兴趣。的扩展交流交互感兴趣。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】管理用户与机器人之间的会话
相关申请的交叉引用
[0001]本申请要求于2020年2月29日提交的名称为“Systems And Methods To Manage Conversation Interactions Between A User And A Robot Computing Device Or Conversation Agent[管理用户与机器人计算设备或会话代理之间的会话交互的系统和方法]”的美国临时专利申请序列号62/983,590和于2021年2月25日提交的名称为“Systems And Methods To Manage Conversation Interactions Between A User And A Robot Computing Device Or Conversation Agent[管理用户与机器人计算设备或会话代理之间的会话交互的系统和方法]”的美国临时专利申请序列号63/153,888的优先权，这两个美国临时专利申请的内容均通过引用以其全文并入本文。

[0001]本披露涉及用于管理用户与机器人计算设备之间的交流交互的系统和方法。

技术介绍

[0002]成功的人与人之间的交流就像一场舞蹈，是对话者之间不断但协调的来回。人类对话者之间的话轮转换和切换发言权是无缝的，并且无需明确的信号即可工作，例如告诉对方发言或给出说话者让出发言权的手势信号。人类能够很自然地理解某人是否参与会话。所有这些技能也可以进一步扩展到多方交互。
[0003]相比之下，人机...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于管理用户与机器人计算设备之间的交流交互的方法，该方法包括：访问来自一个或多个存储器设备的计算机可读指令以供该机器人计算设备的一个或多个处理器执行；由该机器人计算设备的该一个或多个处理器执行从该一个或多个存储器设备访问的这些计算机可读指令；并且其中，执行这些计算机可读指令进一步包括：从一个或多个输入模态接收包括关于物理环境的参数或测量值的一个或多个输入；基于分析从该一个或多个输入模态接收的输入来识别用户；通过分析用户的身体动作、视觉动作和/或音频动作来确定该用户是否表现出参与或有兴趣建立交流交互的迹象，该用户的身体动作、视觉动作和/或音频动作是至少部分地基于从一个或多个输入模态接收的一个或多个输入来确定的；以及通过使用显示设备创建该机器人计算设备的视觉动作或通过生成要由该机器人计算设备的一个或多个扬声器再现的一个或多个音频文件来确定该用户是否对与该机器人计算设备的扩展交流交互感兴趣。2.如权利要求1所述的方法，其中，这些输入模态包括一个或多个传感器、一个或多个麦克风或一个或多个成像设备。3.如权利要求1所述的方法，其中，被分析的该用户的物理或视觉动作包括通过该成像设备和/或这些传感器设备捕获的该用户的面部表情、该用户的姿势和/或该用户的手势。4.如权利要求1所述的方法，其中，执行这些计算机可读指令进一步包括：通过检查该用户的语言上下文和该用户的话音音调变化以分析从该一个或多个麦克风接收的该用户的音频输入文件来确定该用户对该扩展交流交互的兴趣。5.如权利要求1所述的方法，其中，执行这些计算机可读指令进一步包括：通过分析由该成像设备和/或这些传感器设备捕获的该用户的面部表情、该用户的姿势和/或该用户的手势来确定是否在与该用户的扩展交流交互中发起话轮；以及通过将一个或多个音频文件传送给扬声器来在与该用户的扩展交流交互中发起该话轮。6.如权利要求1所述的方法，其中，执行这些计算机可读指令进一步包括：通过分析从该一个或多个麦克风接收的该用户的音频输入文件以检查该用户的语言上下文和/或该用户的话音音调变化来确定是否在与该用户的扩展交流交互中发起话轮；以及通过将一个或多个音频文件传送给扬声器来在与该用户的扩展交流交互中发起该话轮。7.如权利要求5或6所述的方法，其中，执行这些计算机可读指令进一步包括：通过分析由该成像设备和/或这些传感器设备捕获的该用户的面部表情、该用户的姿势和/或该用户的手势来确定何时结束与该用户的扩展交流交互中的话轮；以及通过停止向该扬声器传输音频文件来停止该扩展交流交互中的话轮。8.如权利要求5或6所述的方法，其中，执行这些计算机可读指令进一步包括：通过分析从该一个或多个麦克风接收的该用户的音频输入文件以检查该用户的语言上下文和该用户的话音音调变化来确定何时结束与该用户的扩展交流交互中的话轮；以及
通过停止向该扬声器传输音频文件来停止该扩展交流交互中的话轮。9.如权利要求5或6所述的方法，其中，执行这些计算机可读指令进一步包括：通过继续分析从该一个或多个输入模态接收的参数或测量值来确定该用户在该扩展交流交互中表现出会话脱离的迹象；以及为该机器人计算设备的输出模态生成动作或事件，以尝试与用户重新互动，以继续进行该扩展交流交互。10.如权利要求9所述的方法，其中，这些输出模态包括一个或多个显示器、一个或多个扬声器或用于使该机器人的身体的附肢或一部分移动的一个或多个马达。11.如权利要求10所述的方法，其中，这些动作或事件包括将一个或多个音频文件传输到该机器人计算设备的一个或多个扬声器以产生声音，从而尝试与该用户重新互动。12.如权利要求10所述的方法，其中，这些动作或事件包括将指令或命令传输到该机器人计算设备的显示器以创建用于该机器人计算设备的面部表情。13.如权利要求10所述的方法，其中，这些动作或事件包括将指...

【专利技术属性】
技术研发人员：斯蒂芬，
申请(专利权)人：具象有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人