具有音频呈现交互的自动化助理制造技术

技术编号:36329285 阅读:75 留言:0更新日期:2023-01-14 17:38
用户交互可以由自动化助理的音频呈现来支持,并且尤其是利用在音频呈现内的特定点处呈现的这种音频呈现的口头内容。可以执行对音频呈现的分析,以识别由音频呈现提出、提及或以其他方式与音频呈现相关联的一个或多个实体,并且可以执行话语分类,以确定在对音频呈现的回放期间接收的话语是否针对音频呈现,并且在一些实例中,针对音频呈现中的特定实体和/或回放点,从而使得能够对话语生成适当的响应。响应。响应。

【技术实现步骤摘要】
【国外来华专利技术】具有音频呈现交互的自动化助理

技术介绍

[0001]人类可以参与与交互式软件应用的人机对话,该交互式软件应用在此被称为“自动化助理”(也称为“聊天机器人”、“交互式个人助理”、“智能个人助理”、“个人语音助理”、“会话代理”等)。例如,人类(当他们与自动化助理交互时,可以被称为“用户”)可以使用口头自然语言输入(即,话语)——在一些情况下,口头自然语言输入可以被转换成文本并且然后被处理——和/或通过提供文本(例如,键入的)自然语言输入向自动化助理提供命令和/或请求。自动化助理通常通过提供响应用户界面输出来响应命令或请求,该响应用户界面输出可以包括听觉和/或视觉用户界面输出。
[0002]自动化助理使用户能够获取信息、访问服务和/或执行各种任务。例如,用户能够执行搜索、获取方向,并且在一些情况下,能够与第三方计算服务进行交互。用户还可能能够执行各种操作,诸如从拼车应用叫车、订购商品或服务(例如,披萨)、控制智能设备(例如,灯开关)、预订等。
[0003]自动化助理可以使用语音识别和自然语言处理与用户交谈,一些自动化助理还利用机器学习和其他人工智能技术例如来本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法,包括:分析与音频呈现相关联的口头音频内容,以识别所述音频呈现中提出的一个或多个实体;在所述音频呈现的回放期间接收用户查询;以及确定所述用户查询是否针对所述音频呈现,并且如果所述用户查询被确定为针对所述音频呈现,则生成对所述用户查询的响应,其中确定所述用户查询是否针对所述音频呈现或生成对所述用户查询的响应使用所识别的一个或多个实体。2.根据权利要求1所述的方法,其中,分析与所述音频呈现相关联的所述口头音频内容包括:对所述口头音频内容执行语音识别处理,以生成转录文本;以及对所述转录文本执行自然语言处理以识别所述一个或多个实体。3.根据权利要求2所述的方法,其中,执行所述语音识别处理、执行所述自然语言处理和接收所述用户查询是在助理设备对所述音频呈现的回放期间在所述助理设备上执行的。4.根据权利要求2或权利要求3所述的方法,其中,接收所述用户查询是在所述助理设备对所述音频呈现的回放期间在所述助理设备上执行的,并且其中,执行所述语音识别处理和执行所述自然语言处理中的至少一个是在所述音频呈现的回放之前执行的。5.根据权利要求2至4中的任一项所述的方法,其中,执行所述语音识别处理和执行所述自然语言处理中的至少一个是由远程服务执行的。6.根据前述权利要求中的任一项所述的方法,进一步包括基于所述音频呈现中的特定点,使用所识别的一个或多个实体来确定一个或多个建议。7.根据权利要求6所述的方法,进一步包括在助理设备对所述音频呈现中的所述特定点的回放期间,在所述助理设备上呈现所述一个或多个建议。8.根据前述权利要求中的任一项所述的方法,进一步包括在接收所述用户查询之前,使用所识别的一个或多个实体来预处理对一个或多个潜在用户查询的响应。9.根据权利要求8所述的方法,其中,生成对所述用户查询的所述响应包括使用一个或多个预处理的响应中的一个预处理的响应来生成对所述用户查询的所述响应。10.根据前述权利要求中的任一项所述的方法,其中,确定所述用户查询是否针对所述音频呈现包括将来自所述音频呈现和所述用户查询的转录文本提供给基于神经网络的分类器,所述分类器被训练为输出给定用户查询是否可能针对给定音频呈现的指示。11.根据前述权利要求中的任一项所述的方法,进一步包括在接收所述用户查询之前缓冲来自所述音频呈现的音频数据,其中分析与所述音频呈现相关联的所述口头音频内容包括在接收所述用户查询之后分析来自所缓冲的音频数据的口头音频内容,以识别所述所缓冲的音频数据中提出的一个或多个实体,并且其中确定所述用户查询是否针对所述音频呈现或生成对所述用户查询的所述响应使用所缓冲的音频数据中提出的所识别的一个或多个实体。12.根据前述权利要求中的任一项所述的方法,其中,所述音频呈现是播客。13.根据前述权利要求中的任一项所述的方法,其中,确定所述用户查询是否针对所述音频呈现包括使用所识别的一个或多个实体来确定所述用户查询是否针对所述音频呈现。14.根据前述权利要求中的任一项所述的方法,其中,生成对所述用户查询的所述响应
包括使用所识别的一个或多个实体生成对所述用户查询的所述响应。15.根据前述权利要求中的任一项所述的方法,其中,确定所述用户查询是否针对所述音频呈现包括确定所述用户查询是否针对所述音频呈现中的特定点。16.根据前述权利要求中的任一项所述的...

【专利技术属性】
技术研发人员:维克托
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1