基于指派给自动化助理的给定角色动态地适配给定助理输出制造技术

技术编号:43377416 阅读:23 留言:0更新日期:2024-11-19 17:55
各实现方式涉及基于多个不同的角色当中指派给自动化助理的给定角色来动态地适配给定助理输出。在一些实现方式中,可以生成所述给定助理输出并且随后基于指派给所述自动化助理的所述给定角色对其进行适配。在其他实现方式中,可以生成特定于所述给定角色的所述给定助理输出,并且不必随后针对所述给定角色适配所述给定助理输出。值得注意的是,所述给定助理输出可以包括将合成以向用户可听呈现的文本内容流,以及用于控制客户端设备的显示和/或用于控制所述自动化助理的可视化表示的视觉提示流。各种实现方式利用大语言模型(LLM)或先前利用LLM生成的输出来反映所述给定助理输出中的所述给定角色。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、人类可以与在本文中称为“自动化助理”(也称为“聊天机器人”、“交互式个人助理”、“智能个人助理”、“个人语音助理”、“对话智能体”等)的交互式软件应用进行人机对话。自动化助理通常依赖组件流水线来解释和响应口头话语。例如,自动语音辨识(asr)引擎可以处理与用户的口头话语相对应的音频数据以生成asr输出,诸如口头话语的asr假设(即,词项和/或其他标记的序列)。此外,自然语言理解(nlu)引擎可以处理asr输出(或触摸/键入输入)以生成nlu输出,诸如用户在提供口头话语(或触摸/键入输入)时表达的请求(例如,意图)以及可选地与意图相关联的参数的槽值。最终,nlu输出可以由各种履行组件处理以生成履行输出,诸如响应于口头话语的响应内容和/或可以响应于口头话语而执行的一个或多个动作。

2、通常,这些自动化助理使用上述组件流水线来对口头话语进行响应。例如,这些自动化助理可以使用各种文本转语音(tts)技术使可听内容被提供用于向用户进行可听呈现,诸如对查询的响应、代表用户执行一个或多个动作的确认等。此外,这些自动化助理可以另外或替代地使视觉本文档来自技高网...

【技术保护点】

1.一种由一个或多个处理器实现的方法,所述方法包括:

2.如权利要求1所述的方法,还包括:

3.如权利要求2所述的方法,还包括:

4.如权利要求3所述的方法,其中所述一个或多个视觉提示时间戳至少包括开始视觉提示时间戳和停止视觉提示时间戳,所述开始视觉提示时间戳指示包括在所述视觉提示流中的给定视觉提示何时将开始被利用以控制所述客户端设备的所述显示和/或用于控制所述自动化助理的所述实例的所述可视化表示,所述停止视觉提示时间戳指示包括在所述视觉提示流中的所述给定视觉提示何时将停止被利用以控制所述客户端设备的所述显示和/或用于控制所述自动化助理的所述实例的所述...

【技术特征摘要】
【国外来华专利技术】

1.一种由一个或多个处理器实现的方法,所述方法包括:

2.如权利要求1所述的方法,还包括:

3.如权利要求2所述的方法,还包括:

4.如权利要求3所述的方法,其中所述一个或多个视觉提示时间戳至少包括开始视觉提示时间戳和停止视觉提示时间戳,所述开始视觉提示时间戳指示包括在所述视觉提示流中的给定视觉提示何时将开始被利用以控制所述客户端设备的所述显示和/或用于控制所述自动化助理的所述实例的所述可视化表示,所述停止视觉提示时间戳指示包括在所述视觉提示流中的所述给定视觉提示何时将停止被利用以控制所述客户端设备的所述显示和/或用于控制所述自动化助理的所述实例的所述可视化表示。

5.如任一前述权利要求所述的方法,其中基于处理所述音频数据流生成响应于所述口头话语的所述给定助理输出包括:

6.如权利要求5所述的方法,其中基于所述nlu输出流来确定响应于所述口头话语的所述给定助理输出包括:

7.如权利要求5所述的方法,其中基于所述nlu输出流来确定响应于所述口头话语的所述给定助理输出包括:

8.如权利要求5所述的方法,其中基于所述nlu输出流来确定响应于所述口头话语的所述给定助理输出包括:

9.根据任一前述权利要求所述的方法,其中基于指派给所述自动化助理的所述实例的所述给定助理角色来修改响应于所述口头输出的所述给定助理输出以生成所述修改后的给定助理输出包括:

10.如权利要求9所述的方法,其中特定于指派给所述自动化助理的所述实例的所述给定角色的所述角色数据包括特定于指派给所述自动化助理的所述实例的所述给定角色的给定角色词元和/或特定于指派给所述自动化助理的所述实例的所述给定角色的给定嵌入。

11.如权利要求9或权利要求10所述的方法,其中处理所述文本内容流和所述视觉提示流以及特定于指派给所述自动化助理的所述实例的所述给定角色的所述角色数据以生成与所述文本内容流不同的所述修改后的文本内容流和与所述视觉提示流不同的所述修改后的视觉提示流包括:

12.如权利要求9或权利要求10所述的方法,其中处理所述文本内容流和所述视觉提示流以及特定于指派给所述自动化助理的所述实例的所述给定角色的所述角色数据以生成与所述文本内容流不同的所述修改后的文本内容流和与所述视觉提示流不同的所述修改后的视觉提示流包括:

13.根据任一前述权利要求所述的方法,其中指派给所述 自动化助理的所述实例的所述给定角色与以下相关联:

14.如权利要求13所述的方法,其中与所述文本内容流不同的所述修改后的文本内容流是使用所述第一词汇修改的,并且其中与所述视觉提示流不同的用于响应于所述口头话语控制所述客户端设备的所述显示和/或用于控制所述自动化助理的所述实例的所述可视化表示的所述修改后的视觉提示流是使用所述第一视觉提示集合修改的。

15.如权利要求14所述的方法,还包括:

16.如权利要求13或权利要求14所述的方法,还包括:

17.根据权利要求16所述的方法,其中指派给所述自动化助理的所述附加实例的所述给定附加角色与以下相关联:

18.如任一项前述权利要求所述的方法,还包括:

19.如任一前述权利要求所述的方法,其中所述客户端设备的所述用户在初始配置所述自动化助理的所述实例的自动化助理帐户的同时或在与所述自动化助理的所述实例的自动化助理应用的助理设置交互的同时将所述给定角色指派给所述自动化助理的...

【专利技术属性】
技术研发人员:马丁·博伊姆尔特胡尚·阿马拉西里瓦德纳罗伯托·皮拉奇尼蒋禄卡·马提尼
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1