基于第三方代理内容的语音到文本转换制造技术

技术编号:21693657 阅读:71 留言:0更新日期:2019-07-24 16:55
实施方式涉及动态地并且以上下文敏感的方式偏置语音到文本转换。在一些实施方式中,语音到文本转换的偏置由本地代理的语音到文本引擎执行,并且偏置至少部分地基于由与本地代理网络通信的第三方(3P)代理提供给本地代理的内容。在这些实施方式中的一些实施方式中,内容包括由3P代理提供的上下文参数结合在以下的对话期间由3P代理生成的响应内容:3P代理与支持语音的电子设备的用户之间;并由本地代理协助。上下文参数指示待响应于由3P代理生成的响应内容而提供的另外的语音输入的潜在特征。本文所述的实施方式减少了各种计算资源的使用,否则这些计算资源可能被语音输入的不准确表示所消耗(例如,可能由校正语音输入的不准确表示所必需的附加“回合”所消耗的网络流量)。

Voice-to-text conversion based on third-party proxy content

【技术实现步骤摘要】
【国外来华专利技术】基于第三方代理内容的语音到文本转换
技术介绍
诸如智能电话、车辆计算系统、可穿戴设备、平板电脑和独立语音激活扬声器的支持语音的电子设备正变得越来越普遍。支持语音的电子设备通常包括“本地”代理和/或与之网络通信,该“本地”代理促进用户与设备的基于语音的交互的各个方面。本地代理可以经由支持语音的电子设备本身和/或经由与支持语音的电子设备网络通信的一个或多个远程计算设备(例如,“云”中的计算设备)来实现。本地代理在以下意义上是“本地的”:其直接接收经由支持语音的电子设备提供的语音输入(例如,人类语音的流媒体音频录音),至少初始地处理所接收的语音输入,并且提供响应于所接收的语音输入的输出以经由电子设备(例如,可听和/或图形的)呈现。例如,本地代理可以通过至少执行将语音输入转换为文本的语音到文本(也称为话音到文本)转换来初始地处理所接收的语音输入。还例如,本地代理可以进一步提供响应于该语音输入的输出。例如,本地代理本身可以生成响应内容,并且生成基于该响应内容的输出。
技术实现思路
本说明书通常涉及动态地并且以上下文敏感的方式偏置语音到文本转换的各种实施方式。语音到文本转换是对应的语音输入中的每一个,其基本文档来自技高网...

【技术保护点】
1.一种由一个或多个处理器实现的方法,包括:接收由用户经由支持语音的电子设备提供的语音输入;执行语音到文本转换,以将所述语音输入转换为文本;经由一个或多个网络接口,将所述文本传送到第三方代理;响应于传送所述文本,从所述第三方代理接收内容,所述接收是经由所述网络接口中的一个或多个,以及所述内容包括:响应于所述文本的响应内容;提供基于所述响应内容的输出,以经由所述支持语音的电子设备呈现给所述用户,所述输出响应于所述语音输入而提供;接收由所述用户经由所述支持语音的电子设备提供的并且由所述用户响应于所述输出提供的附加的语音输入;以及使用从所述第三方代理接收的所述内容执行附加的语音到文本转换,以将所述附...

【技术特征摘要】
【国外来华专利技术】2016.12.07 US 15/372,1881.一种由一个或多个处理器实现的方法,包括:接收由用户经由支持语音的电子设备提供的语音输入;执行语音到文本转换,以将所述语音输入转换为文本;经由一个或多个网络接口,将所述文本传送到第三方代理;响应于传送所述文本,从所述第三方代理接收内容,所述接收是经由所述网络接口中的一个或多个,以及所述内容包括:响应于所述文本的响应内容;提供基于所述响应内容的输出,以经由所述支持语音的电子设备呈现给所述用户,所述输出响应于所述语音输入而提供;接收由所述用户经由所述支持语音的电子设备提供的并且由所述用户响应于所述输出提供的附加的语音输入;以及使用从所述第三方代理接收的所述内容执行附加的语音到文本转换,以将所述附加的语音输入转换为附加的文本。2.如权利要求1所述的方法,其中,从所述第三方代理接收的所述内容进一步包括除所述响应内容之外的一个或多个上下文参数,所述一个或多个上下文参数指示待响应于所述响应内容而提供的另外的语音输入的一个或多个潜在特征,并且其中,使用所述内容执行所述附加的语音到文本转换包括:使用所述上下文参数执行所述附加的语音到文本转换。3.如权利要求2所述的方法,其中,在执行所述附加的语音到文本转换中使用语音到文本模型,并且其中,使用所述上下文参数执行所述附加的语音到文本转换包括:基于所述上下文参数,偏置在所述语音到文本模型上生成的值。4.如权利要求3所述的方法,其中,由所述上下文参数指示的所述一个或多个潜在特征包括特定令牌,并且其中,基于所述上下文参数,偏置在所述语音到文本模型上生成的所述值包括:修改对在所述语音到文本模型上的特定令牌生成的得分。5.如权利要求4所述的方法,其中,从所述第三方代理接收的所述上下文参数包括所述特定令牌。6.如权利要求4所述的方法,其中,从所述第三方代理接收的所述上下文参数包括语义类型的令牌,并且进一步包括:基于与所述语义类型相关联地存储的所述特定令牌来确定所述特定令牌。7.如权利要求6所述的方法,其中,确定所述特定令牌是基于与所述用户和所述语义类型两者均相关联地存储的所述特定令牌。8.如权利要求6所述的方法,其中,确定所述特定令牌是基于由所述第三方代理与所述语义类型相关联地先前提供的所述特定令牌。9.如权利要求2至8中任一项所述的方法,其中,由所述上下文参数指示的所述一个或多个潜在特征包括状态路径指示,所述状态路径指示表明语音到文本模型中的所述另外的语音输入的潜在路径。10.如权利要求2至9中任一项所述的方法,其中,使用所述上下文参数来执行所述附加的语音到文本转换包括:使用所述上下文参数和附加的用户参数两者,将所述附加的语音输入转换为所述附加的文本,所述附加的用户参数被分配给所述用户或所述设备并且与从所述第三方代理接收的所述内容无关地分配。11.如权利要求10所述的方法,其中,所述附加的用户参数基于下述中的至少一个:与所述用户相关联的位置以及与所述用户相关联的附加的电子设备。12.如权利要求2至11中任一项所述的方法,其中,所述响应内容和所述上下文参数作为从所述第三方代理...

【专利技术属性】
技术研发人员:巴纳比·詹姆斯王波苏尼尔·韦缪里大卫·谢勒乌拉什·基拉兹吉埃尔坦·多鲁尔坦彼塔尔·阿列克西克
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1