Features are disclosed for processing and interpreting natural language (such as user utterance explanations) in a plurality of rounds of dialog interaction. Contextual information can be maintained, the contextual information relating to the interpretation of user utterances, and the system response to the user utterances. The contextual information can be used to interpret subsequent user utterances, rather than explaining subsequent user utterances without context. In some cases, a rule-based framework can combine the interpretation of subsequent user utterances with the interpretation of previous user utterances. Rules can be defined to determine which ones can be merged and which conditions can be merged.
【技术实现步骤摘要】
【国外来华专利技术】在自然语言处理中使用先前对话行为进行的语境解释背景语音处理系统包括用于从用户接收口头输入并且确定用户是什么意思的各种模块和部件。在一些实现方式中,语音处理系统包括接收用户话语音频输入并且生成一个或多个可能的话语录音的自动语音识别("ASR")模块。ASR模块通常使用声学模型和语言模型。声学模型用来生成假设,针对所述假设,词或子词单元(例如,音素)基于话语的声学特征来对应于话语。语言模型用来基于说出话语的语言的词汇特征来确定使用声学模型生成的哪个假设是最可能的话语录音。语音处理系统还可包括自然语言理解("NLU")模块,所述自然语言理解模块接收文本输入,诸如用户话语的录音,并且使用能以诸如计算机应用程序应用的方式来确定文本的含义。例如,NLU模块可用来使用统计语言模型来确定由ASR模块生成的文本的含义。NLU模块可以随后根据ASR输出来确定用户意图并且将所述意图提供到某个下游处理,所述某个下游处理响应于确定的用户意图来执行某项任务(例如,生成启动电话呼叫、启动所请求音乐的回放、提供所请求信息等命令)。一些语音处理系统配置成与用户进行多轮对话交互。例如,用户可能希望启动某个处理或任务,但是可能未提供全部的必需信息。在这种情况下,语音处理系统可以提示用户缺失的必需信息。作为另一个实例,用户可能希望从系统接收信息。语音处理系统可以提供所请求的信息并且允许用户基于所提供的信息启动后续的处理。附图简述现在将参考以下附图来描述各个专利技术特征的实施方案。在全部附图中,参考数字可被重复使用来指示所参考元件之间的对应关系。附图被提供来示出本文所述的示例性实施方案,并且并不意图 ...
【技术保护点】
一种系统,其包括:计算机可读存储器,其存储可执行指令;以及一个或多个处理器,其与所述计算机可读存储器通信,其中所述一个或多个处理器由所述可执行指令编程,以至少:获取与用户的第一话语有关的第一音频数据;至少部分地基于所述第一音频数据生成第一语音处理结果,所述第一语音处理结果包括所述第一话语的语义表达;至少部分地基于所述第一语音处理结果生成用于向所述用户呈现的第一响应;存储语境信息,所述语境信息包括所述第一话语的语义表达和所述第一响应的语义表达;获取与所述用户的第二话语有关的第二音频数据;使用所述第二音频数据、所述语境信息和语境解释规则生成第二语音处理结果,其中所述语境解释规则与用所述第二话语的语义表达的时隙值或意图中的至少一个替换所述第一话语的所述语义表达的时隙值或意图中的至少一个有关,并且其中所述语境规则至少部分地基于所述第一响应的所述语义表达;以及至少部分地基于所述第二语音处理结果生成用于向所述用户呈现的第二响应。
【技术特征摘要】
【国外来华专利技术】2014.05.20 US 14/283,0171.一种系统,其包括:计算机可读存储器,其存储可执行指令;以及一个或多个处理器,其与所述计算机可读存储器通信,其中所述一个或多个处理器由所述可执行指令编程,以至少:获取与用户的第一话语有关的第一音频数据;至少部分地基于所述第一音频数据生成第一语音处理结果,所述第一语音处理结果包括所述第一话语的语义表达;至少部分地基于所述第一语音处理结果生成用于向所述用户呈现的第一响应;存储语境信息,所述语境信息包括所述第一话语的语义表达和所述第一响应的语义表达;获取与所述用户的第二话语有关的第二音频数据;使用所述第二音频数据、所述语境信息和语境解释规则生成第二语音处理结果,其中所述语境解释规则与用所述第二话语的语义表达的时隙值或意图中的至少一个替换所述第一话语的所述语义表达的时隙值或意图中的至少一个有关,并且其中所述语境规则至少部分地基于所述第一响应的所述语义表达;以及至少部分地基于所述第二语音处理结果生成用于向所述用户呈现的第二响应。2.如权利要求1所述的系统,其中所述第一话语的所述语义表达包括意图和与所述意图相关联的一个或多个时隙。3.如权利要求1所述的系统,其中所述一个或多个处理器还被编程以在存储与所述第一话语相关联的所述语境信息之后并且在生成针对所述第二用户话语的所述第二语音处理结果之前生成针对中间用户话语的中间语音处理结果。4.一种计算机实现的方法,其包括:在配置有具体计算机可执行指令的一个或多个计算装置的控制下,存储与所述第一自然语言输入和对所述第一自然语言输入的第一响应相关联的语境信息,其中所述语境信息包括所述第一自然语言输入的语义表达和对所述自然语言输入的所述第一响应的语义表达;至少部分地基于所述语境信息生成针对第二自然语言输入的自然语言处理结果,其中所述自然语言处理结果包括与所述第一自然语言输入的所述语义表达合并的所述第二自然语言输入的语义表达的至少一部分;以及至少部分地基于所述自然语言处理结果生成对...
【专利技术属性】
技术研发人员:朱塞佩·迪法布里奇奥,希希尔·斯里德哈·巴拉蒂,Y·史,兰伯特·马赛厄斯,
申请(专利权)人:亚马逊技术有限公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。