生成事件输出制造技术

技术编号:35332981 阅读:21 留言:0更新日期:2022-10-26 11:51
提供了一种用于当用户请求将来在发生事件的情况下接收输出时确定订阅数据的系统。所述系统可基于输出装置的能力和触发类型来确定输出类型。所述系统可基于触发事件的优先级来确定触发类型。所述系统还可确定要执行多少次订阅。使用该信息,所述系统创建所述订阅,使得所述用户可在事件发生时接收到通知或通告。得所述用户可在事件发生时接收到通知或通告。得所述用户可在事件发生时接收到通知或通告。

【技术实现步骤摘要】
【国外来华专利技术】生成事件输出
[0001]相关申请数据的交叉引用
[0002]本申请要求2020年1月28日以Vinaya Nadig等人的名义提交的名称为“GENERATING EVENT OUTPUT”的美国专利申请号16/775,247的优先权权益。

技术介绍

[0003]语音辨识系统已经发展到人类可使用他们的话音来与计算装置交互的程度。这种系统采用技术以基于各种品质的接收到的音频输入来识别人类用户说出的词语。语音辨识处理结合自然语言理解处理实现对计算装置的基于语音的用户控制,以基于用户的口头命令来执行任务。语音辨识处理和自然语言理解处理技术的组合在本文中被称为语音处理。语音处理还可涉及将用户的语音转换成文本数据,该文本数据然后可被提供到各种基于文本的软件应用程序。
[0004]语音处理可由计算机、手持装置、电话计算机系统、自助服务终端以及广泛多种其他装置使用,以改善人机交互。
附图说明
[0005]为了更完全地理解本公开,现在结合附图来参考以下描述。
[0006]图1示出了根据本公开的实施方案的被配置为基于用户输入来创建订阅的系统。
[0007]图2是根据本公开的实施方案的系统的部件的概念图。
[0008]图3是示出根据本公开的实施方案的如何执行自然语言理解处理的概念图。
[0009]图4是根据本公开的实施方案的用于配置订阅的系统部件的概念图。
[0010]图5是根据本公开的实施方案的用于执行订阅的系统部件的概念图。
[0011]图6是示出根据本公开的实施方案可如何存储表示创建的订阅的订阅数据的概念图。
[0012]图7A是根据本公开的实施方案的文本转语音部件的概念图。
[0013]图7B是根据本公开的实施方案的语音模型的概念图。
[0014]图8是概念上示出根据本公开的实施方案的装置的示例部件的框图。
[0015]图9是概念上示出根据本公开的实施方案的系统的示例部件的框图。
[0016]图10示出了用于与语音处理系统一起使用的计算机网络的示例。
具体实施方式
[0017]自动语音辨识(ASR)是计算机科学、人工智能和语言学领域,其涉及将与语音相关联的音频数据转换为表示该语音的文本数据。类似地,自然语言理解是(NLU)是计算机科学、人工智能和语言学领域,其涉及使得计算机能够从包含自然语言的文本数据中得出含义。ASR和NLU通常一起用作语音处理系统的部分。文本转语音(TTS)是涉及将文本数据转换为音频数据的领域,该音频数据被合成为类似于人类语音。
[0018]当将来发生特定事件时,系统可接收请求系统执行特定动作的用户输入。因此,用
户可订阅服务,由此系统可检测事件并且可生成一些输出来向用户指示事件发生。输出的形式可由用户指定,但在某些情况下,系统可根据事件的类型、事件优先级、用户的当前活动和/或其他因素(诸如装置能力等)主动地确定输出的形式。例如,即使用户正在从事另一活动,系统也可确定某个事件调用来中断用户(诸如,正在装置上观看内容,使得系统中断内容回放以输出关于该事件的信息),而不同的事件可调用更潜在的通知,诸如,发送给用户的移动装置上的配套应用程序的消息,用户可能稍后会注意到该消息,而不是致使用户内容观看的中断。因此,系统可响应致使系统生成并存储订阅数据的此类用户请求而创建主动体验,以便稍后在事件发生时生成主动输出(诸如通知、提醒或其他输出,如下所说明)。例如,用户输入可以是“Alexa,当我接收到来自Joe的电子邮件时告诉我”,并且系统可创建并存储订阅数据,该订阅数据致使系统在接收到来自Joe的电子邮件的事件发生时生成输出(例如,通知)并将其发送给用户。另一个用户输入可以是“当海鹰队比赛时告诉我”,并且系统可创建并存储订阅,该订阅致使系统在事件(海鹰队比赛)发生时生成输出并将其发送给用户。存储的订阅还可指示输出类型、哪些装置接收到输出、输出的再发生类型以及用于将输出呈现给用户的其他数据。替代地或另外,系统可使用默认设置或机器学习方法来确定此类信息,以做出关于此类项目的动态确定。
[0019]本公开的改进系统基于诸如输出装置的能力的条件来确定订阅的输出类型,基于事件时间是可确定的还是未知的来确定订阅的触发类型,和/或确定诸如在输出时的用户活动的其他信息。系统还确定订阅的再发生信息以确定订阅要执行多少次。(尽管术语订阅在本文中用于描述用户注册通知,但此类订阅可针对一次性单个事件或针对再发生事件。)使用该信息,系统创建订阅并向用户提供订阅已创建的确认。确认可包括与订阅有关的信息。例如,如果系统确定订阅的输出类型是音频输出,则在确认订阅的创建时,系统可输出“当您接收到来自Joe的电子邮件时,我会通告”。当系统确定输出类型为推送通知时,系统可输出“当您接收到来自Joe的电子邮件时,我会通知您”。
[0020]当事件的时间是可确定的,诸如电视节目或运动赛事的开始,那么系统可确定触发类型为提醒,并且在确认订阅的创建时,系统可输出“当节目开始时(或在节目开始之前),我会提醒您。”当事件的时间不是可预先确定的,诸如接收到电子邮件或准备好处方,那么系统可确定触发类型为通知,并且在确认订阅的创建时,系统可输出“当处方准备好时,我会通知您。”[0021]系统还可确认订阅的再发生。例如,如果用户输入是“每次我接收到来自Joe的电子邮件时都告诉我”,那么系统可相应地创建订阅,并且可输出确认“每次您接收到来自Joe的电子邮件时,我都会告诉您”。系统可确定触发事件是可发生一次还是可再发生。如果事件仅发生一次(例如,2020年夏季奥运会开幕式),则系统创建执行一次的订阅。如果事件可再发生,那么系统可确定用户的意图是创建一次性订阅还是再发生订阅。
[0022]图1示出了根据本公开的实施方案的被配置为针对用户输入来创建订阅的系统。虽然本文中的附图和讨论按特定次序说明了系统的某些操作步骤,但在不脱离本公开的意图的情况下,所描述的步骤可按不同的次序执行(以及移除或添加某些步骤)。如图1所示,系统可包括用户5本地的装置110,该装置通过一个或多个网络199与一个或多个系统120通信。
[0023]系统120接收(132)用户输入以创建订阅。用户输入可以是表示由用户5说出并由
装置110捕获的话语的音频数据。系统120可对音频数据执行自动语音辨识(ASR)处理以确定对应于用户输入的文本数据。在一些实施方案中,用户输入可以是文本数据或另一种形式的数据。系统120可对文本数据/用户输入执行自然语言理解(NLU),以确定用户创建订阅以将来在发生事件的情况下接收输出的意图。例如,用户输入可以能是“当我接收到来自Joe的电子邮件时告诉我”、“当海鹰队比赛时告诉我”、“每次下雨时提醒我关窗”等。
[0024]系统120确定(134)对应于订阅的触发数据。触发数据表示致使生成输出数据的触发事件。系统120确定(136)对应于订阅的输出数据,其中输出数据表示当触发事件发生时要执行的动作。系统120可对表示用户输入的文本数据执行自然本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法,所述计算机实现的方法包括:接收表示自然语言的输入数据,所述输入数据与用户简档相关联;处理所述输入数据以确定意图数据,所述意图数据指示当事件发生时接收输出的请求;使用所述输入数据来确定表示所述事件的触发数据;确定对应于所述触发数据的优先级;以及将所述触发数据和所述优先级与所述用户简档相关联。2.如权利要求1所述的计算机实现的方法,所述计算机实现的方法还包括:确定对应于所述事件的类别;确定对应于所述事件的第一优先级数据;确定所述输入数据中表示的第二优先级数据;以及使用所述第一优先级数据和所述第二优先级数据来确定所述优先级。3.如权利要求1或2所述的计算机实现的方法,所述计算机实现的方法还包括:确定所述优先级为高;使用所述优先级来确定所述输出是通告;确定输出装置的输出能力包括输出合成语音的能力;生成表示当所述事件发生时将生成通告的确认的输出数据;使用文本转语音(TTS)处理来处理所述输出数据以确定输出音频数据;以及将所述输出音频数据发送到所述输出装置。4.如权利要求1、2或3所述的计算机实现的方法,所述计算机实现的方法还包括:确定所述优先级为高;确定第一输出装置不能输出合成语音;使用所述优先级来确定向所述第一输出装置和第二输出装置输出推送通知;生成表示当所述事件发生时将生成通知的确认的输出数据;以及将所述输出数据发送到所述第一输出装置。5.如权利要求1、2、3或4所述的计算机实现的方法,所述计算机实现的方法还包括:确定与所述触发数据相关联的触发类型,所述触发类型指示所述事件将发生的时间;将所述触发类型和所述时间与所述触发数据相关联;生成表示将生成所述事件发生的提醒的确认的输出数据;使用TTS处理来处理所述输出数据以确定输出音频数据;以及将所述输出音频数据发送到装置。6.如权利要求1、2、3、4或5所述的计算机实现的方法,所述计算机实现的方法还包括:确定所述优先级为低;使用所述优先级来确定所述输出是推送通知;生成表示当所述事件发生时将生成通知的确认的输出数据;以及将所述输出数据发送到装置。7.如权利要求1、2、3、4、5或6所述的计算机实现的方法,所述计算机实现的方法还包括:接收对应于所述输入数据的音频数据;
使用自动语音辨识(ASR)来处理所述音频数据以确定输入文本数据;使用自然语言理解(NLU)来处理所述输入文本数据以确定指示接收一次所述输出的意图的频率数据;将所述频率数据与所述触发数据相关联;以及在接收所述音频数据之后的时间段期间:接收事件数据,使用所述触发数据来确定所述事件数据相对于所述用户简档触发输出,使用所述优先级来确定输出数据,将所述输出数据发送到装置,以及基于所述频率数据来确定删除所述触发数据。8.如权利要求1、2、3、4、5、6或7所述的计算机实现的方法,所述计算机实现的方法还包括:接收对应于所述输入数据的音频数据;使用自动语音辨识(ASR)来处理所述音频数据以确定输入文本数据;使用自然语言理解(NLU)来处理所述输入文本数据以确定指示生成所述输出的次数的第一频率数据;将所述第一频率数据与所述触发数据相关联;以及在接收所述音频数据之后的时间段期间:接收事件数据,使用所述触发数据来确定所述事件数据相对于所述用户简档触发第一...

【专利技术属性】
技术研发人员:维纳亚
申请(专利权)人:亚马逊技术公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1