基于话音的通信制造技术

技术编号：21176936 阅读：65 留言：0更新日期：2019-05-22 12:15

描述了用于通过言语控制设备升级基于话音的交互的系统、方法和设备。言语控制设备捕获包括唤醒词部分和有效载荷部分的音频，用于发送到服务器以在言语控制设备之间中继消息。响应于确定升级事件例如相同两个设备之间的重复消息的发生，所述系统可以自动改变言语控制设备的模式，例如不再需要唤醒词，不再需要指出期望的接收者，或者以话音聊天模式自动连接两个言语控制设备。响应于确定进一步升级事件的发生，所述系统可以启动所述言语控制设备之间的实时呼叫。

Voice-based communication

Systems, methods and devices for upgrading voice-based interaction through speech control devices are described. The speech control device captures audio including the wake-up word portion and payload portion for sending to the server to relay messages between the speech control devices. In response to determining the occurrence of escalation events such as duplicate messages between the same two devices, the system can automatically change the mode of speech control devices, such as no wake-up words, no longer needing to point out the desired receiver, or automatically connect the two speech control devices in voice chat mode. In response to determining the occurrence of further escalation events, the system can initiate real-time calls between the speech control devices.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】基于话音的通信相关申请数据的交叉引用本申请要求于2016年9月1日以ChristoFrankDevaraj等人的名义提交的标题为“Voice-BasedCommunications”的美国专利申请No.15/254,359的优先权。本申请要求于2016年9月1日以ChristoFrankDevaraj等人的名义提交的标题为“IndicatorforVoice-BasedCommunications”的美国专利申请No.15/254,458的优先权。本申请要求于2016年9月1日以ChristoFrankDevaraj等人的名义提交的标题为“IndicatorforVoice-BasedCommunications”的美国专利申请No.15/254,600的优先权。上述申请通过引用整体并入本文。
技术介绍
言语辨识系统已经发展到人类可以依靠言语与计算设备进行交互的程度。这样的系统基于接收到的音频输入的各种质量，使用多种技术来识别由人类用户说出的单词。言语辨识结合自然语言理解处理技术，实现对计算设备的基于言语的用户控制，以基于用户的口头命令来执行任务。言语辨识和自然语言理解...

【技术保护点】
1.一种计算机实现的方法，其包括：从第一设备接收输入音频数据，所述输入音频数据包括唤醒词部分和命令部分；基于所述输入音频数据来确定文本数据；基于所述文本数据，向第二设备发送第一消息；确定来自所述第二设备的打算发往所述第一设备的第二消息；确定从所述第一设备发送到所述第二设备的第一数量的消息和从所述第二设备发送到所述第一设备的第二数量的消息所经过的时间量；确定所述时间量小于第一阈值时间段；以及将数据发送到所述第一设备，所述数据使所述第一设备发送音频数据，而无需所述第一设备检测唤醒词。

【技术特征摘要】
【国外来华专利技术】2016.09.01 US 15/254,359;2016.09.01 US 15/254,458;1.一种计算机实现的方法，其包括：从第一设备接收输入音频数据，所述输入音频数据包括唤醒词部分和命令部分；基于所述输入音频数据来确定文本数据；基于所述文本数据，向第二设备发送第一消息；确定来自所述第二设备的打算发往所述第一设备的第二消息；确定从所述第一设备发送到所述第二设备的第一数量的消息和从所述第二设备发送到所述第一设备的第二数量的消息所经过的时间量；确定所述时间量小于第一阈值时间段；以及将数据发送到所述第一设备，所述数据使所述第一设备发送音频数据，而无需所述第一设备检测唤醒词。2.如权利要求1所述的计算机实现的方法，其包括：从所述第一设备接收第二输入音频数据；处理所述第二输入音频数据以确定消息内容；向所述第二设备并且在第一时间，发送对应于所述消息内容的输出音频数据；从所述第二设备并且在所述第一时间之后的第二时间，接收所述第二设备已检测到对所述输出音频数据的回复中的言语的指示；以及在所述第二时间之后的第三时间，由所述第一设备输出视觉指示符，所述视觉指示符表示所述第二设备正在接收对所述消息内容的回复。3.如权利要求1或2所述的计算机实现的方法，其中所述指令还将至少一个处理器配置为：使所述第二设备输出由文本到言语(TTS)处理创建的音频数据；从所述第二设备接收第三输入音频数据；对所述第三输入音频数据执行ASR以确定第二文本数据；以及确定所述第二文本数据包括单词是，其中确定所述言语是对所述输出音频数据的回复是基于所述确定所述第二文本数据包括所述单词是。4.如权利要求1或2所述的计算机实现的方法，其还包括：在所述第二时间之后的所述第三时间，由所述第一设备输出可听指示符，所述可听指示符表示所述第二设备已检测到对所述输出音频数据的回复中的言语。5.如权利要求4所述的计算机实现的方法，其中使用文本到言语处理来生成所述可听指示符，所述文本到言语处理使用用户先前说出的言语。6.如权利要求1或2所述的计算机实现的方法，其还包括：使所述第二设备输出由文本到言语(TTS)处理创建的音频数据；从所述第二设备接收第四输入音频数据；使用基于话音的说话者ID来确定所述第四输入音频数据对应于由所述消息内容的接收者说出的音频；以及基于所述第四输入音频数据对应于所述消息内容的所述接收者所说出的音频，确定...

【专利技术属性】
技术研发人员：克里斯托·弗兰克·德瓦拉杰，曼尼什·库马·达米亚，托尼·罗伊·哈迪，尼克·丘博塔留，桑德拉·莱蒙，
申请(专利权)人：亚马逊技术公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人