使用多个识别器减少延时的语音识别系统技术方案

技术编号：17960655 阅读：87 留言：0更新日期：2018-05-16 05:48

公开了一种用于在包括电子设备和远离电子设备定位的网络设备的客户端/服务器语音识别系统中的电子设备上提供视觉反馈的方法和设备。该方法包括由电子设备的嵌入式语音识别器处理包括语音的输入音频的至少一部分以产生本地识别语音，向网络设备发送输入音频的至少一部分以进行远程语音识别；以及在从网络设备接收流传输识别结果之前基于本地识别语音的至少一部分在电子设备的用户界面上显示视觉反馈。

Speech recognition system using multiple recognizers to reduce delay

A method and device for providing visual feedback on an electronic device in a client / server voice recognition system, including electronic devices and network devices located far away from electronic equipment, is disclosed. The method includes processing at least part of the input audio of the voice by the embedded speech recognizer of the electronic device to produce local recognition speech, sending at least part of the input audio to the network device for remote speech recognition, and based on the local recognition before receiving the transmission recognition results from the network device. At least part of the voice shows visual feedback on the user interface of the electronic device.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用多个识别器减少延时的语音识别系统
技术介绍
诸如智能电话、平板电脑和电视之类的一些电子设备包括语音识别能力或被配置为利用该语音识别能力，其使用户能够经由语音输入来访问设备的功能。包括由电子设备接收的语音的输入音频由自动语音识别(ASR)系统处理，该ASR系统将输入音频转换为识别文本。识别文本可以由例如自然语言理解(NLU)引擎来解释，以执行控制设备的一些方面的一个或多个动作。例如，NLU结果可以被提供给在设备上执行的虚拟代理或虚拟助手应用，以帮助用户执行诸如在网络(例如，互联网)上搜索内容和通过解释NLU结果与其它应用接口之类的功能。语音输入也可以用于与设备上的其它应用(诸如基于口述和文本的消息应用)接口。当使用电子设备时，将语音控制作为单独的输入接口添加给用户提供了更灵活的通信选项，并减少了对诸如迷你键盘和触摸屏之类的、在特定情况下使用可能更麻烦的其它输入设备的依赖。
技术实现思路
一些实施例针对一种用在客户端/服务器语音识别系统中的电子设备，所述客户端/服务器语音识别系统包括电子设备和远离电子设备定位的网络设备。所述电子设备包括输入接口，被配置为接收包括语音的输入音频；嵌入式语音识别器，被配置为处理输入音频的至少一部分以产生本地识别语音；网络接口，被配置为向网络设备发送输入音频的至少一部分以进行远程语音识别；以及用户界面，被配置为在从网络设备接收流传输识别结果之前，基于本地识别语音的至少一部分显示视觉反馈。其它实施例针对一种在客户端/服务器语音识别系统中的电子设备上提供视觉反馈的方法，所述客户端/服务器语音识别系统包括电子设备和远离电子设备定位的网络设备。所...
使用多个识别器减少延时的语音识别系统

【技术保护点】
一种用在客户端/服务器语音识别系统中的电子设备，所述客户端/服务器语音识别系统包括电子设备和远离电子设备定位的网络设备，所述电子设备包括：输入接口，被配置为接收包括语音的输入音频；嵌入式语音识别器，被配置为处理输入音频的至少一部分以产生本地识别语音；网络接口，被配置为向网络设备发送输入音频的至少一部分以进行远程语音识别；以及用户界面，被配置为在从网络设备接收流传输识别结果之前，基于本地识别语音的至少一部分显示视觉反馈。

【技术特征摘要】
【国外来华专利技术】1.一种用在客户端/服务器语音识别系统中的电子设备，所述客户端/服务器语音识别系统包括电子设备和远离电子设备定位的网络设备，所述电子设备包括：输入接口，被配置为接收包括语音的输入音频；嵌入式语音识别器，被配置为处理输入音频的至少一部分以产生本地识别语音；网络接口，被配置为向网络设备发送输入音频的至少一部分以进行远程语音识别；以及用户界面，被配置为在从网络设备接收流传输识别结果之前，基于本地识别语音的至少一部分显示视觉反馈。2.如权利要求1所述的电子设备，其中网络接口还被配置为从网络设备接收流传输识别结果，并且其中电子设备还包括：至少一个处理器，被编程为响应于从网络设备接收到流传输识别结果而更新在用户界面上显示的视觉反馈。3.如权利要求2所述的电子设备，其中更新在用户界面上显示的视觉反馈包括：确定从网络设备接收的流传输识别结果是否落后于本地识别语音；以及当确定从网络设备接收的流传输识别结果落后于本地识别语音时，继续基于本地识别语音的至少一部分显示视觉反馈。4.如权利要求2所述的电子设备，其中更新在用户界面上显示的视觉反馈包括：基于从网络设备接收的流传输识别结果更新视觉反馈以显示视觉反馈。5.如权利要求4所述的电子设备，其中嵌入式语音识别器还被配置为响应于从网络设备接收到流传输识别结果而停止处理输入音频。6.如权利要求2所述的电子设备，其中更新在用户界面上显示的视觉反馈包括：确定从网络设备接收的流传输识别结果是否匹配本地识别语音的至少一部分；以及当确定从网络设备接收的流传输识别结果与本地识别语音的至少一部分不匹配时，基于从网络设备接收的流传输识别结果来更新视觉反馈以显示视觉反馈。7.如权利要求6所述的电子设备，其中基于从网络设备接收的流传输识别结果来更新视觉反馈以显示视觉反馈包括：用包括在从网络设备接收的流传输识别结果中的至少一个第二词替换基于本地识别语音被显示为视觉反馈的至少一个第一词。8.一种在客户端/服务器语音识别系统中的电子设备上提供视觉反馈的方法，所述客户端/服务器语音识别系统包括电子设备和远离电子设备定位的网络设备，所述方法包括：由电子设备的嵌入式语音识别器处理包括语音的输入音频的至少一部分以产生本地识别语音；向网络设备发送输入音频的至少一部分以进行远程语音识别；以及在从网络设备接收流传输识别结果之前，基于本地识别语音的至少一部分在电子设备的用户界面上显示视觉反馈。9.如权利要求8所述的方法，还包括：从网络设备接收流传输识别结果；以及响应于从网络设备接收到流传输识别结果而更新在用户界面上显示的视觉反馈。10.如权利要求9所述的方法，其中更新在用户界面上显示的视觉反馈包括：确定从网络设备接收的流传输识别结果是否落后于本地识别语音；以及当确定从网络设备接收的流传输识...

【专利技术属性】
技术研发人员：D·维利特，C·格兰，C·B·奎林，S·哈恩，F·斯蒂莫，
申请(专利权)人：纽昂斯通讯公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人