操作语音识别功能的电子设备和方法技术

技术编号:16113097 阅读:40 留言:0更新日期:2017-08-30 06:26
提供了一种电子设备,该电子设备包括:第一处理器,用于接收音频信号,对音频信号执行第一语音识别,并基于第一语音识别的结果向第二处理器传输驱动信号。第二处理器响应于驱动信号,基于通过第一语音识别的语音信号或所述音频信号来执行第二语音识别。

【技术实现步骤摘要】
【国外来华专利技术】操作语音识别功能的电子设备和方法
本公开总体上涉及语音识别的电子设备和方法,且更具体地,涉及改进的语音识别方法和利用该方法的电子设备。
技术介绍
由于硬件和通信技术的发展,电子设备用于广泛的领域,并提供用户需要的各种功能。通常,在包括语音输入设备(例如,麦克风)在内的各种电子设备中实现语音识别技术。利用语音识别技术的输入正在逐渐取代物理输入,并被推广为提供对电子设备的语音控制。
技术实现思路
[技术问题]在语音识别技术中,已经提出了一种方案,即无缝语音识别方案,以基于用户语音输入来激活电子设备并执行无缝语音命令。由于电子设备必须始终准备好记录用户的语音以用于语音识别,所以无缝语音识别方案在处于待机状态时必须持续地维持语音识别系统。需要将系统持续地维持在待机状态以执行无缝语音识别导致了以下问题。如果使用低功率芯片来实现语音识别系统以减少电流消耗,则由于有限的存储器和系统组件之间的性能差异,语音识别错误率增加。如果使用高性能芯片来改善语音识别错误率,则高性能芯片必须始终保持在活动状态,从而增加电流消耗损失。[问题的解决方案]根据本公开的一个方面,提供了一种电子设备,该电子设备包括:第一处理器,被配置为接收音频信号,对所述音频信号执行第一语音识别,以及基于所述第一语音识别的结果向第二处理器传输驱动信号;以及所述第二处理器,被配置为响应于所述驱动信号,基于所述第一语音识别的语音信号和所述音频信号中的至少一项来执行第二语音识别。根据本公开的另一方面,提供了一种由电子设备执行语音识别的方法,所述方法包括:接收音频信号;由第一处理器对所述音频信号执行第一语音识别;由所述第一处理器基于所述第一语音识别的结果向第二处理器传输驱动信号;以及由所述第二处理器响应于所述驱动信号,基于所述第一语音识别的语音信号和所述音频信号中的至少一项来执行第二语音识别。[专利技术的有益效果]做出本公开以处理上述问题和缺点,并至少提供下述优点。因此,本公开的一个方面提供操作语音识别功能的电子设备和方法,其使电子设备中的语音识别功能的错误最小化,增加识别率,并且降低电流消耗,同时提高语音识别性能的效率。附图说明根据结合附图给出的以下详细描述,将更清楚本公开的上述和其他方面、特征和优点,在附图中:图1是根据本公开实施例的电子设备的框图;图2是根据本公开实施例的电子设备的框图;图3是根据本公开实施例的电子设备的框图;图4是示出了根据本公开实施例的用于电子设备中的音频输入模块的语音识别的方法的流程图;图5是示出了根据本公开实施例的用于电子设备中的音频处理模块的语音识别的方法的流程图;图6是示出了根据本公开实施例的用于电子设备中的语音识别模块的语音识别的方法的流程图;图7是示出了根据本公开实施例的用于电子设备中的主处理器的语音识别的方法的流程图;图8是示出了根据本公开实施例的用于电子设备中的主处理器的语音识别的方法的流程图;图9是示出了根据本公开实施例的电子设备的组件之间的语音识别的流程图;图10是示出了根据本公开实施例的电子设备的组件之间的语音识别的流程图;图11是示出了根据本公开实施例的电子设备的组件之间的语音识别的流程图;图12a提供了根据本公开实施例的电子设备的语音识别操作屏幕的示例;图12b提供了根据本公开实施例的电子设备的语音识别操作屏幕的示例;图13a提供了根据本公开实施例的电子设备的语音识别操作屏幕的示例;以及图13b提供了根据本公开实施例的电子设备的语音识别操作屏幕的示例。具体实施方式下文中,参考附图详细地描述了本公开的实施例。在各种实施例中,“音频信号”包括通过声音信息从音频输入模块输入的信号,并且“语音信号”包括基于语音识别从音频信号中提取的语音信号。在各种实施例中,语音识别包括提取并仅识别要识别的字的关键字识别、识别说话人的语音作为执行命令的命令识别、以及识别注册特定说话人的语音的说话人识别中的至少一项。语音识别可以分开识别用于触发语音功能的语音触发(即触发语音)和输入的用于在识别出语音触发之后基于语音来执行功能的语音命令(即命令语音)。例如,关键字识别和命令识别可以是识别许多未指定语音的说话人无关识别方案,并且说话人识别可以是识别特定说话人语音的说话人相关识别方案。关键字识别可以通过分析语音序列以识别连续声音的模式来工作,并且确定在语音模式的连续声音中说出了与关键字相对应的字。如果存在先前存储的关键字,则针对关键字的识别可能会是成功的,而如果没有关键字,则识别可能会失败。说话人识别可以是确定关于注册说话人的语音信息和语音信号之间的相似度的说话人验证功能。当语音输入对应于注册说话人的语音输入时,说话人识别成功,而当语音输入不是注册说话人的语音信号时,说话人识别失败。对于说话人识别,电子设备可以接收注册说话人的语音,提取说话人的语音的特征,对特征进行建模,并存储特征以供以后比较。图1是根据本公开实施例的电子设备的框图。参考图1,根据各种实施例的电子设备101包括音频输入模块110、音频处理模块130、存储模块140、显示模块150和主处理器170。音频输入模块110接收声音信息作为音频信号。例如,音频输入模块110可以是麦克风(MIC)。音频输入模块110保持在开启状态,而不管主处理器170的睡眠模式或操作模式。音频输入模块110以每个预定时间间隔将音频信号存储在音频输入模块110的缓冲器111中。音频输入模块110所接收的声音信息可以包括噪声(例如,来自电子设备周围环境的声音)以及待输入的语音和特定声音。音频输入模块110可以实现为专用集成电路(ASIC)的形式以支持声音识别功能。例如,音频输入模块110可以确定由输入声音生成的音频信号是否是要求驱动语音识别系统的声音,并且当音频信号是要求驱动语音识别系统的声音时,唤醒音频处理模块130。例如,当音频信号的大小(例如,dB水平等)大于或等于预设阈值时,音频输入模块110将音频信号识别为要求驱动语音识别系统的声音。关于对声音是否要求驱动语音识别系统的确定的参考可以是音频信号的大小、频带等,并且可以根据设计者的意图来设置。音频输入模块110可以向音频处理模块130(或语音识别模块)传输驱动信号,例如唤醒信号、识别请求信号、中断信号等,并且向音频处理模块130的缓冲器131传输存储在缓冲器111中的音频信号。音频处理模块130可以连接到音频输入模块110以处理向/从音频输入模块110和主处理器170发送/接收的音频信号,并执行处理音频信号的功能。例如,音频处理模块130可以执行将模拟信号转换为数字信号或将数字信号转换为模拟信号的功能、音频输入/输出预处理/后处理功能、和语音识别功能。音频处理模块130可以包括数字信号处理器(DSP)。音频处理模块130可以独立于主处理器操作或依赖于主处理器操作,并且在睡眠模式或操作模式下操作。音频处理模块130可以根据处理音频信号(例如,再现声音、转换信号等)的功能来控制音频处理模块130的操作时钟。音频处理模块130处理音频信号并以预定时间间隔将音频信号存储在缓冲器131中。当在睡眠模式下从音频输入模块110传输驱动信号时,音频处理模块130可以将睡眠模式切换到操作模式。音频处理模块130可以响应于驱动信号而被激活以分析从音频输入模块110传输本文档来自技高网...
操作语音识别功能的电子设备和方法

【技术保护点】
一种电子设备,包括:第一处理器,被配置为:接收音频信号,对所述音频信号执行第一语音识别,以及基于所述第一语音识别的结果向第二处理器传输驱动信号;以及所述第二处理器,被配置为响应于所述驱动信号,基于所述第一语音识别的语音信号和所述音频信号中的至少一项来执行第二语音识别。

【技术特征摘要】
【国外来华专利技术】2015.02.16 KR 10-2015-00237021.一种电子设备,包括:第一处理器,被配置为:接收音频信号,对所述音频信号执行第一语音识别,以及基于所述第一语音识别的结果向第二处理器传输驱动信号;以及所述第二处理器,被配置为响应于所述驱动信号,基于所述第一语音识别的语音信号和所述音频信号中的至少一项来执行第二语音识别。2.根据权利要求1所述的电子设备,其中,所述第二处理器通过基于所述驱动信号从睡眠模式切换到操作模式来执行所述第二语音识别。3.根据权利要求1所述的电子设备,其中,所述第二处理器针对所述音频信号来识别用于触发语音识别功能的注册说话人的语音触发,以及针对音频信号输入来识别用于执行基于语音的功能的所述注册说话人的语音命令。4.根据权利要求1所述的电子设备,还包括:第三处理器,用于接收所述音频信号,执行第三语音识别,以及基于所述第三语音识别将所述第一处理器从睡眠模式切换到操作模式。5.根据权利要求1所述的电子设备,还包括:音频处理器,用于处理向/从所述第二处理器发送/接收的音频数据,其中,所述第一处理器被包括在用于接收所述音频信号的音频输入模块中。6.根据权利要求1所述的电子设备,其中,如果所述第一语音识别失败,则所述第一处理器从操作模式切换到睡眠模式,以及如果所述第二语音识别失败,则所述第二处理器从所述操作模式切换到所述睡眠模式。7.根据权利要求1所述的电子设备,还包括:收发器,被配置为与语音识别服务器进行通信,其中,如果所述第二语音识别成功,则所述收发器针对第三语音识别向所述语音识别服务器发送所述第二语音识别的语音信号或所述音频信号中的至少一项,以及从所述语音识别服务器接收与所述第三语音识别有关的结果信息。8.根据权利要求1所述的电子设备,还包括:显示器,其中,如果在所述显示器处于关闭状态时所述第二语音识别成功,则所述第二处理器打开所述显示器以显示功能执行屏幕,而如果所述第二语音识别失败,则所述显示器保持关闭状态,以及其中,在执行所述第二语音识别时,所述第二处理器控制所述显示器输出指示正在执行语音识别的屏幕,以及如果所述第二语音识别成功,则显示功能执行屏幕,而如果所述第二语音识别失败,则关闭...

【专利技术属性】
技术研发人员:李泰珍苏卜霍吉特·查卡拉达李相勋金炅泰金允娥金骏熙辛恩惠李在根林铉雄
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国,KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1