智能语音系统及其语音唤醒方法及智能语音设备技术方案

技术编号:20428543 阅读:108 留言:0更新日期:2019-02-23 09:42
本发明专利技术公开了一种基于智能语音系统的语音唤醒方法,智能语音系统包括智能语音设备以及云端服务器;该方法包括:智能语音设备采集外部语音,得到音频数据;智能语音设备将音频数据发送至云端服务器进行语音识别;智能语音设备接收云端服务器返回的识别结果,若结果为识别成功,则控制唤醒自身的智能语音服务。本发明专利技术通过将语音唤醒算法转移至云端进行,来降低本地服务器的性能需求,从而降低了具有语音唤醒功能的智能语音设备的成本。本发明专利技术还公开了一种基于上述方法的智能语音设备、云端服务器及智能语音系统。

【技术实现步骤摘要】
智能语音系统及其语音唤醒方法及智能语音设备
本专利技术涉及语音识别
,特别是涉及一种基于智能语音系统的语音唤醒方法。本专利技术还涉及一种智能语音设备、云端服务器及智能语音系统。
技术介绍
语音机器人是能够通过用户的语音指令进行控制的机器人,语音机器人在进行使用时,需要首先唤醒系统内部的语音服务,唤醒后才能够正常的进行语音控制。现有的语音机器人可以分为以下两种:1、智能语音机器人,使用Linux或者Android系统,具备语音唤醒功能,比如天猫精灵,但是由于语音唤醒算法需要语音机器人的处理器具备较大的运算能力和RAM资源,而高性能的处理器成本也高,因此目前能够进行语音唤醒的语音机器人均需要设置有高成本的处理器。2、低成本的语音机器人,使用MCU系统,具备很低的硬件成本,但是由于低成本的处理器的运算能力较低,因此不具备语音唤醒功能。因此,如何实现低成本的智能语音唤醒服务是本领域技术人员目前需要解决的问题。
技术实现思路
本专利技术的目的是提供一种基于智能语音系统的语音唤醒方法,通过将语音唤醒算法转移至云端进行,来降低本地服务器的性能需求,从而降低具有语音唤醒功能的智能语音设备的成本;本专利技术的另一目的是提供一种基于上述方法的智能语音设备、云端服务器及智能语音系统。为解决上述技术问题,本专利技术提供了一种基于智能语音系统的语音唤醒方法,用于智能语音设备,所述智能语音系统包括所述智能语音设备以及云端服务器;所述方法包括:采集外部语音,得到音频数据;将所述音频数据发送至云端服务器进行语音识别;接收所述云端服务器返回的识别结果,若结果为识别成功,则控制唤醒自身的智能语音服务。优选的,所述采集外部音频数据之前,还包括:检测外部语音的音量是否大于预设音量阈值,若是,则采集所述外部语音,得到所述音频数据。为解决上述技术问题,本专利技术还提供了一种基于智能语音系统的语音唤醒方法,用于云端服务器,所述智能语音系统包括智能语音设备以及所述云端服务器;所述方法包括:接收所述智能语音设备采集的音频数据;对所述音频数据进行语音识别,得到识别结果;返回所述识别结果至所述智能语音设备,供所述智能语音设备在识别成功时控制唤醒自身的智能语音服务。优选的,所述对所述音频数据进行语音识别的过程具体包括:将所述音频数据进行语音-文字转换,得到转换后的文字数据;将所述文字数据转换为拼音数据;将所述拼音数据与预设唤醒拼音进行模糊匹配,并将匹配结果作为语音识别结果。优选的,所述模糊匹配的过程包括:判断所述拼音数据与所述预设唤醒拼音的相似度是否达到预设相似阈值,若达到,则匹配结果为成功,若未达到,则匹配结果为失败。为解决上述技术问题,本专利技术还提供了一种智能语音设备,包括:音频采集模块,用于采集外部语音,得到音频数据;云端通信模块,用于将所述音频数据发送至云端服务器进行语音识别;接收所述云端服务器返回的识别结果;唤醒模块,用于判断识别结果是否为失败成功,若是,则控制唤醒智能语音设备的智能语音服务。优选的,还包括:音量检测模块,用于检测外部语音的音量是否大于预设音量阈值,若是,则触发所述音频采集模块。为解决上述技术问题,本专利技术还提供了一种云端服务器,包括:音频接收模块,用于接收智能语音设备采集的音频数据;语音识别模块,用于对所述音频数据进行语音识别,得到识别结果;结果返回模块,用于返回所述识别结果至所述智能语音设备,供所述智能语音设备在识别成功时控制唤醒自身的智能语音服务。优选的,所述语音识别模块具体包括:文本转换单元,用于将所述音频数据进行语音-文字转换,得到转换后的文字数据;拼音转换单元,用于将所述文字数据转换为拼音数据;模糊匹配单元,用于将所述拼音数据与预设唤醒拼音进行模糊匹配,并将匹配结果作为语音识别结果。为解决上述技术问题,本专利技术还提供了一种智能语音系统,包括智能语音设备以及云端服务器;所述智能语音设备包括:第一存储器,用于存储计算机程序;第一处理器,用于执行所述第一存储器存储的计算机程序时实现如以上任一项所述的用于智能语音设备的语音唤醒方法的步骤;所述云端服务器包括:第二存储器,用于存储计算机程序;第二处理器,用于执行所述第二存储器存储的计算机程序时实现如以上任一项所述的用于云端服务器的语音唤醒方法的步骤。本专利技术提供了一种基于智能语音系统的语音唤醒方法,该方法中智能语音设备采集到外部的音频数据后,并未在本地进行处理,而是将音频数据发送至云端服务器进行语音识别,之后接收云端服务器返回的识别结果,依据语音识别结果是否成功来判断是否唤醒自身的智能语音服务。可以理解的是,由于智能语音唤醒算法即语音唤醒过程中的语音识别算法需要处理器具备较高的性能,因此本专利技术将这部分运算发送至云端服务器进行处理,故本地的智能语音设备内不需要承担这部分运算,从而使得即使智能语音设备内的处理器性能较低,也能够实现语音唤醒的目的。由此可见,本专利技术通过将语音唤醒算法转移至云端进行,降低了本地服务器的性能需求,使得智能语音设备可使用性能较低的处理器实现语音唤醒的目的,从而降低了具有语音唤醒功能的智能语音设备的成本。本专利技术还提供了一种基于上述方法的智能语音设备、云端服务器及智能语音系统,在此不再赘述。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术提供的一种基于智能语音系统的语音唤醒方法在智能语音设备一侧的过程的流程图;图2为本专利技术提供的另一种基于智能语音系统的语音唤醒方法在智能语音设备一侧的过程的流程图;图3为本专利技术提供的一种基于智能语音系统的语音唤醒方法在云端服务器一侧的过程的流程图;图4为本专利技术提供的另一种基于智能语音系统的语音唤醒方法在云端服务器一侧的过程的流程图;图5为本专利技术提供的一种基于智能语音系统的语音唤醒方法的过程的流程图;图6为本专利技术提供的一种智能语音设备的结构示意图;图7为本专利技术提供的一种云端服务器的结构示意图;图8为本专利技术提供的一种智能语音系统的结构示意图。具体实施方式本专利技术的核心是提供一种基于智能语音系统的语音唤醒方法,通过将语音唤醒算法转移至云端进行,来降低本地服务器的性能需求,从而降低具有语音唤醒功能的智能语音设备的成本;本专利技术的另一核心是提供一种基于上述方法的智能语音设备、云端服务器及智能语音系统。为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术提供了一种基于智能语音系统的语音唤醒方法,用于智能语音设备,智能语音系统包括智能语音设备以及云端服务器。参见图1所示,图1为本专利技术提供的一种基于智能语音系统的语音唤醒方法在智能语音设备一侧的过程的流程图。该方法包括:步骤s11:采集外部语音,得到音频数据;语音唤醒,显然需要首先接收用户说出的语音指令,用户一般需要靠近麦克风说出指定的唤醒词,之后由智能语本文档来自技高网...

【技术保护点】
1.一种基于智能语音系统的语音唤醒方法,其特征在于,用于智能语音设备,所述智能语音系统包括所述智能语音设备以及云端服务器;所述方法包括:采集外部语音,得到音频数据;将所述音频数据发送至云端服务器进行语音识别;接收所述云端服务器返回的识别结果,若结果为识别成功,则控制唤醒自身的智能语音服务。

【技术特征摘要】
1.一种基于智能语音系统的语音唤醒方法,其特征在于,用于智能语音设备,所述智能语音系统包括所述智能语音设备以及云端服务器;所述方法包括:采集外部语音,得到音频数据;将所述音频数据发送至云端服务器进行语音识别;接收所述云端服务器返回的识别结果,若结果为识别成功,则控制唤醒自身的智能语音服务。2.根据权利要求1所述的语音唤醒方法,其特征在于,所述采集外部音频数据之前,还包括:检测外部语音的音量是否大于预设音量阈值,若是,则采集所述外部语音,得到所述音频数据。3.一种基于智能语音系统的语音唤醒方法,其特征在于,用于云端服务器,所述智能语音系统包括智能语音设备以及所述云端服务器;所述方法包括:接收所述智能语音设备采集的音频数据;对所述音频数据进行语音识别,得到识别结果;返回所述识别结果至所述智能语音设备,供所述智能语音设备在识别成功时控制唤醒自身的智能语音服务。4.根据权利要求3所述的语音唤醒方法,其特征在于,所述对所述音频数据进行语音识别的过程具体包括:将所述音频数据进行语音-文字转换,得到转换后的文字数据;将所述文字数据转换为拼音数据;将所述拼音数据与预设唤醒拼音进行模糊匹配,并将匹配结果作为语音识别结果。5.根据权利要求4所述的语音唤醒方法,其特征在于,所述模糊匹配的过程包括:判断所述拼音数据与所述预设唤醒拼音的相似度是否达到预设相似阈值,若达到,则匹配结果为成功,若未达到,则匹配结果为失败。6.一种智能语音设备,其特征在于,包括:音频采集模块,用于采集外部语音,得到音频数...

【专利技术属性】
技术研发人员:杨海波
申请(专利权)人:上海庆科信息技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1