语音唤醒方法、装置及智能设备制造方法及图纸

技术编号:18944679 阅读:26 留言:0更新日期:2018-09-15 11:57
本申请提供一种语音唤醒方法、装置及智能设备,方法包括:通过预设的用户唤醒模型判定接收到的输入语音是否为目标唤醒词;在判定为否时,通过预先训练的通用唤醒模型判定输入语音是否为目标唤醒词;若是,执行唤醒;其中,用户唤醒模型是利用用户录制的唤醒语音构建的模型,通用唤醒模型是利用收集的唤醒语料训练得到的模型。由于本申请在通用唤醒模型基础上,增加的用户唤醒模型是利用使用者录制的唤醒语音构建的模型,因此在使用产品时,大部分情况通过该模型可成功唤醒,若通过该模型无法成功唤醒,再通过通用唤醒模型判定,以确保成功唤醒。从而本申请通过用户唤醒模型和通用唤醒模型的结合可以提高唤醒率,提升用户的使用体验。

Voice wake-up method, device and intelligent device

The present application provides a voice wake-up method, device and intelligent device, including: determining whether the received input voice is a target wake-up word by a preset user wake-up model; determining whether the received input voice is a target wake-up word by a pre-trained universal wake-up model; and if so, performing a wake-up call. Among them, the user wake-up model is constructed by using the wake-up voice recorded by the user, and the general wake-up model is trained by using the collected wake-up corpus. Since this application is based on the general wake-up model, the added user wake-up model is a model constructed by using the wake-up voice recorded by the user, most of the products can be successfully waked up by this model. If the wake-up can not be successfully waked up by this model, then through the general wake-up model to determine to ensure success. Wake up. Thus, the application can improve the wake-up rate and user experience by combining the user wake-up model with the general wake-up model.

【技术实现步骤摘要】
语音唤醒方法、装置及智能设备
本申请涉及语音处理
,尤其涉及一种语音唤醒方法、装置及智能设备。
技术介绍
在智能家居或者语音交互系统中,语音唤醒技术应用非常广泛。但由于语音唤醒效果不佳和运算量大的问题,降低了用户实际应用体验,并且也提高了对硬件设备的要求。在相关技术中,通常利用关键词识别来实现语音唤醒,即用户输入语音后,通过预先训练得到的基于神经网络的模型,识别输入语音的关键词,进而根据识别出的关键词实现唤醒功能。然而,对于用户来说,发音差距(例如带有方言的发音)比较大,训练得到的模型很难确保每一用户的唤醒语音都能达到理想的效果,因此总有一些用户输入的语音无法实现唤醒,从而造成唤醒率低的问题。
技术实现思路
有鉴于此,本申请提供一种语音唤醒方法、装置及智能设备,以解决现有唤醒方式唤醒率低的问题。根据本申请实施例的第一方面,提供一种语音唤醒方法,所述方法包括:通过预设的用户唤醒模型判定接收到的输入语音是否为目标唤醒词;在判定为否的情况下,通过预先训练的通用唤醒模型判定所述输入语音是否为目标唤醒词;若是,则执行唤醒;其中,所述用户唤醒模型是利用用户录制的唤醒语音构建的模型,所述通用唤醒模型是利用收集的唤醒语料训练得到的模型。根据本申请实施例的第二方面,提供一种语音唤醒装置,所述装置包括:第一判定单元,用于通过预设的用户唤醒模型判定接收到的输入语音是否为目标唤醒词;第二判定单元,用于在判定为否的情况下,通过预先训练的通用唤醒模型判定所述输入语音是否为目标唤醒词;唤醒单元,用于在判定为是时,执行唤醒;其中,所述用户唤醒模型是利用用户录制的唤醒语音构建的模型,所述通用唤醒模型是利用收集的唤醒语料训练得到的模型。根据本申请实施例的第三方面,提供一种智能设备,所述设备包括:语音采集模块,用于采集输入语音;存储器,用于存储语音唤醒的控制逻辑对应的机器可读指令;处理器,用于读取所述存储器上的所述机器可读指令,并执行所述指令以实现如下操作:通过预设的用户唤醒模型判定接收到的输入语音是否为目标唤醒词;在判定为否的情况下,通过预先训练的通用唤醒模型判定所述输入语音是否为目标唤醒词;若是,则执行唤醒;其中,所述用户唤醒模型是利用用户录制的唤醒语音构建的模型,所述通用唤醒模型是利用收集的唤醒语料训练得到的模型。应用本申请实施例,智能设备先通过预设的用户唤醒模型判定接收到的输入语音是否为目标唤醒词,在判定为否的情况下,再通过预先训练的通用唤醒模型判定所述输入语音是否为目标唤醒词,若是,则执行唤醒。其中,用户唤醒模型是利用用户录制的唤醒语音构建的模型,通用唤醒模型是利用收集的唤醒语料训练得到的模型。基于上述描述可知,本申请在通用唤醒模型的基础上,增加了一个用户唤醒模型,由于该用户唤醒模型是用户购买产品后,利用用户(即使用者)录制的唤醒语音构建的模型,即该模型是针对专门使用者的模型,因此用户在使用该产品时,即使输入带方言的语音,通过用户唤醒模型也可以判定出目标唤醒词,如果通过用户唤醒模型无法成功唤醒,再通过通用唤醒模型判定是否为目标唤醒词,以确保成功唤醒。从而本申请通过用户唤醒模型和通用唤醒模型的结合可以提高唤醒率,提升用户的使用体验。附图说明图1为本申请根据一示例性实施例示出的一种语音唤醒场景示意图;图2为本申请根据一示例性实施例示出的一种语音唤醒方法的实施例流程图;图3为本申请根据一示例性实施例示出的另一种语音唤醒方法的实施例流程图;图4为本申请根据一示例性实施例示出的又一种语音唤醒方法的实施例流程图;图5为本申请根据一示例性实施例示出的一种智能设备的硬件结构图;图6为本申请根据一示例性实施例示出的一种语音唤醒装置的实施例结构图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。传统的唤醒实现方式均是,利用收集得到的唤醒语料去训练唤醒模型,该唤醒模型用于判定输入语音是否为唤醒词。然而这种训练得到的唤醒模型很难确保每一用户的唤醒语音都能唤醒成功,因为每一用户发音差距比较大,尤其对于带有方言的唤醒语音,很容易唤醒失败。由此可知,现有唤醒方式抗噪性差、唤醒率比较低。基于此,图1为本申请根据一示例性实施例示出的一种语音唤醒场景图,图1中的智能设备采集到用户的输入语音后,首先通过预设的用户唤醒模型判定输入语音是否为目标唤醒词,如果是,则直接执行唤醒,如果不是,再进一步通过预先训练的通用唤醒模型判定输入语音是否为目标唤醒词,如果是,执行唤醒。由于本申请在通用唤醒模型的基础上,增加了一个用户唤醒模型,该模型是用户购买产品后,利用用户(即产品使用者)录制的唤醒语音(例如带有方言的唤醒语音)构建的模型,即该模型是针对专门使用者的模型,因此用户在使用该产品时,即使输入带方言的语音,通过用户唤醒模型也可以判定出目标唤醒词,如果通过用户唤醒模型无法成功唤醒,再通过通用唤醒模型判定是否为目标唤醒词,以确保成功唤醒。从而通过用户唤醒模型和通用唤醒模型的结合可以提高唤醒率,提升用户的使用体验。下面以具体实施例详细介绍本申请的技术方案:图2为本申请根据一示例性实施例示出的一种语音唤醒方法的实施例流程图,该语音唤醒方法可以应用在具有语音唤醒功能的智能设备(例如智能家居、智能车载设备等)上。如图2所示,该语音唤醒方法包括如下步骤:步骤201:通过预设的用户唤醒模型判定接收到的输入语音是否为目标唤醒词,如果是目标唤醒词,则执行步骤202,否则,执行步骤203。在一实施例中,当用户需要唤醒智能设备的某一功能时,可以对着智能设备输入内容为目标唤醒词的语音,智能设备上设置的麦克风接收到该输入语音后,将该输入语音输入用户唤醒模型,以使用户唤醒模型输出是否为目标唤醒词的判定结果。其中,由于用户唤醒模型是利用用户录制的唤醒语音构建的模型,该用户为购买智能设备的使用者,且使用者可以是一个或多个,因此该用户唤醒模型仅适用于录制过唤醒语音的用户。购买智能设备的使用者在输入语音后,即使使用者的发音带有方言,在多数情况下通过用户唤醒模型均能正确判定出是目标唤醒词。针对步骤201的可选实现方式,可以参见下述图4所示实施例的描述,在此暂不详述。步骤202:执行唤醒。在一实施例中,智能设备执行的唤醒可以是播放音乐、打开空本文档来自技高网...

【技术保护点】
1.一种语音唤醒方法,其特征在于,所述方法包括:通过预设的用户唤醒模型判定接收到的输入语音是否为目标唤醒词;在判定为否的情况下,通过预先训练的通用唤醒模型判定所述输入语音是否为目标唤醒词;若是,则执行唤醒;其中,所述用户唤醒模型是利用用户录制的唤醒语音构建的模型,所述通用唤醒模型是利用收集的唤醒语料训练得到的模型。

【技术特征摘要】
1.一种语音唤醒方法,其特征在于,所述方法包括:通过预设的用户唤醒模型判定接收到的输入语音是否为目标唤醒词;在判定为否的情况下,通过预先训练的通用唤醒模型判定所述输入语音是否为目标唤醒词;若是,则执行唤醒;其中,所述用户唤醒模型是利用用户录制的唤醒语音构建的模型,所述通用唤醒模型是利用收集的唤醒语料训练得到的模型。2.根据权利要求1所述的方法,其特征在于,所述方法还包括,采用如下方式构建所述用户唤醒模型:当接收到录音请求时,输出目标唤醒词录制要求;接收唤醒语音和用户标识,并获取所述唤醒语音的第一声学特征;将所述用户标识与所述第一声学特征保存到用户唤醒模型中。3.根据权利要求2所述的方法,其特征在于,通过预设的用户唤醒模型判定接收到的输入语音是否为目标唤醒词,包括:获取所述输入语音的第二声学特征;将所述第二声学特征与所述用户唤醒模型中的第一声学特征进行匹配;若匹配到所述第二声学特征,则确定所述输入语音是目标唤醒词;若未匹配到所述第二声学特征,则确定所述输入语音不是目标唤醒词。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:在通过预设的用户唤醒模型判定接收到的输入语音是目标唤醒词之后,执行唤醒,并记录所述输入语音;在通过预先训练的通用唤醒模型判定所述输入语音是目标唤醒词之后,记录所述输入语音;在接收唤醒语音和用户标识之后,记录所述唤醒语音;按照预设时间间隔,将记录的输入语音或唤醒语音作为唤醒语料,并利用所述唤醒语料对所述通用唤醒模型进行训练,以得到优化后的通用唤醒模型。5.根据权利要求1所述的方法,其特征在于,在通过预先训练的通用唤醒模型判定所述输入语音是否为目标唤醒词之后,所述方法还包括:若判定为否,则输出进行录音的提示信息;在接收到录制的唤醒语音时,利用接收到的唤醒语音更新所述用户唤醒模型。6.一种语音唤醒装置,其特征在于,所述装置包括:第一...

【专利技术属性】
技术研发人员:张利红
申请(专利权)人:青岛海信电器股份有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1