一种唤醒语音服务的方法和装置制造方法及图纸

技术编号:14411428 阅读:114 留言:0更新日期:2017-01-11 23:23
本发明专利技术公开了一种唤醒语音服务的方法和装置,所述方法包括:获取输入的语音;提取所述语音的声学特征;将所述语音的声学特征与预先设置的标准唤醒词的声学特征进行匹配,获取第一匹配分值;若所述第一匹配分值大于预先设置的第一阈值,则唤醒语音服务;若所述第一匹配分值小于所述第一阈值,但大于预先设置的第二阈值,则对所述语音进行记录,并将本次记录语音的声学特征与上一次记录语音的声学特征进行匹配,获取第二匹配分值;若所述第二匹配分值大于预先设置的第三阈值,则增加重复输入计数;当所述重复输入计数大于预先设置的第四阈值时,唤醒语音服务。采用本发明专利技术可提高语音服务唤醒的准确度,改善用户体验。

【技术实现步骤摘要】

本专利技术涉及计算机
,尤其涉及一种唤醒语音服务的方法和装置
技术介绍
近年来,具有语音操作功能的智能设备逐渐进入了人们的生活,这类设备在使用语音操作之前,一般需要通过特定的唤醒词来唤醒语音操作功能。现有语音服务的唤醒方法中,通常对用户的语音输入通过特定的算法进行计算,与预设的标准唤醒词进行匹配打分,如果最终计算得到的分数大于预设的门槛值则唤醒语音服务,否则不唤醒。然而,由于使用者生活居住环境的不同,往往带有一定的地方口音,或者由于疾病的影响,导致发音不准确,采用上述现有的唤醒方法,用户输入的唤醒词语音的匹配打分无法超过预设的门槛值,即便用户反复重复唤醒词,也难以准确地唤醒设备的语音服务,用户体验较差。
技术实现思路
本专利技术实施例的目的在于提供一种唤醒语音服务的方法和装置,提高语音服务唤醒的准确度,改善用户体验。为实现上述目的,本专利技术实施例提供了一种唤醒语音服务的方法,包括:获取输入的语音;提取所述语音的声学特征;将所述语音的声学特征与预先设置的标准唤醒词的声学特征进行匹配,获取第一匹配分值;若所述第一匹配分值大于预先设置的第一阈值,则唤醒语音服务;若所述第一匹配分值小于所述第一阈值,但大于预先设置的第二阈值,则对所述语音进行记录,并将本次记录语音的声学特征与上一次记录语音的声学特征进行匹配,获取第二匹配分值;若所述第二匹配分值大于预先设置的第三阈值,则增加重复输入计数;当所述重复输入计数大于预先设置的第四阈值时,唤醒语音服务。本专利技术通过对用户反复输入的匹配分值处于第一阈值和第二阈值之间的语音进行特殊处理,将本次输入语音与上一次输入语音进行匹配,以获知用户是否反复输入相同或相近的语音,当用户重复输入相同或相近的语音超过一定的次数时,正常唤醒设备的语音服务,提高了用户唤醒语音服务的准确度,有利于改善用户体验。进一步地,在所述当所述重复输入计数大于预先设置的第四阈值时,唤醒语音服务之后,还包括:判断唤醒语音服务后是否成功进行了语音操作;若成功进行了语音操作,则增加成功操作计数;若未成功进行语音操作,则减少所述成功操作计数;当所述成功操作计数大于预先设置的第五阈值,并且所述语音的声学特征未被存储于备选唤醒词库时,将所述语音的声学特征存入备选唤醒词库中;当所述成功操作计数小于所述第五阈值,并且所述语音的声学特征已被存储于所述备选唤醒词库时,将所述语音的声学特征从所述备选唤醒词库中删除。优选地,所述若所述第一匹配分值小于所述第一阈值,但大于预先设置的第二阈值,则对所述语音进行记录,并将本次记录语音的声学特征与上一次记录语音的声学特征进行匹配,获取第二匹配分值,具体为:若所述第一匹配分值小于预先设置的第一阈值,但大于预先设置的第二阈值,则将所述语音的声学特征与所述备选唤醒词库中的声学特征进行匹配,获取第三匹配分值;若所述第三匹配分值大于预先设置的第六阈值,则唤醒语音服务;若所述第三匹配分值小于所述第六阈值,则对所述语音进行记录,并将本次记录语音的声学特征与上一次记录语音的声学特征进行匹配,获取所述第二匹配分值。本专利技术在唤醒语音服务后,根据后续的语音操作情况来更新备选唤醒词库,当用户成功进行了语音操作时,将其认定为有效的语音唤醒,并在多次有效唤醒后将所述语音添加到备选唤醒词库中;而在未成功进行语音操作时,将其认定为误唤醒,减少该语音的成功操作计数,并在所述成功操作计数小于一定值时,将所述语音从备选唤醒词库中删除,提高了备选唤醒词的有效性。在后续的语音唤醒中本专利技术还利用所述备选唤醒词库中的历史记录,对匹配分值处于第一阈值和第二阈值之间的语音进行匹配识别,有利于提高识别的效率和准确性。更进一步地,在所述若所述第二匹配分值大于预先设置的第三阈值,则增加重复输入计数之后,还包括:若所述重复输入计数在限定的时间内未发生变化,则将所述重复输入计数清零。优选地,所述方法还包括:若所述第一匹配分值小于所述第二阈值,则判定不可唤醒语音服务,并重新获取输入的语音;若所述第二匹配分值小于所述第三阈值,则判定不可唤醒语音服务,并重新获取输入的语音;若所述重复输入计数小于所述第四阈值,则判定不可唤醒语音服务,并重新获取输入的语音。相应地,本专利技术还提供了一种唤醒语音服务的装置,包括:语音获取模块,用于获取输入的语音;特征提取模块,用于提取所述语音的声学特征;第一匹配模块,用于将所述语音的声学特征与预先设置的标准唤醒词的声学特征进行匹配,获取第一匹配分值;第一唤醒模块,用于若所述第一匹配分值大于预先设置的第一阈值,则唤醒语音服务;第二匹配模块,用于若所述第一匹配分值小于所述第一阈值,但大于预先设置的第二阈值,则对所述语音进行记录,并将本次记录语音的声学特征与上一次记录语音的声学特征进行匹配,获取第二匹配分值;重复计数模块,用于若所述第二匹配分值大于预先设置的第三阈值,则增加重复输入计数;第二唤醒模块,用于当所述重复输入计数大于预先设置的第四阈值时,唤醒语音服务。进一步地,所述装置还包括:操作计数模块,用于判断唤醒语音服务后是否成功进行了语音操作;若成功进行了语音操作,则增加成功操作计数;若未成功进行语音操作,则减少所述成功操作计数;词库增添模块,用于当所述成功操作计数大于预先设置的第五阈值,并且所述语音的声学特征未被存储于备选唤醒词库时,将所述语音的声学特征存入备选唤醒词库中;词库删减模块,用于当所述成功操作计数小于所述第五阈值,并且所述语音的声学特征已被存储于所述备选唤醒词库时,将所述语音的声学特征从所述备选唤醒词库中删除。优选地,所述第二匹配模块包括:第一匹配单元,用于若所述第一匹配分值小于预先设置的第一阈值,但大于预先设置的第二阈值,则将所述语音的声学特征与所述备选唤醒词库中的声学特征进行匹配,获取第三匹配分值;第一唤醒单元,用于若所述第三匹配分值大于预先设置的第六阈值,则唤醒语音服务;第二匹配单元,用于若所述第三匹配分值小于所述第六阈值,则对所述语音进行记录,并将本次记录语音的声学特征与上一次记录语音的声学特征进行匹配,获取所述第二匹配分值。更进一步地,所述装置还包括:计数清零模块,用于若所述重复输入计数在限定的时间内未发生变化,则将所述重复输入计数清零。优选地,所述装置还包括:第一重试模块,用于若所述第一匹配分值小于所述第二阈值,则判定不可唤醒语音服务,并重新获取输入的语音;第二重试模块,用于若所述第二匹配分值小于所述第三阈值,则判定不可唤醒语音服务,并重新获取输入的语音;第三重试模块,用于若所述重复输入计数小于所述第四阈值,则判定不可唤醒语音服务,并重新获取输入的语音。附图说明图1是本专利技术提供的唤醒语音服务的方法的一个实施例的方法流程图;图2是本专利技术提供的唤醒语音服务的方法的另一个实施例的方法流程图;图3是本专利技术提供的唤醒语音服务的方法的又一个实施例的方法流程图;图4是本专利技术提供的唤醒语音服务的方法的一个实施例的装置结构图;图5是本专利技术提供的唤醒语音服务的方法的另一个实施例的装置结构图;图6是本专利技术提供的唤醒语音服务的方法的又一个实施例的装置结构图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中本文档来自技高网...
一种唤醒语音服务的方法和装置

【技术保护点】
一种唤醒语音服务的方法,其特征在于,包括:获取输入的语音;提取所述语音的声学特征;将所述语音的声学特征与预先设置的标准唤醒词的声学特征进行匹配,获取第一匹配分值;若所述第一匹配分值大于预先设置的第一阈值,则唤醒语音服务;若所述第一匹配分值小于所述第一阈值,但大于预先设置的第二阈值,则对所述语音进行记录,并将本次记录语音的声学特征与上一次记录语音的声学特征进行匹配,获取第二匹配分值;若所述第二匹配分值大于预先设置的第三阈值,则增加重复输入计数;当所述重复输入计数大于预先设置的第四阈值时,唤醒语音服务。

【技术特征摘要】
1.一种唤醒语音服务的方法,其特征在于,包括:获取输入的语音;提取所述语音的声学特征;将所述语音的声学特征与预先设置的标准唤醒词的声学特征进行匹配,获取第一匹配分值;若所述第一匹配分值大于预先设置的第一阈值,则唤醒语音服务;若所述第一匹配分值小于所述第一阈值,但大于预先设置的第二阈值,则对所述语音进行记录,并将本次记录语音的声学特征与上一次记录语音的声学特征进行匹配,获取第二匹配分值;若所述第二匹配分值大于预先设置的第三阈值,则增加重复输入计数;当所述重复输入计数大于预先设置的第四阈值时,唤醒语音服务。2.如权利要求1所述的唤醒语音服务的方法,其特征在于,在所述当所述重复输入计数大于预先设置的第四阈值时,唤醒语音服务之后,还包括:判断唤醒语音服务后是否成功进行了语音操作;若成功进行了语音操作,则增加成功操作计数;若未成功进行语音操作,则减少所述成功操作计数;当所述成功操作计数大于预先设置的第五阈值,并且所述语音的声学特征未被存储于备选唤醒词库时,将所述语音的声学特征存入备选唤醒词库中;当所述成功操作计数小于所述第五阈值,并且所述语音的声学特征已被存储于所述备选唤醒词库时,将所述语音的声学特征从所述备选唤醒词库中删除。3.如权利要求2所述的唤醒语音服务的方法,其特征在于,所述若所述第一匹配分值小于所述第一阈值,但大于预先设置的第二阈值,则对所述语音进行记录,并将本次记录语音的声学特征与上一次记录语音的声学特征进行匹配,获取第二匹配分值,具体为:若所述第一匹配分值小于预先设置的第一阈值,但大于预先设置的第二阈值,则将所述语音的声学特征与所述备选唤醒词库中的声学特征进行匹配,获取第三匹配分值;若所述第三匹配分值大于预先设置的第六阈值,则唤醒语音服务;若所述第三匹配分值小于所述第六阈值,则对所述语音进行记录,并将本次记录语音的声学特征与上一次记录语音的声学特征进行匹配,获取所述第二匹配分值。4.如权利要求1所述的唤醒语音服务的方法,其特征在于,在所述若所述第二匹配分值大于预先设置的第三阈值,则增加重复输入计数之后,还包括:若所述重复输入计数在限定的时间内未发生变化,则将所述重复输入计数清零。5.如权利要求1到4任一项所述的唤醒语音服务的方法,其特征在于,所述方法还包括:若所述第一匹配分值小于所述第二阈值,则判定不可唤醒语音服务,并重新获取输入的语音;若所述第二匹配分值小于所述第三阈值,则判定不可唤醒语音服务,并重新获取输入的语音;若所述重复输入计数小于所述第四阈值,则判定不可唤醒语音服务,并重新获取输入的语音。6.一种唤醒语...

【专利技术属性】
技术研发人员:宋夏
申请(专利权)人:广州视源电子科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1