智能语音设备的控制方法、装置、设备、介质及程序产品制造方法及图纸

技术编号:36546652 阅读:17 留言:0更新日期:2023-02-04 16:58
本发明专利技术属于语音识别技术领域,具体涉及一种智能语音设备的控制方法、装置、设备、介质及程序产品。本发明专利技术旨在解决现有语音指令识别准确率较差的问题。本发明专利技术实施例提供的智能语音设备的控制方法、装置、设备、介质及程序产品,该方法包括:通过接收用户输入的语音指令,将声纹信息与每个功能程序对应的预设声纹进行匹配,获取与每个预设声纹的相似度,根据每个预设声纹对应的相似度和预设相似阈值,从所述预设声纹中确定目标声纹,控制智能语音设备执行目标声纹对应的目标功能程序,能够有效提高对语音指令识别准确率以及对智能语音设备的控制精确度,且实现过程中应用的算法较为简单,易于实现,能够与用户达到较好的交互效果。能够与用户达到较好的交互效果。能够与用户达到较好的交互效果。

【技术实现步骤摘要】
智能语音设备的控制方法、装置、设备、介质及程序产品


[0001]本专利技术实施例属于语音识别
,具体涉及一种智能语音设备的控制方法、装置、设备、介质及程序产品。

技术介绍

[0002]在智能语音对话系统中,智能语音设备可以根据用户的语音指令进行工作。但由于部分用户的口音较重,在使用方言向智能语音设备发送语音指令时,智能语音设备无法准确识别语音指令中的内容,导致智能语音设备无法准确依据语音指令进行工作。因此,如何准确识别用户的语音指令是关键。
[0003]现有技术中,识别用户语音指令主要是用户根据地域位置选择相应的方言模式(如闽南话模式,山东话模式,上海话模式等)后,向智能语音设备发送语音指令,智能语音设备接收用户发送的语音指令,并利用用户选择的方言模式对应的方言模型对语音指令进行识别,根据识别结果进行工作。
[0004]然而,由于方言有很多种类,且还存在许多介于不同方言之间不能被完全划分定位的方言,导致对语音指令识别准确率以及对智能语音设备的控制精确度较差。

技术实现思路

[0005]为了解决现有技术中的上述问题,即为了解决现有技术中由于方言有很多种类,且还存在许多介于不同方言之间不能完全被划分定位的方言,导致对语音指令识别准确率较差以及对智能语音设备的控制精确度较差的问题,本专利技术实施例提供了一种智能语音设备的控制方法、装置、设备、介质及程序产品。
[0006]第一方面,本申请实施例提供一种智能语音设备的控制方法,包括:
[0007]接收用户输入的语音指令,所述语音指令包括声纹信息;
[0008]将所述声纹信息与每个功能程序对应的预设声纹进行匹配,获取与每个预设声纹的相似度,所述每个功能程序对应的预设声纹是基于所述用户预先输入的语音获取的;
[0009]根据每个预设声纹对应的相似度和预设相似阈值,从所述预设声纹中确定目标声纹;
[0010]控制智能语音设备执行所述目标声纹对应的目标功能程序。
[0011]在一种具体实施方式中,所述将所述声纹信息与每个功能程序对应的预设声纹进行匹配,获取与每个预设声纹的相似度,包括:
[0012]将所述语音指令中的声纹信息输入预先获取的匹配模型中进行处理,获取所述声纹信息与每个功能程序对应的预设声纹的相似度,所述匹配模型是根据多个用户的声纹样本训练得到的。
[0013]在一种具体实施方式中,所述方法还包括:
[0014]将所述语音指令的声纹信息与所述每个功能程序对应的预设声纹的相似度按照由高到低的顺序进行排列;
[0015]其中,所述根据每个预设声纹对应的相似度和预设相似阈值,从所述预设声纹中确定目标声纹,包括:
[0016]将与所述声纹信息的相似度最高,且所述相似度超过预设相似阈值的预设声纹确定为所述目标声纹。
[0017]可选的,所述方法还包括:
[0018]在排在第一位的相似度小于或等于预设相似阈值时,生成匹配失败信息,所述匹配失败信息用于表示无法获取与所述语音指令对应的所述目标功能程序。
[0019]在一种具体实施方式中,所述获取用户输入的语音指令之前,所述方法还包括:
[0020]获取所述用户输入的语音,所述语音包括预设声纹;
[0021]响应于所述用户对于功能程序的选择操作,建立所述预设声纹与所述功能程序的映射关系。
[0022]可选的,所述生成匹配失败信息之后,所述方法还包括:
[0023]输出所述匹配失败信息,
[0024]或,
[0025]向所述用户的终端设备发送所述匹配失败信息。
[0026]第二方面,本申请实施例提供一种智能语音设备的控制装置,包括:
[0027]接收模块,用于接收用户输入的语音指令,所述语音指令包括声纹信息;
[0028]处理模块,用于将所述声纹信息与每个功能程序对应的预设声纹进行匹配,获取与每个预设声纹的相似度,所述每个功能程序对应的预设声纹是基于所述用户预先输入的语音获取的;
[0029]所述处理模块,还用于根据每个预设声纹对应的相似度和预设相似阈值,从所述预设声纹中确定目标声纹;
[0030]所述处理模块,还用于控制智能语音设备执行所述目标声纹对应的目标功能程序。
[0031]在一种具体实施方式中,所述处理模块,具体用于:
[0032]将语音指令中的声纹信息输入预先获取的匹配模型中进行处理,获取声纹信息与每个功能程序对应的预设声纹的相似度,匹配模型是根据多个用户的声纹样本训练得到的。
[0033]可选的,所述处理模块,还用于:
[0034]将语音指令的声纹信息与每个功能程序对应的预设声纹的相似度按照由高到低的顺序进行排列;
[0035]其中,所述处理模块还用于将与所述声纹信息的相似度最高,且所述相似度超过预设相似阈值的预设声纹确定为所述目标声纹。
[0036]可选的,所述处理模块,还用于:
[0037]在排在第一位的相似度小于或等于预设相似阈值时,生成匹配失败信息,匹配失败信息用于表示无法获取与语音指令对应的目标功能程序。
[0038]在一种具体实施方式中,获取用户输入的语音指令之前,所述接收模块,还用于:获取用户输入的语音,语音包括预设声纹。
[0039]所述处理模块,还用于:响应于用户对于功能程序的选择操作,建立预设声纹与功
能程序的映射关系。
[0040]在一种具体实施方式中,该智能语音设备的控制装置还可以包括:
[0041]输出模块,用于输出匹配失败信息,
[0042]或,
[0043]发送模块,用于向用户的终端设备发送匹配失败信息。
[0044]第三方面,本申请实施例提供一种电子设备,包括:接收器、处理器、存储器及存储在所述存储器上并可在处理器上运行的计算机程序指令,所述接收器耦合至所述处理器,所述处理器控制所述接收器的接收动作,所述处理器执行所述计算机程序指令时用于实现第一方面以及各可能设计提供的方法。
[0045]第四方面,本申请实施例可提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现第一方面以及各可能设计提供的方法。
[0046]第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时用于实现第一方面以及各可能设计提供的方法。
[0047]本领域技术人员能够理解的是,本专利技术实施例提供的智能语音设备的控制方法、装置、设备、介质及程序产品,该方法包括:通过接收用户输入的语音指令,将声纹信息与每个功能程序对应的预设声纹进行匹配,获取与每个预设声纹的相似度,根据每个预设声纹对应的相似度和预设相似阈值,从所述预设声纹中确定目标声纹,控制智能语音设备执行目标声纹对应的目标功能程序。通过获取声纹信息与每个预设声纹的相似度,将超过预设相似阈值的且与声纹信息相似度最高的预设声纹作为目标声纹,能够有效提高对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能语音设备的控制方法,其特征在于,包括:接收用户输入的语音指令,所述语音指令包括声纹信息;将所述声纹信息与每个功能程序对应的预设声纹进行匹配,获取与每个预设声纹的相似度,所述每个功能程序对应的预设声纹是基于预先输入的语音获取的;根据每个预设声纹对应的相似度和预设相似阈值,从所述预设声纹中确定目标声纹;控制智能语音设备执行所述目标声纹对应的目标功能程序。2.根据权利要求1所述的方法,其特征在于,所述将所述声纹信息与每个功能程序对应的预设声纹进行匹配,获取与每个预设声纹的相似度,包括:将所述语音指令中的声纹信息输入预先获取的匹配模型中进行处理,获取所述声纹信息与每个功能程序对应的预设声纹的相似度,所述匹配模型是根据多个用户的声纹样本训练得到的。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:将所述语音指令的声纹信息与所述每个功能程序对应的预设声纹的相似度按照由高到低的顺序进行排列;其中,所述根据每个预设声纹对应的相似度和预设相似阈值,从所述预设声纹中确定目标声纹,包括:将与所述声纹信息的相似度最高,且所述相似度超过预设相似阈值的预设声纹确定为所述目标声纹。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:在排在第一位的相似度小于或等于预设相似阈值时,生成匹配失败信息,所述匹配失败信息用于表示无法获取与所述语音指令对应的所述目标功能程序。5.根据权利要求1或4所述的方法,其特征在于,所述获取用户输入的语音指令之前,所述方法还包括:获取所述用户输入的语音,所述语...

【专利技术属性】
技术研发人员:朱文博张卓博
申请(专利权)人:海尔智家股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1