音频输出方法、输出装置、烹饪设备、服务器和存储介质制造方法及图纸

技术编号:33835977 阅读:17 留言:0更新日期:2022-06-16 11:51
本发明专利技术提出了一种音频输出方法、输出装置、烹饪设备、服务器和存储介质。其中,音频输出方法,包括:响应于语音控制指令,识别语音控制指令对应的身份识别信息,以及语音控制指令中的语义信息;将身份识别信息和语义信息发送至服务器,以供服务器根据身份识别信息和语义信息确定第一音频数据;接收并播放来自服务器的第一音频数据。本发明专利技术通过将用户发出的语音控制指令对应的语义信息和身份识别信息发送至服务器,服务器能够根据语义信息和身份识别信息确定相应的第一音频数据。通过目标设备输出来自服务器的第一音频数据,能够在保证目标设备播报的语音对应的语义符合用户需求的同时,满足用户对播报语义的个性化需求。满足用户对播报语义的个性化需求。满足用户对播报语义的个性化需求。

【技术实现步骤摘要】
音频输出方法、输出装置、烹饪设备、服务器和存储介质


[0001]本专利技术属于家用电器
,具体而言,涉及一种音频输出方法、输出装置、烹饪设备、服务器和存储介质。

技术介绍

[0002]随着人工智能和物联网的发展,越来越多烹饪设备,拥有了人机对话的能力。现有技术中,均是预先将固定的语音文件存储在设备中,在需要播报语音时播放该语音文件,导致语音播报输出的音频单一,无法满足用户的个性化需求。

技术实现思路

[0003]本专利技术旨在解决现有技术或相关技术中存在的技术问题之一。
[0004]为此,本专利技术的第一方面提出了一种音频输出方法。
[0005]本专利技术的第二方面提出了一种音频输出方法。
[0006]本专利技术的第三方面提出了一种音频输出装置。
[0007]本专利技术的第四方面提出了一种音频输出装置。
[0008]本专利技术的第五方面提出了一种音频输出装置。
[0009]本专利技术的第六方面提出了一种可读存储介质。
[0010]本专利技术的第七方面提出了一种烹饪设备。
[0011]本专利技术的第八方面提出了一种服务器。
[0012]有鉴于此,根据本专利技术的第一方面提出一种音频输出方法,包括:响应于语音控制指令,识别语音控制指令对应的身份识别信息,以及语音控制指令中的语义信息;将身份识别信息和语义信息发送至服务器,以供服务器根据身份识别信息和语义信息确定第一音频数据;接收并播放来自服务器的第一音频数据。
[0013]本专利技术提供的音频输出方法能够应用于用户终端或烹饪设备,以下称为目标设备。目标设备中设置有声音采集装置,通过声音采集装置接收用户发送的语音控制指令。目标设备在接收到用户的语音控制指令之后,对用户发出的语音控制指令进行识别,目标设备中包括声纹识别单元和语义识别单元,通过声纹识别单元识别语音控制指令中的声纹特征,根据声纹特征确定输出语音控制指令的用户的身份识别信息。目标设备通过语义识别单元识别语音控制指令中的语义信息。其中,身份识别信息包括用户的注册的账号等能够确定用户身份的识别信息。目标设备还包括联网的通信装置,通过通信装置与服务器建立通信连接,并将识别到的语义信息和身份识别信息均发送至服务器。服务器接收到语义信息和身份识别信息后,能够确定语音控制指令对应的用户的身份信息,以及语音控制指令对应的含义,服务器根据用户的身份信息和语音控制指令的具体含义在服务器中确定第一音频数据,并将第一音频数据回传至目标设备。目标设备播放接收到的第一音频数据。
[0014]在一些可能的实施方案中,服务器中存储有多条音频数据,其中,多条音频数据与不同的用户ID对应。服务器在接收到语义信息和用户的身份识别信息之后,能够根据用户
的身份识别信息查找到对应的多条音频数据,再通过语义信息筛选多条音频数据中的第一音频数据,使第一音频数据与用户的身份识别信息和语义信息相对应。可以理解的是,与用户的身份识别信息对应的多条音频数据为预存在服务器中的数据。通过身份识别信息能够查找到符合用户个性化的多个条音频数据,再通过语义信息确定用户需要播放的第一音频数据,实现了目标设备播放的音频数据符合用户需求的同时,还能够满足用户的个性化需求。
[0015]在另外一些可能的实施方案中,服务器中存储有多条脚本内容以及多种声纹特征,其中,多种声纹特征与不同的用户的身份识别信息相对应。在服务器接收到语义信息,以及用户的身份识别信息之后,能够根据用户的身份识别信息查找到对应的声纹特征,并根据语义信息查找多条脚本内容中对应的目标脚本内容。服务器将脚本内容与声纹特征进行合成,能够得到第一音频数据,由于第一音频数据中的脚本内容与用户输出的语音控制指令中的语义信息相符,且第一音频数据中的声纹特征与用户的身份识别信息相符,从而实现了目标设备播放的音频数据符合用户需求的同时,还能够满足用户的个性化需求。可以理解的是,声纹特征为用户预存在服务器中的声纹特征。
[0016]相关技术中,烹饪设备或用户终端能够在用户烹饪的过程中输出语音信息提示用户烹饪过程中的相关操作,但输出的语音信息均是用户预先存储在设备中的语音信息,该语音信息的音色(声纹特征)比较单一,无法满足用户的个性化需求。
[0017]本专利技术通过将用户发出的语音控制指令对应的语义信息和身份识别信息发送至服务器,服务器能够根据语义信息和身份识别信息确定相应的第一音频数据。通过目标设备输出来自服务器的第一音频数据,能够在保证目标设备播报的语音对应的语义符合用户需求的同时,满足用户对播报语义的个性化需求。
[0018]另外,根据本专利技术提供的上述技术方案中的音频输出方法,还可以具有如下附加技术特征:
[0019]在一种可能的设计中,音频输出方法还包括:响应于音频设置指令,获取第一音频数据;将第一音频数据发送至服务器,以供服务器将第一音频数据和身份识别信息进行绑定。
[0020]在该设计中,在用户通过语音控制指令对目标设备进行控制之前,用户能够对目标设备执行音频设置指令,其中,音频设置指令中包括第一音频数据,第一音频数据中包括用户的语音内容。目标设备接收到包括用户的语音内容的第一音频数据后,将第一音频数据上传到服务器,服务器接收到第一音频数据后,将第一音频数据与用户的身份识别信息进行绑定存储,使服务器在识别到用户的身份识别信息后,能够根据身份识别信息查找到对应的第一音频数据。
[0021]具体来说,目标设备在接收到音频设置指令后,开始对用户的语音内容进行录制,以得到第一音频数据。其中,语音内容为后续使用目标设备过程中的语音播报。
[0022]在一些具体的实施方式中,目标设备为烤箱,用户启动烤箱的语音播报录制功能,用户搜索烤鸡翅的做法,在烤箱的显示屏幕上显示文字内容,用户根据文字内容开始朗读,烤箱能够对用户的朗读内容进行录制,在录制完成后根据录制内容生成第一音频数据,并将第一音频数据上传至服务器,服务器将第一音频数据与文字内容和用户ID进行绑定。在用户使用烤箱选择烤鸡翅的功能后,烤箱接收来自服务器回传的第一音频数据,并播放第
一音频数据,实现了用户在烹饪过程中能够听到之前录制的朗读内容。
[0023]本专利技术通过目标设备对用户的语音进行录制得到第一音频数据,并将第一音频数据上传至服务器,在用户需要通过目标设备播报语音的情况下,能够通过目标设备与服务器进行交互,播放用户提前录制的第一音频数据,实现了用户对目标设备播报语音的个性化设置。
[0024]在一种可能的设计中,音频输出方法还包括:响应于音频设置指令,获取第二音频数据;提取第二音频数据的第一声纹特征;将第一声纹特征发送至服务器,以供服务器将身份识别信息与第一声纹特征进行绑定。
[0025]在该设计中,在用户通过语音控制指令对目标设备进行控制之前,用户能够对目标设备执行音频设置指令,其中,音频设置指令中包括用户第二音频数据,第二音频数据包括用户的语音内容。目标设备接收到包括用户的语音内容的第二音频数据后,目标设备能够提取语音内容中的第一声纹特征,将第一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频输出方法,其特征在于,包括:响应于语音控制指令,识别所述语音控制指令对应的身份识别信息,以及所述语音控制指令中的语义信息;将所述身份识别信息和所述语义信息发送至服务器,以供所述服务器根据所述身份识别信息和所述语义信息确定第一音频数据;接收并播放来自所述服务器的所述第一音频数据。2.根据权利要求1所述的音频输出方法,其特征在于,还包括:响应于音频设置指令,获取所述第一音频数据;将所述第一音频数据发送至所述服务器,以供所述服务器将所述第一音频数据和所述身份识别信息进行绑定。3.根据权利要求1所述的音频输出方法,其特征在于,还包括:响应于音频设置指令,获取第二音频数据;提取所述第二音频数据的第一声纹特征;将所述第一声纹特征发送至所述服务器,以供所述服务器将所述身份识别信息与所述第一声纹特征进行绑定。4.根据权利要求1至3中任一项所述的音频输出方法,其特征在于,所述识别所述语音控制指令对应的身份识别信息,包括:提取所述语音控制指令中的第二声纹特征;根据所述第二声纹特征查找所述身份识别信息。5.根据权利要求1至3中任一项所述的音频输出方法,其特征在于,所述识别所述语音控制指令对应的身份识别信息,包括:采集图像数据,所述图像数据的采集时刻与所述语音控制指令的接收时刻相对应;根据所述图像数据确定所述身份识别信息。6.根据权利要求1至3中任一项所述的音频输出方法,其特征在于,所述音频输出方法应用于烹饪设备,所述接收并播放来自所述服务器的所述第一音频数据之前,还包括:获取所述烹饪设备的第一烹饪参数;将所述第一烹饪参数发送至所述服务器,以供所述服务器根据所述烹饪参数确定所述第一音频数据的发送时刻,按照所述发送时刻向所述烹饪设备发送所述第一音频数据;播放接收到的所述第一音频数据。7.根据权利要求1至3中任一项所述的音频输出方法,其特征在于,所述音频输出方法应用于烹饪设备,所述接收并播放来自所述服务器的所述第一音频数据,包括:接收所述第一音频数据,并将所述第一音频数据暂存在本地存储区;获取所述烹饪设备的第二烹饪参数;根据所述第二烹饪参数,确定所述第一音频数据的播放时刻;按照所述播放时刻,播放所述第一音频数据。8.一种音频输出方法,其特征在于,包括:接收目标设备的身份识别信息和语义信息;根据所述身份识别信息和所述语义信息确定第一音频数据;将所述第一音频数据发送至所述目标设备,以供所述目标设备播放所述第一音频数...

【专利技术属性】
技术研发人员:胡子坚孙裕文
申请(专利权)人:美的集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1