【技术实现步骤摘要】
音频播放方法、装置、计算机可读存储介质及电子设备
[0001]本公开涉及计算机
,尤其是一种音频播放方法、装置、计算机可读存储介质及电子设备。
技术介绍
[0002]近年来,随着智能电子设备的不断推广,人机交互的手段越来越丰富。人与设备可以通过语音识别、手势识别等方式进行交互。例如在智能汽车领域,用户可以通过手动操作、语音控制等方式操控车载电子设备,如开启音乐播放、打开或关闭空调、设置导航、修改导航等。在用户控制音频播放设备时,目前主要采用手动控制、语音识别等方式主动地控制音频播放设备播放音乐、打开收音机等。
技术实现思路
[0003]本公开的实施例提供了一种音频播放方法、装置、计算机可读存储介质及电子设备。
[0004]本公开的实施例提供了一种音频播放方法,该方法包括:获取针对目标空间内的至少一个用户采集的意图判决数据;基于意图判决数据,确定至少一个用户具有的目标发声意图;确定表征至少一个用户的当前特征的特征信息;从预设音频库中提取并播放与特征信息对应的音频。
[0005]根据本公开实施例的另一个方面,提供了一种音频播放装置,该装置包括:获取模块,用于获取针对目标空间内的至少一个用户采集的意图判决数据;第一确定模块,用于基于意图判决数据,确定至少一个用户具有的目标发声意图;第二确定模块,用于确定表征至少一个用户的当前特征的特征信息;第一播放模块,用于从预设音频库中提取并播放与特征信息对应的音频。
[0006]根据本公开实施例的另一个方面,提供了一种计算机可读存储介质,计 ...
【技术保护点】
【技术特征摘要】
1.一种音频播放方法,包括:获取针对目标空间内的至少一个用户采集的意图判决数据;基于所述意图判决数据,确定所述至少一个用户具有的目标发声意图;确定表征所述至少一个用户的当前特征的特征信息;从预设音频库中提取并播放与所述特征信息对应的音频。2.根据权利要求1所述的方法,其中,在所述提取并播放与所述特征信息对应的音频之后,所述方法还包括:从所述至少一个用户当前发出的混合声音信号中提取用户音频信息;在所述用户音频信息符合预设条件的情况下,播放所述用户音频信息。3.根据权利要求2所述的方法,其中,在所述播放所述用户音频信息之后,所述方法还包括:从所述至少一个用户中确定所述用户音频信息对应的目标用户并获取所述目标用户的脸部图像;将所述用户音频信息对应的用户的脸部图像输入预先训练的第一情绪识别模型,得到所述至少一个用户分别对应的情绪类别信息;基于所述情绪类别信息,确定表征所述用户音频信息对应的用户的情绪与当前播放的音频的类型的匹配程度的第一评分;和/或,基于所述用户音频信息,确定表征所述用户音频信息与所述当前播放的音频的匹配程度的第二评分;基于所述第一评分和/或所述第二评分,确定所述用户音频信息的评分并输出。4.根据权利要求2所述的方法,其中,在所述播放所述用户音频信息之后,所述方法还包括:从所述至少一个用户中确定所述用户音频信息对应的目标用户并获取所述目标用户的脸部图像;将所述用户音频信息对应的用户的脸部图像和所述用户音频信息输入预先训练的第二情绪识别模型,得到情绪类别信息;基于所述情绪类别信息,确定表征所述用户音频信息对应的用户的情绪与当前播放的音频的类型的匹配程度的评分并输出。5.根据权利要求4所述的方法,其中,所述将所述用户音频信息对应的用户的脸部图像和所述用户音频信息输入预先训练的第二情绪识别模型,得到情绪类别信息,包括:将所述用户音频信息对应的用户的脸部图像和所述用户音频信息输入所述第二情绪识别模型,得到第三情绪类别信息序列,其中,所述第三情绪类别信息序列中的情绪类别信息分别对应于一个脸部图像子序列;所述基于所述情绪类别信息,确定表征所述用户音频信息对应的用户的情绪与当前播放的音频的类型的匹配程度的评分,包括:获取所述当前播放的音频对应的视频,并从所述视频中提取目标人物的脸部图像序列;将所述脸部图像序列和所述当前播放的音频输入所述第二情绪识别模型,得到第四情绪类别信息序列;
确定所述第三情绪类别信息序列和所述第四情绪类别信息序列之间的相似度;基于所述相似度,确定表征所述用户音频信息对应的用户的情绪与当前播放的音频的类型的匹配程度的评分。6.根据权利要求2所述的方法,其中,所述从所述至少一个用户当前发出的混合声音信号中提取用户音频信息,包括:获取设置在所述目标空间的音频采集设备采集的初始音频信息;对所述初始音频信息进行人声分离,得到至少一路用户音频信息,其中,所述至少一路用户音频信息分别对应于一个用户。7.根据权利要求2所...
【专利技术属性】
技术研发人员:朱长宝,牛建伟,余凯,
申请(专利权)人:深圳地平线机器人科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。