语音播放方法、装置、计算机可读存储介质及电子设备制造方法及图纸

技术编号:34039948 阅读:27 留言:0更新日期:2022-07-06 13:14
本公开实施例公开了一种语音播放方法、装置、计算机可读存储介质及电子设备,其中,该方法包括:基于发声意图的检测结果,确定目标空间内有发声意图的目标用户;确定目标用户的目标部位在目标空间的目标位置;基于目标位置与目标空间内的麦克风阵列包括的麦克风之间的位置关系,确定目标用户对应的目标麦克风;从目标麦克风采集的音频信号中提取目标用户的目标语音信号;控制目标空间内的音频播放设备播放目标语音信号。本公开实施例实现了用户无需手动控制麦克风进行声音采集和播放,大大提高了用户利用麦克风播放语音的操作便利性,同时节约了单独设置用于播放语音的麦克风耗费的成本。的成本。的成本。

Voice playing method, device, computer readable storage medium and electronic equipment

【技术实现步骤摘要】
语音播放方法、装置、计算机可读存储介质及电子设备


[0001]本公开涉及计算机
,尤其是一种语音播放方法、装置、计算机可读存储介质及电子设备。

技术介绍

[0002]目前,在一些包含多个人的空间内,需要将某些人或某些区域内发出的声音采集并播放出来。目前主流的方案是设置单独的麦克风,通过用户手持、佩戴等方式采集用户的声音。例如,用户在车辆内部进行唱歌的场景,需要在车内配备额外的麦克风设备作为拾音终端,通过对这些拾音终端的灵敏度、指向性等参数进行设计,使得麦克风获取的声音屏蔽音频播放设备播放声反馈的影响。或者,可以将手机作为拾音终端,与车载系统连接以后,作为麦克风使用。
[0003]目前的在一些空间内进行音频采集和播放的方案,用户在设置音频采集播放设备的功能或启动音频采集播放功能时,需要手动进行操作,操作便利性较低。

技术实现思路

[0004]本公开的实施例提供了一种语音播放方法、装置、计算机可读存储介质及电子设备。
[0005]本公开的实施例提供了一种语音播放方法,该方法包括:基于发声意图的检测结果,确定目标空间内有发声意图的目标用户;确定目标用户的目标部位在目标空间的目标位置;基于目标位置与目标空间内的麦克风阵列包括的麦克风之间的位置关系,确定目标用户对应的目标麦克风;从目标麦克风采集的音频信号中提取目标用户的目标语音信号;控制目标空间内的音频播放设备播放目标语音信号。
[0006]根据本公开实施例的另一个方面,提供了一种语音播放装置,该装置包括:第一确定模块,用于基于发声意图的检测结果,确定目标空间内有发声意图的目标用户;第二确定模块,用于确定目标用户的目标部位在目标空间的目标位置;第三确定模块,用于基于目标位置与目标空间内的麦克风阵列包括的麦克风之间的位置关系,确定目标用户对应的目标麦克风;提取模块,用于从目标麦克风采集的音频信号中提取目标用户的目标语音信号;播放模块,用于控制目标空间内的音频播放设备播放目标语音信号。
[0007]根据本公开实施例的另一个方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序用于执行上述语音播放方法。
[0008]根据本公开实施例的另一个方面,提供了一种电子设备,电子设备包括:处理器;用于存储处理器可执行指令的存储器;处理器,用于从存储器中读取可执行指令,并执行指令以实现上述语音播放方法。
[0009]基于本公开上述实施例提供的语音播放方法、装置、计算机可读存储介质及电子设备,通过基于发声意图的检测结果,确定目标空间内有发声意图的目标用户,然后确定目标用户的目标部位在目标空间的目标位置,再基于目标位置与目标空间内的麦克风阵列包
括的麦克风之间的位置关系,确定目标用户对应的目标麦克风,并从目标麦克风采集的音频信号中提取目标用户的目标语音信号,最后控制目标空间内的音频播放设备播放目标语音信号。实现了自动识别有发声意图的目标用户,并自动为目标用户分配麦克风,用户无需手动控制麦克风进行声音采集和播放,且用户无需手持单独的麦克风或移动到设置有麦克风的位置即可完成采集和播放音频,大大提高了用户利用麦克风播放语音的操作便利性,同时节约了单独设置用于播放语音的麦克风耗费的成本。
[0010]下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
[0011]通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
[0012]图1是本公开所适用的系统图。
[0013]图2是本公开一示例性实施例提供的语音播放方法的流程示意图。
[0014]图3是本公开另一示例性实施例提供的语音播放方法的流程示意图。
[0015]图4是本公开另一示例性实施例提供的语音播放方法的流程示意图。
[0016]图5是本公开另一示例性实施例提供的语音播放方法的流程示意图。
[0017]图6是本公开的实施例的目标用户的目标部位所处的目标收音区域的示意图。
[0018]图7是本公开另一示例性实施例提供的语音播放方法的流程示意图。
[0019]图8是本公开另一示例性实施例提供的语音播放方法的流程示意图。
[0020]图9是本公开另一示例性实施例提供的语音播放方法的流程示意图。
[0021]图10是本公开一示例性实施例提供的语音播放装置的结构示意图。
[0022]图11是本公开另一示例性实施例提供的语音播放装置的结构示意图。
[0023]图12是本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
[0024]下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
[0025]应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
[0026]本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
[0027]还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
[0028]还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
[0029]另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0030]还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
[0031]同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
[0032]以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
[0033]对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
[0034]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0035]本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音播放方法,包括:基于发声意图的检测结果,确定目标空间内有发声意图的目标用户;确定所述目标用户的目标部位在所述目标空间的目标位置;基于所述目标位置与所述目标空间内的麦克风阵列包括的麦克风之间的位置关系,确定所述目标用户对应的目标麦克风;从所述目标麦克风采集的音频信号中提取所述目标用户的目标语音信号;控制所述目标空间内的音频播放设备播放所述目标语音信号。2.根据权利要求1所述的方法,其中,所述基于发声意图的检测结果,确定目标空间内有发声意图的目标用户,包括:对于所述目标空间内的至少一个用户中的每个待检测用户,对所述待检测用户进行发声手势检测,得到所述待检测用户的发声手势信息;基于所述待检测用户的语音,确定所述待检测用户的语音意图信息;基于所述待检测用户的唇部动作,确定所述待检测用户的唇语信息;响应于确定所述待检测用户的发声手势信息、语音意图信息和唇语信息中的至少第一预设数量的信息满足意图判断条件,确定所述待检测用户为有发声意图的目标用户。3.根据权利要求1所述的方法,其中,所述从所述目标麦克风采集的音频信号中提取所述目标用户的目标语音信号,包括:基于所述目标麦克风采集的音频信号,确定主音频信号;基于将所述麦克风阵列中的其他麦克风采集的音频信号,确定参考音频信号;基于所述参考音频信号,对所述主音频信号进行滤波处理,得到所述目标用户的目标语音信号。4.根据权利要求1所述的方法,其中,所述从所述目标麦克风采集的音频信号中提取所述目标用户的目标语音信号,包括:基于对所述目标用户拍摄的目标部位图像,确定所述目标用户的目标部位在所述目标麦克风的收音范围内所处的目标收音区域;对所述目标麦克风采集的音频信号进行声源定位,确定所述目标麦克风的收音范围内的至少一个声源的位置;对采集自位于所述目标收音区域以外的声源的音频信号进行抑制;从抑制后的音频信号中提取所述目标用户的目标语音信号。5.根据权利要求1所述的方法,其中,在所述控制所述目标空间内的音频播放设备播放所述目标语音信号之后,所述方法还包括:基于停止发声意图检测,确定所述目标用户停止发声的意图;响应于确定检测结果表示所述目标用户具有停止发声的意图,停止从所述目标麦克风采集的音频信号中提取所述目标用户的目标语音信号。6.根据权利要求5所述的方法,其中,所述基于停止发声意图检测,确定所述目标用户停止发声的意图,包括:对所述目标用户进行发声手势检测,响应于确定得到的发声手势信息与预设发声手势不匹配,或与预设停止发声手势匹配,生成表示所述目标用户具有停止发声意图的第一检测结果;<...

【专利技术属性】
技术研发人员:姚碧莹
申请(专利权)人:北京地平线机器人技术研发有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1