声源方向确定方法、装置、终端以及存储介质制造方法及图纸

技术编号:35190234 阅读:16 留言:0更新日期:2022-10-12 18:07
本申请提供了一种声源方向确定方法、装置、终端以及存储介质,属于声源定位技术领域。方法包括:基于所采集的目标语音信号在至少两个拾音方向上的语音信号,确定至少两个拾音方向对应的匹配度;基于目标语音信号,确定参考声源方向;对参考声源方向对应的参考声源角度进行归一化处理;对在每个拾音方向上的语音信号进行特征提取,得到每个拾音方向对应的语音特征;基于每个拾音方向对应的语音特征,确定每个拾音方向对应的概率;基于目标语音信号的声源参数,确定目标声源方向,声源参数包括归一化后的参考声源角度以及至少两个拾音方向对应的匹配度和概率。该方法提高了所确定的声源方向的准确性。源方向的准确性。源方向的准确性。

【技术实现步骤摘要】
声源方向确定方法、装置、终端以及存储介质


[0001]本申请涉及声源定位
,特别涉及一种声源方向确定方法、装置、终端以及存储介质。

技术介绍

[0002]目前,一些终端能够识别用户的语音信号,从而与用户进行互动。而为了节省功耗,终端一般处于休眠状态,在接收到唤醒指令时才唤醒终端。
[0003]为了提高采集到的语音信号的清晰度,终端可以借助于该唤醒指令中携带的语音信号,定位声源方向,后续即可基于该声源方向采集语音信号。然而在周围环境噪声较大的情况下,定位得到声源方向准确性较差。

技术实现思路

[0004]本申请实施例提供了一种声源方向确定方法、装置、终端以及存储介质,能够提高所确定的声源方向的准确性。所述技术方案如下:
[0005]根据本申请实施例的一方面,提供了一种声源方向确定方法,所述方法包括:
[0006]基于所采集的目标语音信号在至少两个拾音方向上的语音信号,确定所述至少两个拾音方向对应的匹配度,所述匹配度是在所述拾音方向上的语音信号与唤醒词之间的匹配度;
[0007]基于所述目标语音信号,确定参考声源方向;
[0008]对所述参考声源方向对应的参考声源角度进行归一化处理;
[0009]对在每个所述拾音方向上的语音信号进行特征提取,得到每个所述拾音方向对应的语音特征;
[0010]基于每个所述拾音方向对应的语音特征,确定每个所述拾音方向对应的概率,所述概率表示所述拾音方向为声源方向的可能性;
[0011]基于所述目标语音信号的声源参数,确定目标声源方向,所述声源参数包括归一化后的所述参考声源角度以及所述至少两个拾音方向对应的匹配度和概率。
[0012]在一种可能的实现方式中,所述基于每个所述拾音方向对应的语音特征,确定每个所述拾音方向对应的概率,包括:
[0013]基于每个所述拾音方向对应的语音特征,调用概率确定模型,确定每个所述拾音方向对应的概率,所述概率确定模型用于确定任一语音特征对应的拾音方向为声源方向的概率。
[0014]在一种可能的实现方式中,所述方法还包括:
[0015]获取至少两个样本拾音方向对应的样本语音特征和声源标签,所述样本语音特征基于在所述样本拾音方向上的样本语音信号确定,所述声源标签表示所述样本拾音方向是否为声源方向;
[0016]对于每个所述样本拾音方向,基于所述样本拾音方向对应的样本语音特征,调用
所述概率确定模型,确定所述样本拾音方向对应的预测概率,基于所述预测概率和所述声源标签,确定第一损失值;
[0017]基于每个所述样本拾音方向对应的每个所述第一损失值,训练所述概率确定模型。
[0018]在一种可能的实现方式中,所述基于所述目标语音信号的声源参数,确定目标声源方向,包括:
[0019]基于所述目标语音信号的声源参数,调用角度确定模型,确定目标声源角度,所述角度确定模型用于基于任一语音信号的声源参数确定所述语音信号对应的声源角度;
[0020]将所述目标声源角度指示的方向确定为所述目标声源方向。
[0021]在一种可能的实现方式中,所述方法还包括:
[0022]获取样本声源方向对应的样本声源角度、样本参考声源方向对应的样本参考声源角度以及至少两个样本拾音方向对应的样本匹配度,所述样本匹配度为在所述样本拾音方向上的样本语音信号与所述唤醒词之间的匹配度;
[0023]对所述样本参考声源角度进行归一化处理;
[0024]基于每个所述样本拾音方向对应的样本语音特征,确定每个所述样本拾音方向对应的样本概率,所述样本概率表示所述样本拾音方向为声源方向的可能性,所述样本语音特征基于在所述样本拾音方向上的样本语音信号确定;
[0025]基于归一化后的所述样本参考声源角度以及所述至少两个样本拾音方向对应的样本匹配度和样本概率,调用所述角度确定模型,确定预测声源角度;
[0026]基于所述预测声源角度和所述样本声源角度,确定第二损失值,基于所述第二损失值,训练所述角度确定模型。
[0027]在一种可能的实现方式中,所述基于每个所述样本拾音方向对应的样本语音特征,确定每个所述样本拾音方向对应的样本概率,包括:
[0028]对于每个所述样本拾音方向,基于所述样本拾音方向对应的样本语音特征,调用概率确定模型,确定所述样本拾音方向对应的样本概率,所述概率确定模型用于确定任一语音特征对应的拾音方向为声源方向的概率;
[0029]所述基于所述第二损失值,训练所述角度确定模型,包括:
[0030]基于所述第二损失值,训练所述角度确定模型和所述概率确定模型。
[0031]在一种可能的实现方式中,所述方法还包括:
[0032]获取所述至少两个样本拾音方向对应的声源标签,所述声源标签表示所述样本拾音方向是否为声源方向;
[0033]所述基于每个所述样本拾音方向对应的样本语音特征,确定每个所述样本拾音方向对应的样本概率,包括:
[0034]对于每个所述样本拾音方向,基于所述样本拾音方向对应的样本语音特征,调用概率确定模型,确定所述样本拾音方向对应的样本概率,基于所述样本概率和所述声源标签,确定第三损失值,所述概率确定模型用于确定任一语音特征对应的拾音方向为声源方向的概率;
[0035]所述基于所述第二损失值,训练所述角度确定模型,包括:
[0036]基于所述第二损失值和每个所述样本拾音方向对应的每个所述第三损失值,训练
所述角度确定模型和所述概率确定模型。
[0037]在一种可能的实现方式中,所述对在每个所述拾音方向上的语音信号进行特征提取,得到每个所述拾音方向对应的语音特征,包括:
[0038]对于每个所述拾音方向,从在所述拾音方向上的语音信号中,截取所述唤醒词对应的语音片段;
[0039]对所述语音片段进行特征提取,得到所述拾音方向对应的语音特征。
[0040]根据本申请实施例的另一方面,提供了一种声源方向确定装置,所述装置包括:
[0041]匹配度确定模块,用于基于所采集的目标语音信号在至少两个拾音方向上的语音信号,确定所述至少两个拾音方向对应的匹配度,所述匹配度是在所述拾音方向上的语音信号与唤醒词之间的匹配度;
[0042]第一方向确定模块,用于基于所述目标语音信号,确定参考声源方向;
[0043]归一化模块,用于对所述参考声源方向对应的参考声源角度进行归一化处理;
[0044]特征提取模块,用于对在每个所述拾音方向上的语音信号进行特征提取,得到每个所述拾音方向对应的语音特征;
[0045]概率确定模块,用于基于每个所述拾音方向对应的语音特征,确定每个所述拾音方向对应的概率,所述概率表示所述拾音方向为声源方向的可能性;
[0046]第二方向确定模块,用于基于所述目标语音信号的声源参数,确定目标声源方向,所述声源参数包括归一化后的所述参考声源角度以及所述至少两个拾音方向本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声源方向确定方法,其特征在于,所述方法包括:基于所采集的目标语音信号在至少两个拾音方向上的语音信号,确定所述至少两个拾音方向对应的匹配度,所述匹配度是在所述拾音方向上的语音信号与唤醒词之间的匹配度;基于所述目标语音信号,确定参考声源方向;对所述参考声源方向对应的参考声源角度进行归一化处理;对在每个所述拾音方向上的语音信号进行特征提取,得到每个所述拾音方向对应的语音特征;基于每个所述拾音方向对应的语音特征,确定每个所述拾音方向对应的概率,所述概率表示所述拾音方向为声源方向的可能性;基于所述目标语音信号的声源参数,确定目标声源方向,所述声源参数包括归一化后的所述参考声源角度以及所述至少两个拾音方向对应的匹配度和概率。2.根据权利要求1所述的方法,其特征在于,所述基于每个所述拾音方向对应的语音特征,确定每个所述拾音方向对应的概率,包括:基于每个所述拾音方向对应的语音特征,调用概率确定模型,确定每个所述拾音方向对应的概率,所述概率确定模型用于确定任一语音特征对应的拾音方向为声源方向的概率。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取至少两个样本拾音方向对应的样本语音特征和声源标签,所述样本语音特征基于在所述样本拾音方向上的样本语音信号确定,所述声源标签表示所述样本拾音方向是否为声源方向;对于每个所述样本拾音方向,基于所述样本拾音方向对应的样本语音特征,调用所述概率确定模型,确定所述样本拾音方向对应的预测概率,基于所述预测概率和所述声源标签,确定第一损失值;基于每个所述样本拾音方向对应的每个所述第一损失值,训练所述概率确定模型。4.根据权利要求1所述的方法,其特征在于,所述基于所述目标语音信号的声源参数,确定目标声源方向,包括:基于所述目标语音信号的声源参数,调用角度确定模型,确定目标声源角度,所述角度确定模型用于基于任一语音信号的声源参数确定所述语音信号对应的声源角度;将所述目标声源角度指示的方向确定为所述目标声源方向。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:获取样本声源方向对应的样本声源角度、样本参考声源方向对应的样本参考声源角度以及至少两个样本拾音方向对应的样本匹配度,所述样本匹配度为在所述样本拾音方向上的样本语音信号与所述唤醒词之间的匹配度;对所述样本参考声源角度进行归一化处理;基于每个所述样本拾音方向对应的样本语音特征,确定每个所述样本拾音方向对应的样本概率,所述样本概率表示所述样本拾音方向为声源方向的可能性,所述样本语音特征基于在所述样本拾音方向上的样本语音信号确定;基于归一化后的所述样本参考声源角度以及所述至少两个样本拾音方向对应的样本
匹配度和样本概率,调用所述角度确定模型,确定预测声源角度;基于所述预测声源角度和所述样本声源角度,确定第二损失值,基于所述第二损失值,训练所述角度确定模型。6.根据权利要求5所述的方法,其特征在于,所述基于每个所述样本拾音方向...

【专利技术属性】
技术研发人员:吴俊李良斌陈孝良
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1