声源距离排序方法及相关产品技术

技术编号:34971409 阅读:19 留言:0更新日期:2022-09-21 14:11
本申请实施例提供一种声源距离排序方法及相关产品,该声源距离排序方法包括:获取n个设备在同一时间段内分别采集的n条语音信号;对n条语音信号进行语音特征提取,得到n条语音信号对应的n条语音特征;将n条语音特征输入声源距离排序模型,通过声源距离排序模型计算n条语音信号的距离得分,根据n条语音信号的距离得分确定n个设备的声源距离排序关系,声源距离排序关系用于为唤醒服务提供参考。本申请实施例可以准确实现唤醒服务。实施例可以准确实现唤醒服务。实施例可以准确实现唤醒服务。

【技术实现步骤摘要】
声源距离排序方法及相关产品


[0001]本申请涉及音频处理
,具体涉及一种声源距离排序方法及相关产品。

技术介绍

[0002]随着人工智能技术的发展,人机语音交互已成为产品化程度最高、服务人群最广的领域之一,涌现出许多语音助手或聊天机器人,比如苹果的Siri,微软的小冰等。然而,在同一空间中,用户可能拥有多台支持相同唤醒词的语音交互设备,若此时用户发起唤醒指令,多台设备可能同时应答,相互干扰,这会给用户带来困扰和不便,影响使用体验。
[0003]为此,许多终端厂商或者科技公司提出了“就近唤醒”技术,其实现原理是基于能量或者信噪比来选择距离声源(发声用户)最近的设备进行唤醒响应。然而,目前的方案只能反映出距离声源的最近的设备,如果距离声源最近的设备无法被唤醒,则无法实现唤醒服务。

技术实现思路

[0004]本申请实施例提供一种声源距离排序方法及相关产品,可以准确实现唤醒服务。
[0005]本申请实施例的第一方面提供了一种声源距离排序方法,包括:
[0006]获取n个设备在同一时间段内分别采集的n条语音信号,n为大于或等于2的整数;
[0007]对所述n条语音信号进行语音特征提取,得到所述n条语音信号对应的n条语音特征;
[0008]将所述n条语音特征输入声源距离排序模型,通过所述声源距离排序模型计算所述n条语音信号的距离得分,根据所述n条语音信号的距离得分确定所述n个设备的声源距离排序关系,所述声源距离排序关系用于为唤醒服务提供参考。
[0009]本申请实施例的第二方面提供了一种设备唤醒系统,包括仲裁端以及与所述仲裁端通信连接的n个设备,所述n个设备开启语音唤醒功能,n为大于或等于2的整数,其中:
[0010]所述仲裁端,用于接收所述n个设备在同一时间段内分别采集的n条语音信号,对所述n条语音信号进行语音特征提取,得到所述n条语音信号对应的n条语音特征;或者用于接收所述n个设备在同一时间段内分别采集的n条语音信号对应的n条语音特征;
[0011]所述仲裁端,还用于将所述n条语音特征输入声源距离排序模型,通过所述声源距离排序模型计算所述n条语音信号的距离得分,根据所述n条语音信号的距离得分确定所述n个设备的声源距离排序关系;
[0012]所述仲裁端,还用于根据所述n个设备的声源距离排序关系确定所述n个设备中的待唤醒设备,向所述待唤醒设备发送唤醒指令,以唤醒所述待唤醒设备。
[0013]本申请实施例的第三方面提供了一种声源距离排序装置,包括:
[0014]获取单元,用于获取n个设备在同一时间段内分别采集的n条语音信号,n为大于或等于2的整数;
[0015]特征提取单元,用于对所述n条语音信号进行语音特征提取,得到所述n条语音信
号对应的n条语音特征;
[0016]排序单元,用于将所述n条语音特征输入声源距离排序模型,通过所述声源距离排序模型计算所述n条语音信号的距离得分,根据所述n条语音信号的距离得分确定所述n个设备的声源距离排序关系,所述声源距离排序关系用于为唤醒服务提供参考。
[0017]本申请实施例的第四方面提供了一种终端设备,包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如本申请实施例第一方面中的步骤指令。
[0018]本申请实施例的第五方面提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
[0019]本申请实施例的第六方面提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
[0020]本申请实施例的声源距离排序方法包括如下步骤:获取n个设备在同一时间段内分别采集的n条语音信号,n为大于或等于2的整数;对所述n条语音信号进行语音特征提取,得到所述n条语音信号对应的n条语音特征;将所述n条语音特征输入声源距离排序模型,通过所述声源距离排序模型计算所述n条语音信号的距离得分,根据所述n条语音信号的距离得分确定所述n个设备的声源距离排序关系,所述声源距离排序关系用于为唤醒服务提供参考。本申请实施例的声源距离排序方法,可以通过声源距离排序模型对n个设备的声源距离进行排序,得到n个设备的声源距离排序关系,由于声源距离排序关系反映了n个设备距离声源的远近关系,可以为满足各种唤醒服务需求,为各种唤醒服务提供精准的参考,准确实现唤醒服务。
附图说明
[0021]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0022]图1是本申请实施例提供的一种多设备场景的结构示意图;
[0023]图2是本申请实施例提供的一种设备唤醒系统的结构示意图;
[0024]图3是本申请实施例提供的一种声源距离排序方法的流程示意图;
[0025]图4是本申请实施例提供的一种声源距离排序模型的训练方法的流程示意图;
[0026]图5是本申请实施例提供的一种多设备唤醒方法的流程示意图;
[0027]图6是本申请实施例提供的一种声源距离排序装置的结构示意图;
[0028]图7是本申请实施例提供的一种终端设备的结构示意图。
具体实施方式
[0029]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完
整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0030]本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
[0031]在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。
[0032]本申请实施例所涉及到的终端设备可以包括各种具有无线本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声源距离排序方法,其特征在于,包括:获取n个设备在同一时间段内分别采集的n条语音信号,n为大于或等于2的整数;对所述n条语音信号进行语音特征提取,得到所述n条语音信号对应的n条语音特征;将所述n条语音特征输入声源距离排序模型,通过所述声源距离排序模型计算所述n条语音信号的距离得分,根据所述n条语音信号的距离得分确定所述n个设备的声源距离排序关系,所述声源距离排序关系用于为唤醒服务提供参考。2.根据权利要求1所述的方法,其特征在于,所述通过所述声源距离排序模型计算所述n条语音信号的距离得分,包括:通过如下公式计算所述n条语音信号的距离得分:s
i
=f(x
i
;w),i∈[1,n];其中,s
i
表示所述n条语音信号中第i条语音信号的距离得分,f(x;w)表示打分函数,x
i
表示所述n条语音信号中第i条语音信号对应的语音特征,w表示所述声源距离排序模型的模型参数。3.根据权利要求1所述的方法,其特征在于,所述根据所述n条语音信号的距离得分确定所述n个设备的声源距离排序关系之后,所述方法还包括:根据所述n个设备的声源距离排序关系执行唤醒服务。4.根据权利要求1所述的方法,其特征在于,所述将所述n条语音特征输入声源距离排序模型之前,所述方法还包括:获取语音训练数据集,所述训练数据集包括k组训练语音样本,每组训练语音样本包括所述n个设备在同一时间段从同一声源采集到的n条训练语音信号对应的n条训练语音特征以及所述n个设备与所述同一声源的n个距离标签,k为正整数;将所述n条训练语音特征两两组合形成m条语音特征对,将所述n个距离标签两两组合形成m条距离标签对,所述m条语音特征对与所述m条距离标签对一一对应,形成m条训练样本,每条训练样本包含一条语音特征对以及对应的一条距离标签对;将第一训练样本输入声源距离排序模型,得到第一语音特征的训练距离得分和第二语音特征的训练距离得分,所述第一训练样本是所述m条训练样本中的任一条,所述第一语音特征和所述第二语音特征是所述第一训练样本包含的一条语音特征对;根据所述第一语音特征的训练距离得分和所述第二语音特征的训练距离得分计算所述第一语音特征对应的设备与所述同一声源的距离小于所述第二语音特征对应的设备与所述同一声源的距离的预测概率;将所述第一训练样本包含的距离标签对映射到真实概率空间,得到第一训练样本的真实概率,根据所述预测概率和所述真实概率计算所述第一训练样本的训练损失;根据m条训练样本的训练损失计算一组训练语音样本的总训练损失,根据所述总训练损失对所述声源距离排序模型的模型参数进行更新;在满足训练终止条件时,确定所述声源距离排序模型为训练好的模型。5.根据权利要求4所述的方法,其特征在于,所述根据所述第一语音特征的训练距离得分和所述第二语音特征的训练距离得分计算所述第一语音特征对应的设备与所述同一声源的距离小于所述第二语音特征对应的设备与所述同一声源的距离的预测概率,包括:通过如下公式计算所述第一语音特征对应的设备与所述同一声源的距离小于所述第
二语音特征对应的设备与所述同一声源的距离的预测概率:其中,E
i

表示第i

个设备,E
...

【专利技术属性】
技术研发人员:江忠泽曾理张晓帆钟卫东王佩玲
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1