用于二维声源定位的无量化误差的位置编解码方法技术

技术编号:40636271 阅读:22 留言:0更新日期:2024-03-13 21:19
本申请的实施例涉及声源定位技术领域,公开了一种用于二维声源定位的无量化误差的位置编解码方法,该编码方法包括:将声源所在的空间划分为若干个网格;基于预设的分辨率,分别根据空间在x轴方向和y轴方向上的长度,将空间在x轴方向上和y轴方向上离散化为若干段,并根据声源的坐标,确定声源在x轴方向上的类别和在y轴方向上的类别;基于声源在x轴方向上的类别,使用无偏标签分布向量对声源进行x轴方向的位置编码,并基于声源在y轴方向上的类别,使用无偏标签分布向量对声源进行y轴方向的位置编码;基于和生成二维无偏标签分布矩阵ρ,完成对声源的位置编码,能够消除量化误差,大幅提升了声源定位的精度。

【技术实现步骤摘要】

本申请实施例涉及声源定位,特别涉及一种用于二维声源定位的无量化误差的位置编解码方法


技术介绍

1、声源定位技术是一种利用麦克风阵列接收到的多通道信号来估算声源位置的技术,声源定位技术可以作为许多应用场景的辅助技术,例如人机交互、无人机应用、语音分离和目标说话人提取等。声源定位技术可以通过分析多个麦克风接收到的信号,来确定声源在空间中的位置。

2、声源定位技术中的关键一步是位置编解码。业内常用的位置编解码方法是将房间划分为多个网格,将每个网格视为一个类别,并使用独热编码(one-hot)对网格进行标签编码。在这种方法中,包含声源的网格标记为1,而其他网格标记为0。在解码过程中,将具有最高概率的网格中心作为声源位置。然而,本申请的专利技术人发现,这种位置编码方法存在较大的量化误差,在解码过程中得到的声源坐标存在更大的误差。


技术实现思路

1、本申请实施例的目的在于提供一种用于二维声源定位的无量化误差的位置编解码方法,能够消除量化误差,大幅提升了声源定位的精度,即使在噪声和混响等恶劣条件下也有很好的定本文档来自技高网...

【技术保护点】

1.一种用于二维声源定位的无量化误差的位置编码方法,其特征在于,包括:

2.根据权利要求1所述的用于二维声源定位的无量化误差的位置编码方法,其特征在于,所述基于预设的分辨率,分别根据所述空间在x轴方向上的长度和在y轴方向上的长度,将所述空间在x轴方向上和y轴方向上离散化为若干个段,包括:

3.根据权利要求2所述的用于二维声源定位的无量化误差的位置编码方法,其特征在于,所述表示为{x0,x1,...,xi,...,xI},所述表示为{y0,y1,...,yj,...,yI},所述基于所述声源在x轴方向上的类别,使用无偏标签分布向量对所述声源进行x轴方向的位置编码,通...

【技术特征摘要】

1.一种用于二维声源定位的无量化误差的位置编码方法,其特征在于,包括:

2.根据权利要求1所述的用于二维声源定位的无量化误差的位置编码方法,其特征在于,所述基于预设的分辨率,分别根据所述空间在x轴方向上的长度和在y轴方向上的长度,将所述空间在x轴方向上和y轴方向上离散化为若干个段,包括:

3.根据权利要求2所述的用于二维声源定位的无量化误差的位置编码方法,其特征在于,所述表示为{x0,x1,...,xi,...,xi},所述表示为{y0,y1,...,yj,...,yi},所述基于所述声源在x轴方向上的类别,使用无偏标签分布向量对所述声源进行x轴方向的位置编码,通过以下公式实现:

4.根据权利要求3所述的用于二维声源定位的无量化误差的位置编码方法,其特征在于,所述基于所述和所述生成二维无偏标签分布矩阵ρ,包括:

5.一种用于二维声源定位的无量化误差的位置解码方法,其特征在于,包括:

6.根据权利要求5所述的用于二维声源定位的无量...

【专利技术属性】
技术研发人员:张晓雷冯林峰张辰
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1